CONTAP-484943:在 9.16+ 版本上,针对 qtree 的一些 NFS 操作需要 5 分钟
问题描述
- 运行或升级到 9.16+ 后,偶尔对 qtree 执行 NFS 操作需要 5 分钟才能得到响应
- 客户端的默认 timeo 为 600(60 秒),默认 retrans 为 2,通常会在 3 分钟后看到 NFS 服务器无响应错误消息,然后在 2 分钟后看到 NFS 服务器正常。
- IBM MQ 等需要更快响应时间的应用程序可能会受到影响
- 要在 ONTAP 端进行识别,请执行以下
- 首先检查每小时的 EMS 消息,指示任意数量的 NFS 操作耗时超过 60 秒:
Nblade.NfsResponseTraceTriggerHourly:debug]: 参数:\{'responseCount': '14', 'trigger': '60'} - 如果注意到 OPS 花费的时间超过 60 秒,请启用 nfs 服务器跟踪:
设置诊断;nfs 服务器修改 -vserver * -trace-enabled true - 查找显示 NFS 处理时间(protTime)接近 300 秒的 ems 事件:
Nblade.NfsResponseTraceTrigger:debug]:params:\{'clientAddr':'10.1.1.2','op':'NFSv4 COMPOUND','vserverId':'#','procTime':'297','trigger':'60'}
注:
- 要解决此问题,系统必须运行ONTAP 9.16.1(未部署针对此问题的修复程序或解决方法),并且必须使用通过 NFS 的非继承 qtree 导出。
- 由于 CPU 数量较多的高端系统允许更高的并发性,因此更容易出现此问题。