CONTAP-484943:一些针对 qtree 的 NFS 操作在 9.16.1 上花费 5 分钟
问题描述
- 运行或升级到 9.16.1 后,偶尔针对 qtree 的 NFS 操作需要 5 分钟才能得到响应
- 默认超时时间为 600(60 秒)和默认重传次数为 2 的 Linux 客户端可能会在 3 分钟后看到 NFS 服务器未响应错误消息,然后在 2 分钟后显示 NFS 服务器正常。
- 需要更快响应时间的应用程序(如 IBM MQ)可能会受到影响
- 要在 ONTAP 端识别,
- 首先检查每小时的 EMS 消息,指示超过 60 秒的任何 NFS 操作次数:
Nblade.NfsResponseTraceTriggerHourly:debug]: params: \{'responseCount': '14', 'trigger': '60'} - 如果记录的 OPS 时间 > 60 秒,则启用 NFS 服务器跟踪:
set diag; nfs server modify -vserver * -trace-enabled true - 查找显示 NFS 处理时间(procTime)接近 300 秒的 ems 事件:
Nblade.NfsResponseTraceTrigger:debug]: params:\{'clientAddr': '10.1.1.2', 'op': 'NFSv4 COMPOUND', 'vserverId': '#', 'procTime': '297', 'trigger': '60'}
注:
- 要暴露于此问题,系统必须运行 ONTAP 9.16.1(没有部署此问题的修复或解决方法),并且必须使用 NFS 上的 qtree 导出。
- 由于这些系统允许的并发性增加,因此在 CPU 计数较高的高端系统上更可能出现此问题。