通过多个连接到节点 LIF 时的高 NFS 延迟 通用客户端 TCP 插槽
适用场景
- ONTAP 9.5
- ONTAP 9.6
- P7 之前的 ONTAP 9.7
问题描述
- 其他 NFS 操作工作负载在 Active IQ Unified Manager 中显示极高的延迟( >100 毫秒)。
- 上的延迟细分显示网络处理或 CPU_Network 上的高延迟。( CPU 网络延迟对工作负载造成的延迟)
- 没有证据表明存在任何 CPU 争用或 CPU 利用率较高的情况。
- 一个或多个客户端使用相同的源 TCP 插槽(源地址和端口)同时将多个 NFS ( v3/v4 )挂载到同一节点上的不同接口( LIF )。
- 如果从同一源插槽多次连接到同一 LIF 上的不同端口,则可能会出现同样的问题。
- LIF 可以位于同一 SVM 或不同 SVM 上,但驻留在同一节点上。
cluster::*> system node run -node node_1 -command netstat -na
---- Default IPSpace ----
Active Internet connections (including servers)
Proto Recv-Q Send-Q Local Address Foreign Address (state) VCTX Services
tcp4 0 0 10.8.24.135.2049 10.8.24.82.1023 ESTABLISHED 13 0x00000804
tcp4 0 0 10.8.24.129.2049 10.8.24.82.1023 ESTABLISHED 12 0x00000804
tcp4 0 0 10.8.24.123.4045 10.8.26.8.1023 ESTABLISHED 11 0x00000804
tcp4 0 0 10.8.24.123.2049 10.8.26.8.1023 ESTABLISHED 11 0x00000804
- NFS 客户端可能无法对受影响的挂载( cd , ls 等)执行任何操作,并收到错误:
file temporarily unavailable on the server, retrying...
- NetApp Active IQ 可能会通知风险ID 5637:
- 风险:使用同一临时端口从同一客户端到单个节点上单个IP空间中的多个LIF进行多个NFS连接可能会导致该客户端的NFS速度慢/挂起。
- 潜在影响:此配置中的客户端可能会遇到NFS速度缓慢和/或挂起的问题。