ONTAP 外部的数据包丢失导致缓慢和延迟
适用于
- ONTAP 9
- 网络连接
- 性能
问题描述
- 通过多次重复确认(至少 #1、#2 和 #3)以及(快速)重传来识别丢包
示例:
- 应用程序运行缓慢,I/O 等待时间过长,性能出现问题或延迟较高
- 运行 Linux 命令 'Make RPM' 和 'CP' 时响应速度较慢值得注意的是,存储端不会出现高延迟
- 写入本地磁盘的速度比写入 NFSv3 共享快得多
- 吞吐量可能会降至零,然后恢复
- 如果丢包严重,连接可能会断开
- ONTAP 延迟较低,CPU 和磁盘利用率低于正常或预期
- 在 ONTAP 9.5 或更高版本中,丢包率可能会增加
示例:使用 netstat -anceWCT 命令增加 10.1.2.9 的 Rexmit 和 OOORcv 列
node 1: Proto Recv-Q Send-Q Rexmit OOORcv 0-win Local Address Foreign Address =-=-=-=-=-=Sat Aug 13 2022, 23:16:01 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 0 6198853 112463181 0 10.1.2.3.3260 10.1.2.9.47254 =-=-=-=-=-=Sat Aug 20 2022, 23:26:09 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 0 1304064 57461127 0 10.1.2.3.3260 10.1.2.9.21933 node 2: =-=-=-=-=-=Sat Aug 13 2022, 23:15:27 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 48 5768522 3592331 0 10.40.40.27.3260 10.1.2.9.43744 =-=-=-=-=-=Sat Aug 20 2022, 23:25:03 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 48 1366568 11947331 0 10.40.40.27.3260 10.1.2.9.43425
ifstat在数据 LIF 的端口上有 0 个错误event log show没有条目表明存在 CRC 或其他本地链路劣化- 丢包会导致 TCP 性能下降,从用户或应用程序端造成长达数秒的延迟