在较高的工作负载期间, FCP 速度较慢并发生 SRAM 转储
适用场景
- ONTAP 9
- SAN
- Fibre Channel(光纤通道)(FC)
问题描述
- 服务器使用 FCP LUN 的用户报告速度缓慢
- 已计划作业或已计划工作负载正在环境中运行
- 大规模部署 30 多台主机, 10 多个存储节点
- qos volume latency show 表示网络的贡献最大 延迟
cluster::> qos statistics volume latency show -vserver vserver -volume volume Workload ID Latency Network Cluster Data Disk QoS Max QoS Min NVRAM Cloud FlexCache SM Sync VA --------------- ------ ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- -total- - 24.15ms 22.90ms 15.00us 751.00us 480.00us 0ms 0ms 3.00us 0ms 0ms 0ms 0ms VOLUME 2178 1101.45ms 1101.34ms 6.00us 68.00us 36.00us 0ms 0ms 2.00us 0ms 0ms 0ms 0ms -total- - 21.09ms 19.98ms 11.00us 719.00us 375.00us 0ms 0ms 2.00us 0ms 0ms 0ms 0ms VOLUME 2178 995.61ms 995.50ms 6.00us 49.00us 50.00us 0ms 0ms 1.00us 0ms 0ms 0ms 0ms -total- - 26.80ms 25.16ms 12.00us 1206.00us 423.00us 0ms 0ms 3.00us 0ms 0ms 0ms 0ms VOLUME 2178 1107.57ms 1107.45ms 4.00us 69.00us 45.00us 0ms 0ms 2.00us 0ms 0ms 0ms 0ms -total- - 22.77ms 21.48ms 13.00us 893.00us 376.00us 0ms 0ms 3.00us 0ms 0ms 0ms 0ms VOLUME 2178 1486.07ms 1485.96ms 6.00us 58.00us 51.00us 0ms 0ms 1.00us 0ms 0ms 0ms 0ms -total- - 27.85ms 26.33ms 19.00us 1199.00us 299.00us 0ms 0ms 3.00us 0ms 0ms 0ms 0ms VOLUME 2178 1439.01ms 1438.94ms 3.00us 52.00us 9.00us 0ms 0ms 2.00us 0ms 0ms 0ms 0ms
- 多个存储节点上的多个卷会受到影响,而不会出现任何模式
- 多个存储节点间歇性记录 SRAM 转储,端口重置,达到阈值和 / 或链路中断错误
Sun Feb 21 XX:XX:XX -0500 [NODE: fct_tpd_thread_15: scsitarget.fcp.dump:debug]: FCP target SRAM dump generated for adapter 10a, fct_tpd_check_hung_commands: Command termination hung. cmd:0xfffff817e09cdb70 (state=0xa, flags=0x2,ctio_sent=1/1, RecvExAddr=0x11e620, OX_ID=0x4439, RX_ID=0xffff, SID=0x2729e2)
Sun Feb 21 XX:XX:XX -0500 [NODE: fct_tpd_thread_15: scsitarget.fct.reset:notice]: Resetting Fibre Channel target adapter 10a.
Sun Feb 21 XX:XX:XX -0500 [NODE: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO TPD cmd alloc threshold reached handle:7 taskflags:128 Active commands:3891 threshold:3891
Sun Feb 21 XX:XX:XX -0500 [NODE: fct_tpd_work_thread_0: scsitarget.ispfct.linkBreak:error]: Link break detected on Fibre Channel target adapter 2a. Firmware status code status1 0x2, status2 0x7, and status4 0x0.
- 客户端已使用轮循策略和正确配置 MPIO 所有优化的 IO 路径均处于活动状态(每个网络结构两个路径)
- 低端口会丢弃交换机和 SFP 的增量 接收 / 传输未达到低阈值