在 EMS 中出现 IO WQE 故障时、 FC LUN 的延迟较高
状态信息
适用场景
- ONTAP 9
- FCP
- Brocade 交换机
- Cisco 交换机
问题描述
- 通过FCP访问LUN的主机上的工作负载会产生大量应用程序和客户端延迟
- EMS日志中的IO wqe频繁出现故障。
示例:
Mon Feb 10 00:28:21 +03 [NODE01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:10a IO WQE failure, Handle 0x2, Type 8, S_ID: 20253, VPI: 18, OX_ID: 263, Status 0x3 Ext_Status 0x1d
- 无法访问AFF SAN上的Storage Virtual Machine数据LUN
- 在FC LUN上间歇性观察到高延迟
- Brocade交换机反复报告因信用丢失和特定端口上的C3 Tx丢弃或超时而导致链路重置
porterrshow
/fabos/cliexec/porterrshow:
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
0: 89.4m 139.8m 0 0 0 0 0 0 0 1.3k 0 0 0 0 0 1.3k 0 0 0
Fabriclog
为该特定端口记录输出链路重置事件下的Cisco交换机
Switch 0; Thu Jul 28 00:00:18 2022 GMT (GMT+0:00)
00:02:11.754993 SCN LR_PORT(0);g=0x266 LR_IN D2,P0 D2,P0 0 NA
00:02:26.934854 SCN LR_PORT(0);g=0x266 LR_OUT D2,P0 D2,P0 0 NA
00:02:39.918129 SCN Port Offline;rsn=0x4,g=0x268 D2,P0 D2,P0 0 NA
00:02:39.918135 *Removing all nodes from port D2,P0 D2,P0 0 NA
00:02:40.770569 SCN LR_PORT(0);g=0x268 D2,P0 D2,P0 0 NA
00:02:40.773044 SCN Port Online; g=0x268,isolated=0 D2,P0 D2,P1 0 NA
fcp adapter stats -node <node_name> -adapter 1a -instance
- 指示与存储相邻的任何协议层问题描述
network fcp adapter show
在ONTAP 命令行界面上显示低Tx功率:
Received Optical Power 570.7 (uWatts)
SPF Transmitted Optical Power 123.8 (uWatts)