由于主机端 SFP 故障,在 NetApp 端报告了 STIO WQE 故障事件以及 AIX 主机上的磁盘操作错误
适用于
- ONTAP 9
- AIX 主机
问题描述
EMS登录 NetApp 存储报告 IO WQE 失败,Ext_Status 0x16 和Ext_Status 0x1d
[?] Fri Jun 14 17:14:24 +0530 [NETAPP-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:3a IO WQE failure, Handle 0x4, Type 8, S_ID: 682Exy, VPI: 3, OX_ID: 1EB, Status 0x3 Ext_Status 0x16
[?] Fri Jun 14 17:15:17 +0530 [NETAPP-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:3a IO WQE failure, Handle 0x4, Type 8, S_ID: 683Dxx, VPI: 3, OX_ID: 40E, Status 0x3 Ext_Status 0x1d
Ext_Status 0x16表示 Host initiator 已发送 ABORT 清除当前命令队列。这不一定能识别问题或根本原因,而是一种症状/副作用。Ext_Status 0x1d识别框架交付的顺序有误。DISK OPERATION ERROR在映射的 NetApp 磁盘的 AIX 主机上报告:-
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB479xy 0614171624 T H hdisk170 DISK OPERATION ERROR
F31FFAxx 0614171624 I H hdisk170 PATH HAS RECOVEREDRx 和 Tx 功率都在存储端的推荐范围内。
Rx- 543.1 (uWatts)
Tx- 630.5 (uWatts)
主机连接的交换机端口报告了低 Rx 功率,表明上游存在问题,即 电缆或终端设备 sfp。
=============Port 16:=============RX Power: -13.2 dBm (47.5 uW)TX Power: -3.3 dBm (465.4 uW)