设备状态为0xFFFF的X4014A磁盘的PCIe可更正错误事件
适用场景
- AFF A800、AFF A250
- 内部X4014A NVMe SSD
问题描述
- 在AFF A800或AFF A250系统
X4014S173A15TNTE
上、如果具有驱动器字符串的内部X4014A NVMe SSD磁盘处于闲置状态、则可能会在控制台和事件日志上定期生成一条PCIe可更正的错误事件消息。 - 此消息可能会在维护模式下显示、也可能会在ONTAP 运行时显示。
- 如果驱动器属于具有活动I/O的聚合、则最不可能发生这种情况
- 如果此驱动器是备用驱动器、则更有可能发生此问题。
以下是这些错误消息的示例:
在ONTAP 中:
Correctable IIO errors: IIO3: RPT(93,2,0): PCI Device 144d:a825 in slot 30 on Controller, Dv[a825](121,0,0) in slot 30: DevStaJul 11 17:46:02 [localhost:pcie.errors:notice]: PCI Express correctable error - IIO3: RPT(93,2,0): PCI Device 144d:a825 in slot 30 on Controller, Dv[a825](121,0,0) in slot 30: DevStatus(0xffff);
在启动期间在控制台上:
Jul 15 13:18:34 [node1:pcie.errors:notice]: PCI Express correctable error - IIO3: RPT(93,0,0): SecStatus(RcvMstAbt), BrCtrl((0x13)); IIO3: RPT(93,2,0): SecStatus(RcvMstAbt), BrCtrl((0x13)); IIO7: RPT(215,0,0): SecStatus(RcvMstAbt), BrCtrl((0x13)); IIO7: RPT(215,2,0): SecStatus(RcvMstAbt), BrCtrl((0x13));