PPR 内存测试通过,但 LED 故障指示灯仍然亮起 开启
适用场景
- AFF 系统
- AFF A700
- AFF A700
- AFF A800
- AFF A900
- AFF A400
- FAS 系统
- FAS8300
- FAS8700
- FAS9000
- 启用软件包修复后(PPR)
问题描述
由于出现不可更正的DIMM错误、节点发生故障:
PANIC: ECC error at DIMM-14: 2C-0F-1651-150A2A63,ADDR 0x7d28fefd80,(Node(0), Memory controller(0), CH(1), DIMM(0), Rank(1), Bank Group(2), Bank(0x0), in process vifmgr on release 9.7P8 (C) on Thu Dec 31 06:50:11 PST 2020 version: 9.7P8:
- 在启动期间,PPR对DIMM进行了测试,并且DIMM通过了 BIOS更新程序对内存可靠性和PPR功能的测试。
- 但是、在启动时、ONTAP会使DIMM的故障LED保持亮起状态。
验证LED
注意: 对于混合型号的集群、建议使用-node参数分别为每个节点运行命令。
::> system controller service-event show
Node ID Event Location Event Description
---------------- --- ---------------------------------- ---------------------
plata4-1a 1 DIMM in slot 1 on Controller A Uncorrectable ECC