panic :更换 NIC 后, AFF A400 上的 CPUx 出现不可更正的计算机检查错误
适用场景
- AFF A400
- 不可更正的机器检查错误
问题描述
在更换 PCI分析工具调用的插槽3中的NIC后、此节点将出现新的Unrecorcedic Machine Check Error
- 已更换两次网卡、但仍无法解决问题描述问题
- 第一个崩溃调用、该工具调用了插槽3:
Uncorrectable Machine Check Error at CPU18. SKL_IIO Error: STATUS<0xbb80000000000e0b>(VALID,UC,EN,MISCV,PCC,S,AR,CORR_ERR_STATUS(0),CORR_ERR_CNT(0),MSCOD(0),MCACOD(0xe0b))MISC<0x00000000ae000000>(UCR_BUS_LOG(174),UCR_DEVICE_LOG(0),UCR_FUNCTION_LOG(0), UCR_SEGMENT_LOG(0))I
在插槽3中更换NIC后发生崩溃:
Uncorrectable Machine Check Error at CPU10. SKL_IIO Error: STATUS <0xbb80000000000e0b>(VALID,UC,EN,MISCV,PCC,S,AR,CORR_ERR_STATUS(0),CORR_ERR_CNT(0),MSCOD(0),MCACOD(0xe0b))MISC<0x00000000ae000000> (UCR_BUS_LOG(174),UCR_DEVICE_LOG(0),UCR_FUNCTION_LOG(0),UCR_SEGMENT_LOG(0))IIO Machine Check from device(s):RPT(174,0,0):ErrSrcID (CorrSrc(0),UCorrSrc(0xb080)), PLX PCIE 8796 switch on Controller, Br[8796](176,16,0): Link down.