根端口0、1、0出现PCI错误NMI崩溃、FAS8200上的UCorrErr (ECRC)
适用场景
- FAS 8200
- AFF A300
- ONTAP 9
问题描述
- 节点发生故障、根端口0、1、0上出现PCI错误NMI:
PANIC: PCI Error NMI from device(s):ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), RPT(0,1,0): in process idle: cpu11
- 在崩溃字符串之前、可能还会出现以下其他错误:
0x000000cc539579ed: Add bad root port 0/1/0 (1)
0x000000cc53ea7f3a: 0/1/0 ucerr_status 0x80000
0x000000cc53ea8423: Recovery process terminated PANIC : PCI Error NMI from device(s):ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), RPT(0,1,0):
- SSRAM/pelogs显示不可更正的错误是由端到端CRC (ECRC)引起的:
RZR,1_0.IIO0: GNERR<0x00000040>(P1A), GNFERR<0x00000040>(P1A); RPT(0,1,0): GLB<0x00000002>(NFERR), PTR<0x1>, Status(SigSysErr), DevStatus(NFatal), RootErr(UCor,NFatal), ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), UCorrErr(ECRC), FirstUCorrErr(ECRC), TLPType(4MWrRq)
- 所有启动尝试都将失败、并出现相同的崩溃。