适配器卡发生混乱导致节点重新启动
适用场景
- ONTAP 9
问题描述
- 崩溃消息:
BOWIE,1_0.IIO0: GFERR<XXXX>(P1A), GFFERR<XXXX>(P1A); RPT(0,1,0): GLB<XXXX>(FERR), PTR<0x0>; Br[8725](1,0,0): RcvErr(P1(32)); Br[8725](2,1,0): Status(SigSysErr), DevStatus(Corr,Fatal), CorrErr(Rcvr), UCorrErr(LnkDn), FirstUCorrErr(LnkDn), TLPType(CfgRdRq),Hdr[0]<XXXX>(HdrLen(1),AddrType(0),Attr(0),Tc(0),Type(5),Fmt(0)), Hdr[1]<XXXX>(RqBusNum(0),RqDvNum(1),ReqFncNum(0),Tag(32),LstDwBe(0),1stDwBe(4)), Hdr[2]<XXXX>(BusNum(3),DvNum(1),FncNum(0),CfgAddr(0xc)), Hdr[3]((XXXX)), LinkStatus(LkSp(1),LkWd(0))
- 返回跟踪消息:
sk_save_stackframes:misc_set_stack_info:sk_cpuhog_report:sk_timeout_cpuhog_mycpu:statclock:cpu_idle:lapic_handle_timer:Xt
merint:gop_msg_chan_wait:gop_msg_recv_thread:fork_exit:fork_trampoline_sk
- 崩溃正在触发节点重新启动