COCTP-169927:A800、C800系统上板载Chelso端口出现致命奇偶校验错误和链路关闭问题
问题描述
-在节点重新启动、重新启动或升级后,系统处于部分恢复状态,互连状态为:"RDMA互连已关闭"-存储故障转移状态为:"storage Failover Inter连
错误。NVRAM日志未同步。disk Inventory not reveed"
-Console logs show:e0a/e0b:致命奇偶校验错误(0x10)EMS日志
:[m5 007:58:09 [ne_name:netif
.falate.err:alert]:插槽0中的网络设备遇到致命错误e0a/e0b。
5月02日07:58:09 [nnode:netif.falter.err:alle]:插槽0中的网络设备遇到致命错误e0a/e0b。
5月02 22:49:05 [nODE_NAME:KERNETI.linkDown:info]:Ethernet e0a:LINK down、check cable.
5月02 22:49:05 [nODE_NAME:KERNETI.linkDown:info]:Ethernet e0b:LINK down、check cable.
5月02 22:49:05 [NODE_NAME:INTR:rlib.ifconfig.linkEvent:notice]:参数:{'ifname':'e0b'、'eventType':'own '}
5月02 22:49:05 -0800 [NODE_NAME:vifmgr:vifmgr.portdown:notice]:节点上收到链路关闭事件。
5月02 22:49:05 -0800 [none_name:nvmm_error:nvmm.mirr.offlined:Debug]:参数:{'mirr':'ha_Partner '}
5月02 22:49:05 -0800 [none_name:vfmgr: vfmgr.kLUS.linkdown:emergency ]:节点上的集群端口e0a意外关闭。
5月02 23:00 - 0800 [NODE_NAME:statd:ic.HAInterlinkDown:error]:HA互连:互连关闭10分钟:link0关闭5月02 23:00:00 - 0800 [NODE_NAME:statd:callHome.hainterline.down
:alg]:由于link0关闭、对HA互连关闭、请拨打主电话。]