CFBMC-3996:由于SP HBT在BMC 13.10P1上停止、节点重新启动
问题描述
- AFF A400、AFF C400、ASA A400、ASA C400、FAS8300或FAS8700节点因检测信号停止/缺失而意外重新启动
- 以下事件是此问题描述的一个示例:
[ND-01:spmgrd:ipmi.heartBeat.Stop:error]:在过去600秒内未从服务处理器(SP)收到SP检测信号。
[NDOE-01:spmgrd:CallHome.HBT.missed:note]:SP SPSP未接来电[NDOE-01:spmgrd:CallHome.HBT.stost.alg]:由于SP SP已停止而自动回电[NDOE-01:ENV_mgr: HBT.ipmi.Lost.shutdown
:emergency]:SP已停止
、无法恢复。为防止硬件损坏和数据丢失、系统将在10分钟内关闭。
[NDOE-01:ENV_Mgr:monitor.shutdown。emergency:emergency]:紧急关闭:环境原因关闭(系统重新启动以恢复BMC)
- IPMI_NOT_ERR消息出现在sktrace.log:
2024-03-10T01
:30:58Z 2180899785867098 [5:0] IPMI_KCS_ERR:
KCS_start_write:cmd 0x31 0x36状态3未写入NF-03-10T01
:30
:58Z
- 节点重新启动并恢复联机。