CONTUP-170136:FAS8200和AFF A300系统可能会发生CPU无响应、然后发生多个看门狗控制器中断
问题描述
- FAS8200和AFF A300存储系统可能会发生CPU无响应、然后发生看门狗控制器中断。
例如:
看门狗 nmi 在 cpu 0 上,挂起 cpu 为 0,进程空闲:cpu0
记录 1108:2022 年 4 月 30 日星期六 05:01:38 [IPMI 事件.严重]:NMI
记录 1109:2022 年 4 月 30 日星期六 05:01:38 [IPMI.notice]: e800 | 02 | EVT: 6fc824ff | System_Watchdog | 断言事件,“计时器中断”
记录 1110:2022 年 4 月 30 日星期六 05:01:39 [IPMI 事件.严重]:L2 看门狗超时硬重置
记录 1111:2022 年 4 月 30 日星期六 05:01:39 [陷阱事件.严重]: hwassist l2_watchdog_reset (29)
记录 1112:2022 年 4 月 30 日星期六 05:01:45 [IPMI.notice]: e900 | 02 | EVT: 6fc104ff | System_Watchdog | 断言事件,“硬重置”
- 此L2 WDG是由x86 CPU核引起的、可能是由瞬时CPU问题描述引起的。