联想 E 系列存储上的机箱更换后,两个控制器都停机
适用于
- 联想 E 系列存储系统(OEM)
问题
更换机箱后,联想 E 系列存储系统中的两个控制器都无法运行,导致整个系统宕机,数据无法访问。观察到以下症状和日志输出:
- Controller A:锁定在主板不匹配锁定状态,7 段代码 OEL0,表示 VPD/EEPROM 损坏且无法验证硬件。
- Controller B:无响应,7 段代码 E8,表示 DIMM 插槽 3 上的 ECC 错误。
- 串行日志显示多次无法建立控制器间通信、持续的硬件锁定和 SAS 扩展器/驱动器错误。
- 示例日志输出:
3/16/26-09:36:30 (tRAID): WARN: UWManager::initializeNvsramIWLog: foreign controller03/16/26-09:36:30 (tRAID): WARN: UWManager::initializeNvsramIWLog: IWLog invalidated03/16/26-09:36:30 (tRAID): NOTE: UWMgr findIWLogs: Found IW log drive. Devnum 0x010000 tray=99 slot=1 ssd=1 qos=0 controller=local03/16/26-09:36:30 (tRAID): NOTE: UWMgr findIWLogs: Found IW log drive. Devnum 0x010001 tray=99 slot=2 ssd=1 qos=0 controller=local03/16/26-09:36:32 (tRAID): ERROR: UWMgr: No DSM Region found for Drive 0x01000903/16/26-09:36:32 (tRAID): ERROR: UWMgr: No DSM Region found for Drive 0x01000e