RHEL 7.9主机在Lustre文件系统上出现I/O延迟
- Views:
- 11
- Visibility:
- Public
- Votes:
- 0
- Category:
- e-series-systems
- Specialty:
- esg<a>2009047183</a>
- Last Updated:
适用场景
- RHEL 7.9
- 集群
- 核心同步
- 起搏器
- E5700
- SANtricity OS 11.70.1R1、11.70.2
问题描述
RedHat Enterprise Linux 7.9主机遇到Luster文件系统上超过120秒的I/O延迟、导致paker/Corosync触发NMI (非屏蔽中断)。
主机
Recovered Error
在 messages or
syslog
主机日志文件中显示大量重复:1653449345 2022 May 25 03:29:05 hostname kern info kernel [ 5080.869325] sd 0:0:0:3: [sdc] tag#11 Sense Key : Recovered Error [current]
1653449345 2022 May 25 03:29:05 hostname kern info kernel [ 5080.869327] sd 0:0:0:3: [sdc] tag#11 Add. Sense: Select or reselect failure