仅连接到节点的控制台缆线可能会发出发生原因运行状况警报、阻止SP访问并阻止故障转移
适用场景
- AFF型号
- ASA型号
- FAS型号
- ONTAP 9
- 控制台连接
问题描述
可以观察到以下症状:
- 无法使用任何帐户通过SSH连接到SP或BMC (无响应)
- 可能会报告各种错误的运行状况警报、这些警报可能会导致硬件故障假设:
- 风扇故障
- 高温/低温警告
- 各种"传感器无法读取"消息
- 电池故障等
Record 2508: Mon Apr 24 11:01:20 2023 [SP.notice]: SP load is high: 5.22 4.10 2.12 Record 2513: Mon Apr 24 11:03:16 2023 [IPMI.emergency]: triggered OS halt: Multiple fans failed
- 通过SSH的控制台输出非常慢("laggy")或无响应
- 接管或Givback失败
注: 此问题描述最有可能发生在串行控制台端口以115200波特率运行的较新系统上
示例:
Log Collection from: SERIALNUM=xxxxxxxxxxx SEQ=31 HOSTNAME=node01-1
================ Log #1 start time Thu Jan 1 00:00:56 1970
================ Log #1 truncated at Wed Apr 29 09:06:18 2020 ?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
??????????????????????????????????????????????????????????????!
????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
================ Log #1 end time Wed Apr 29 09:06:35 2020
在Active IQ信息板中使用AutoSupport日志进行验证:
- 查看 SP-latest-console-logs 文件以查找上面显示的垃圾字符
- 查看 SP-latest-Runtime 文件:
- 在
"top"
该小节中、找到 gty 进程(将是 ngetty 或agetty 、具体取决于ONTAP版本)、并查找串行端口活动迹象和可能的串行端口过载情况(如高CPU%所示):
- 在
PID PPID USER STAT VSZ %VSZ CPU %CPU COMMAND
993 1 root D 6304 2.2% 0 22.4% /sbin/ngetty 115200 parallel
2408 1 sysadmin S 1912 2.5 0 23.7% /sbin/agetty --nohostname -L console 115200 vt100
注意: 在某些ONTAP版本中、Getty可能并不总是列在Top下
- 在
"top"
或"uptime"
小节中,查看的值"load average"
。
Load average: 5.22 4.10 2.12 13/218 26338 02:10:24 up 76 days, 5:07, 0 users, load average: 5.22, 4.10, 2.12
- 上面突出显示的三个值分别表示SP在过去1分钟、5分钟和15分钟内的平均负载。