各种 ONTAP 平台上的故障 LED 故障排除程序
适用于
- AFF 系统
- FAS 系统
- ONTAP 9
- 集群模式 Data ONTAP 8
- Data ONTAP 8 7-模式
问题描述
简介
现代 FAS 系统包括许多战略性布置的琥珀色故障 LED,以帮助操作员识别需要注意的现场可更换单元(FRU)。
大多数 FRU 都包含在另一个 FRU 中。例如:
- 控制器、IOXM、电源、风扇和磁盘驱动器 FRU 包含在机箱 FRU 中
- PCI 卡 FRU 包含在控制器和 IOXM FRU 中
- DIMM 和引导设备 FRU 包含在控制器 FRU 中
当 FRU 需要操作员注意时,其相应的 FRU 故障 LED 将亮起。如果该 FRU 位于另一个 FRU 内部,则外部 FRU 的故障 LED 也将亮起。照亮每个 FRU 的外部 FRU 故障 LED 的过程重复进行,直到到达最外部的 FRU;导致琥珀色故障 LED 的路径,可以跟随该路径找到需要注意的最内部的 FRU。
虽然并非所有产品都有所有类型的 FRU,但所有基于 ONTAP 的产品的 FRU 层次结构都是相同的。从最外层的 FRU 开始,层次结构如下所示:
Chassis
\
+- Power Supply
+- Fan
+- Disk Drive
+- Controller
| \
| + PCI Card
| + DIMM
| + NV-DIMM
| + Boot Device
| + Coin Cell Battery
| + NVMEM Battery
+- IOXM (if present)
\
+ PCI Card
例如,如果控制器中的 DIMM 需要注意,其故障 LED 将与控制器的故障 LED 和机箱故障 LED 一起亮起。
从系统外部看不到的 FRU 故障 LED 在包含的 FRU(通常为控制器或 IOXM)从机箱中卸下时仍然亮起。这使得需要注意的 FRU 易于定位。当前版本的 ONTAP 无法检测到 FRU 何时已得到维修,因此在更换有故障的 FRU 后不会关闭 FRU 故障 LED。因此,即使更换了从外部看不到的故障 FRU,故障 LED 的路径仍将保持亮起,直到 ONTAP 被明确命令关闭它们。通常,运行破坏性 halt -s
命令或无中断地运行(特权:诊断)命令 fru_led off all
可以关闭故障 LED。
当前版本的 ONTAP 不维护已发生故障的数据库。相反,当发生故障时,会记录一条通知消息,并点亮故障 LED 的层次结构,以创建通往故障 FRU 的 LED 路径。因此,确定故障的原因需要进行一些调查。
对于 2022 年 11 月之后购买的系统,控制器中"隐藏" FRU 的注意 LED 不再可用。请参阅:"不支持注意 LED"标签信息