跳转到主内容
If you missed the pre-registration for NetApp MS Azure AD B2C Go Live, when you log in, the new login prompt will offer the option to register. Please note that access to your NetApp data may take up to 1 hour. Need assistance? Complete this form and select “Registration Issue” as the Feedback Category. 

存储系统和磁盘架温度阈值意味着什么?

Views:
1
Visibility:
Public
Votes:
0
Category:
fas-systems
Specialty:
hw
Last Updated:

适用场景

  • 所有 FAS 系统
  • 所有 AFF 系统
  • 环境检查

问题解答

可以使用环境命令显示有关存储系统和存储架环境的信息。在此显示中,显示了许多值。显示屏顶部将显示:

PSU Status ok
Temperature ok
Voltage ok
System Fan Fru 1 ok
System Fan Fru 2 ok
PSU 1 Fan ok
PSU 2 Fan ok
NVRAM5-temperature-3 ok
NVRAM5-battery-3 ok.

当此显示显示“ OK ”状态时、可以使用以下命令获取更多信息:

Data ONTAP 8 7-模式

> environment chassis list-sensors temperature

ONTAP 集群模式:

::> system node run -node <node name> -command environment chassis list-sensors

::> system node environment sensors show 

这将列出存储系统机箱中的所有温度传感器。

示例:

Temp_Unit_A, temperature, lm81_first, 0, normal, mon: Temperature, 27C, -1C, -1C, 48C, 50C

这表明此传感器正常。该传感器的当前读数为 27 ° C

低严重和低警告为 -1c 、高警告为 48c 、高严重警告为 50c

当达到警告级别时,将生成 AutoSupport 、如果达到关键级别,则存储系统将关闭。这将立即关闭和关闭存储系统。

可能会丢失未被 NVRAM 确认的客户机飞行中数据、与阵列的断电情形类似。这是为了防止损坏系统。

对于安装在系统上的每个磁盘架,将显示类似以下内容的信息:

        Temperature Sensor installed element list: 1, 2, 3; with error: none
        Shelf temperatures by element:
         [1] 38 C (100 F) (ambient) Normal temperature range
         [2] 45 C (113 F) Normal temperature range
         [3] 44 C (111 F) Normal temperature range
        Temperature thresholds by element:
         [1] High critical: 50 C (122 F); high warning 40 C (104 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [2] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [3] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)

每个磁盘架都有三个传感器。传感器 1 位于机架中、传感器 2 位于 A 模块中、传感器 3 位于 B 模块中。

这表明传感器 1 、 2 和 3 已安装且没有传感器显示错误情况。如果有错误,则会列出传感器的编号:

Temperature Sensor installed element list: 1, 2, 3; with error: 2

这将表明 A 模块温度传感器有某种故障。要确定确切的问题、必须分析显示屏的其余部分。

输出的这一部分显示了每个元件的当前温度以及该温度是否在正常范围内。

        Shelf temperatures by element:
         [1] 38 C (100 F) (ambient) Normal temperature range
         [2] 45 C (113 F) Normal temperature range
         [3] 44 C (111 F) Normal temperature range


显示屏的这一部分显示发生某些操作的阈值:

        Temperature thresholds by element:
         [1] High critical: 50 C (122 F); high warning 40 C (104 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [2] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [3] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)

如果达到警告阈值、则会生成警告 AutoSupport 、如果达到磁盘架上的严重阈值、它将不会关闭。 .  机架传感器的行为与机箱传感器不同。 

  • 当传感器出现问题时,托架不会断电
  • 机架上的传感器问题永远不会导致存储系统关闭

存储系统机箱和每个机架中的阈值已设置且不能更改。如果传感器未报告、则需要检查固件版本。如果固件为最新版本、则需要关闭电源再打开或更换带有故障传感器的设备。这可能是主板、电源、机架或 ESH 或扩展模块。