存储节点报告错误Drive Failed xDrive (s) with State:NodeOffline
适用场景
- NetApp SolidFire 存储节点
- NetApp H系列存储节点
问题描述
以下NetApp存储节点之一可能会生成AutoSupport (ASUPP)案例报告: SFCOMM:SolidFire Alert from <cluster name>(Node Offline) Node Offline nodeID=x
事件日志中会显示以下错误代码:
- 错误代码: 驱动器有故障| 详细信息: XX个驱动器状态为"NodeOffline (节点脱机)"驱动器ID:XX
- 错误代码: unresponsisveService | 详细信息: 在每个分配的硬盘上报告块服务未响应。
- 错误代码: unresponsisveService | Details: 批量卷服务未响应。
- 错误代码: 驱动器可用 | 详细信息: 节点ID xx具有xx个可用驱动器。
- 错误代码: nodeOffline | Details: SolidFire应用程序无法与节点ID为xx的存储节点通信。
- 错误代码: liceServiceUnHealthy | Details: 元数据服务运行状况不正常、SolidFire正在尝试将数据迁移出该服务。
- 错误代码: blockServiceUnHealthy | Details: 在所有驱动器上报告块服务运行状况不正常、并且SolidFire正在尝试迁移数据。
- 节点在 不到(10)分钟的时间内从脱机状态恢复
- 这些驱动器 已临时标记为出现故障
注意:这种情况可能发生在单个节点或多个节点上。
注: 由于块服务已停止、集群主节点将驱动器标记为出现故障、因为它无法与这些驱动器进行通信。如果块服务未在5.5分钟内恢复、则驱动器 将自动同步输出、应联系NetApp支持部门以帮助确定是否可以将驱动器重新添加回节点的配置中。