如何对StorageGRID 无法与节点通信(NDDOWN)进行故障排除
适用场景
- NetApp 存储网格
- NetApp StorageGRID 设备
- 基于NetApp StorageGRID VMware的节点
- 基于NetApp StorageGRID 裸机的节点
问题描述
本文将帮助确定StorageGRID 节点已关闭的发生原因。发生原因 StorageGRID 节点可能处于断开连接状态的原因有多种、例如:
- 维护操作
- 网络连接问题
- 硬件问题
- 文件系统损坏
- 资源问题(例如CPU、内存或磁盘)。资源问题的常见现象 是系统shell/Ccli/ssh中响应缓慢。
- 解锁
StorageGRID 可能会报告以下错误:
- 在
网格管理器中、StorageGRID 节点会显示在蓝色图标(Disconnected–Unknown)旁边
- StorageGRID 报告
Unable to communicate with Node
警报 Unexpected node reboot
节点自行恢复联机时- StorageGRID 报告
NDDOWN
旧警报 - 如果启用了AutoSupport 、则它将打开
NDDOWN
AutoSupport 意外事件:CSTARS:StorageGRID Notification from <serial number> (NODE_DOWN-CRITICAL) ERROR