如何对StorageGRID 无法与节点通信(NDDOWN)进行故障排除
适用场景
- NetApp StorageGRID
- NetApp StorageGRID设备
- NetApp StorageGRID基于VMware的节点
- 基于NetApp StorageGRID裸机的节点
问题描述
本文有助于确定StorageGRID节点已关闭的发生原因。发生原因StorageGRID节点处于断开状态的原因可能有多种、例如:
- 维护操作
- 网络连接问题
- 硬件问题
- 文件系统损坏
- 资源问题(例如CPU、内存或磁盘)。常见的资源问题现象是 系统Shell /CLI/ssh中的响应缓慢/缓慢。
- 取消配置
StorageGRID可能会报告以下错误:
- StorageGRID节点将显示在
网格管理器中的蓝色图标(已断开连接–未知)旁边
- StorageGRID报告
Unable to communicate with Node
警报 Unexpected node reboot
如果节点自行恢复联机- StorageGRID会报告
NDDOWN
原有警报 - 如果启用了AutoSupport、则会创建
NDDOWN
AutoSupport意外事件:CSTARS:StorageGRID Notification from <serial number> (NODE_DOWN-CRITICAL) ERROR