如何排除 StorageGRID 无法与节点通信的故障(NDDOWN)
适用于
- NetApp StorageGRID
- NetApp StorageGRID 设备
- NetApp StorageGRID 基于 VMware 的节点
- NetApp StorageGRID 基于裸机的节点
说明
本文有助于确定 StorageGRID 节点关闭的原因。多种原因可能导致 StorageGRID 节点处于断开连接状态,例如:
- 维护操作
- 网络连接问题(GRID 网络)
- GRID 网络用于节点间通信。
- 这是节点到主管理节点之间的连接。
- 硬件问题
- 文件系统损坏
- 资源问题(如 CPU、内存或磁盘)。资源问题的一个常见症状是系统 shell/cli/ssh 内的响应迟缓/缓慢。
- 停用
StorageGRID 可能会报告以下错误:
- StorageGRID 节点出现在网格管理器中的蓝色图标
(断开连接 – 未知)旁边 - StorageGRID 报告
Unable to communicate with Node警报 Unexpected node reboot如果节点自行重新联机- StorageGRID 报告
NDDOWN旧警报 - 如果启用了 AutoSupport,它将打开一个
NDDOWNAutoSupport 事件:CSTARS:StorageGRID Notification from <serial number> (NODE_DOWN-CRITICAL) ERROR