升级到StorageGRID 11.7在存储设备上的"准备升级"步骤中卡住
适用场景
NetApp StorageGRID 11.7
问题描述
- 在升级到11.7期间、 存储节点进入未知状态、并且
upgrade.log
设备上的出现故障、并显示以下错误:
/var/local/log/upgrade.log:
[2023-06-09T12:15:41.748364 #33987] ERROR -- : Failed to open TCP connection to <Admin node>:9999 (Connection timed out - connect(2) for "<Primary Admin Node>" port 9999) (Errno::ETIMEDOUT)
- 在其余节点尝试与受影响节点通信时、可以看到这些节点的网络隔离事件。
dynip.log
WARNING -- Possible network isolation: Node has no contact with other nodes. If this warning persists, use the /usr/sbin/add_node_ip.py command to tell this node the address of another node in the grid. See the Recovery and Maintenance Guide for details.
- 存储节点无法连接到任何网格端口上的任何网格节点、并且
grid_ips
NFT规则集中的元素缺少受影响节点的IP。运行以下命令进行检查:
nft list ruleset
- 或者、也可以从主管理节点运行以下命令、以验证是否有任何其他节点正在出现问题描述。
run-each-node "wc -l /etc/ssh/ssh_known_hosts"