StorageGRID 在停用复制数据或 ILM 评估方面进展缓慢或没有进展
适用于
NetApp StorageGRID
问题描述
- StorageGRID 存储节点的退役过程在特定阶段经历缓慢或没有进展
- 登录到网格管理器。
- 导航到维护 > 停用。
- 对于早于 11.4 的 StorageGRID 版本,停用阶段为"评估 ILM"。
- 对于高于 11.4 的 StorageGRID 版本,停用阶段为"停用复制数据"。
- 退役任务的完成百分比进展缓慢或根本没有进展
- 在网格管理器上,导航到 支持 > 网格拓扑 > 主管理节点 > CMN > 网格任务。
- 检查 Stage 和 "% Complete" 值的 Storage Node Decommissioning 任务。
- 停用节点正在等待截断相同的对象数据文件:
- 通过 SSH 会话登录退役节点
- 切换到 root 用户:
su -
- 启用调试日志:
(echo "moduledebuglevel DCOM 1";sleep 1) | telnet 0 1402
- 监控退役日志:
tail -f /var/local/log/bycast.log | grep DCOM
- 验证日志是否重复显示类似于以下内容的消息:
Feb 24 14:48:59 <nodename> ADE: |12983731 0734583769 DCOM CSRT 2023-02-24T14:48:59.113673| INFO 0405 e3e6699e31d46b7e DCOM: Waiting for data file /var/local/rangedb/0/p/02/1F/00qLyqjT>z-sgPRdr4$h to be truncated
- 禁用调试日志:
(echo "moduledebuglevel DCOM -1";sleep 1) | telnet 0 1402
- 确认退役节点重复尝试截断同一对象文件后,等待至少两个扫描周期,然后重复上述步骤来检查退役调试日志。扫描周期可从网格管理器中的仪表板查看。
- 如果在多个扫描周期之后,节点仍在等待截断相同的对象文件,则此 KB 适用。