当 NetApp 存储不可用时,Kubernetes Pod 卡在 Terminating/BackOff 状态
适用于
- NetApp ONTAP(All Flash FAS、AFF-C800 及类似产品)
- 适用于 Kubernetes 的 Trident CSI 驱动程序
- 使用 NetApp 持久卷的 Kubernetes 集群
问题
依赖 NetApp 持久存储的 Kubernetes Pod 仍然处于异常状态(例如 Terminating、BackOff),并且在后端 NetApp 存储离线时(例如,由于控制器死机和 LUN 进入 nvfail 状态)无法正常删除或恢复。
日志输出/症状示例:
- Pod 长时间保持
Terminating状态。 - 如果卷装载尝试反复失败,Pod 进入
BackOff。 - 群集事件显示卷卸载失败或无法访问存储。
- 存储控制器日志指示 LUN 处于
nvfail状态且后端服务离线。