由于网络策略导致的 Trident Pods CrashLoopBackOff 和 Rubrik 故障
适用于
- NetApp Trident(CSI 驱动程序)
- NetApp ONTAP 9.17.1P2
- OpenShift 4.19.x / Kubernetes 1.32.x
- Rubrik 备份与 Trident 管理的 PVC 集成
问题
在 Trident 托管的 PVC 上,trident-xxxx 命名空间的 Rubrik 备份失败。多个 Trident 节点 pod 卡在 CrashLoopBackOff 状态,且 pod 日志显示就绪性探测失败:
Readiness probe failed: HTTP probe failed with status code: 503
示例 pod 状态:
trident-node-linux-5xxx 0/2 CrashLoopBackOff ...trident-node-linux-6xxx 0/2 CrashLoopBackOff ......
此外,在相关卷上观察到许多快照的挂起和成功删除操作。由于这些 Trident pod 故障,Rubrik 无法完成备份。