群集端口 e0a 关闭期间 Hyper-V 虚拟机挂起
适用于
- AFF-A300
- ONTAP 9.13.1P9
- Hyper-V
- SMB3
问题描述
- 一些虚拟机 (VM) 在 node-3 的群集端口 e0a 上发生意外停机事件时出现挂起 (IO 冻结)
- 受影响的虚拟机通过 node-3 的数据 LIF 和集群网络间接连接到 node-4
- 集群节点之间部分丢包:
Fri Oct 17 19:38:21 [node-3: vifmgr: vifmgr.cluscheck.droppedlarge:alert]: Partial packet loss when pinging from cluster lif node-3_clus1 (node node-3) to cluster lif node-4_clus4 (node cluster-4).- CIFS 锁定状态不匹配
Fri Oct 17 19:38:40 [node-3:kernel:Nblade.cifsLockStateMismatch:debug]: params:{'pMessage':'Leaked share lock?'}- 节点 3 上的群集端口 e0a 关闭:
Fri Oct 17 19:39:22 [node-3:kernel:netif.linkDown:info]: Ethernet e0a: Link down, check cable.Fri Oct 17 19:39:22 [node-3:vifmgr:vifmgr.portdown:notice]: A link down event was received on node node-3, port e0a.Fri Oct 17 19:39:22 [node-3:vifmgr:vifmgr.clus.linkdown:EMERGENCY]: The cluster port e0a on node node-3 has gone down unexpectedly.- 显示 IO 延迟(但 SRB_STATUS_SUCCESS)的 Windows Hyper-V 事件日志:
Warning 2025-10-17 19:38:40'...CA-OP-xxxxxx-N_C.vhdx' I/O request completed in 25406ms, status=SRB_STATUS_SUCCESS.- VM 需要强制终止并重新启动主机才能恢复