升级到9.12.1后的数据访问问题和CSM-badconnection事件
适用场景
- ONTAP 9.12.1
- 集群会话管理器(CSM)
- 集群对等策略
问题描述
升级到9.12.1后:
- 在上次交还期间
storage failover show
、输出中的状态将保持waiting for partner lock synchronization
很长时间。 - SAN连接可能是间歇性的
- 如果所有NAS客户端通过LIF访问的数据所在节点与分配了寻址卷的节点不同、则它们将无法访问数据。
- NFS
showmount
在一个节点上使用数据LIF、而在另一个节点上使用Vserver根卷超时。 - NFS使用数据LIF在一个节点上挂载、
junction-path
并指向另一节点上的卷失败/超时。 - 输出
event log show
表示跨节点通信不良和CSM错误、例如:
3/31/2023 11:40:12 node-02 DEBUG hamsg.connectFail: remoteID="9b824c9e921411ed9866d039eaa500fc", status="10", scope="5", scope_err="68"
3/31/2023 11:40:04 node-02 ALERT csm.badConnection: ONTAP received a CSM connection with unrecognizable content at local address 169.254.87.48 local port 7700, from remote address 169.254.86.166 remote port 53376, via IPspace -2.
3/31/2023 11:40:04 node-02 DEBUG ems.engine.suppressed: Event 'csm.badConnection' suppressed 11935 times in last 121 seconds.
3/31/2023 11:39:54 node-01 DEBUG ems.engine.suppressed: Event 'csm.stickyState' suppressed 4 times in last 259 seconds.
3/31/2023 11:39:32 node-02 DEBUG csm.stickyState: localBladeUUID="node-02:dblade", remoteBladeUUID="9b824c9e-9214-11ed-9866-d039eaa500fc", uniquifier="-87206161", filename="src/Csm/CSMImpl.cc", lineno="1145"DEBUG csm.stickyState: localBladeUUID="node-02:dblade", remoteBladeUUID="9b824c9e-9214-11ed-9866-d039eaa500fc", uniquifier="-87206161", filename="src/Csm/CSMImpl.cc", lineno="1145"