由于源集群上的SMBC测试关系不同步、节点上的ANDU ONTAP升级已暂停
适用场景
- ONTAP 9.11.x
- SMBC
- 一致性组
- FC
- ANDU进程
- ESXi 主机
问题描述
- ONTAP升级失败、并显示以下错误。
cluster::> ::> storage failover show
Takeover
Node Partner Possible State Description
-------------- -------------- -------- -------------------------------------
cluster-01 cluster-02 true Connected to cluster-02, Partial giveback
cluster-02 cluster-01 true Connected to cluster-01. Waiting for cluster applications to come online on the local node. Offline applications:scsi blade.
- 在Node2上完成从9.11P5升级到9.11P8、但Node1未完全交还Node2。仅将控制器聚合和根聚合交还给节点2、但数据聚合仍位于节点1上、因为节点2上的集群应用程序由于SCSI刀片式服务器在节点2上脱机而未联机。
- 由于节点2上的Vserver停留在初始化状态、因此节点2上的所有FCP生命周期都处于关闭状态。
- 由于Node1保存节点2的数据聚合、因此Node1上的ANDU处于 暂停状态。
- 通过继续Vserver初始化、有助于对Node:2执行完整的返回。但是、在节点2上、Vserver恢复到初始化状态、而节点2上的FC LIS仍处于关闭状态。
- 在完成对node2的完全恢复后、它会接管node1完成升级、而在node1上完成了从9.11.1P5到9.11.1P8的升级。
- 但是 、两个节点上的Vserver均进入 初始化状态、并且两个节点上的FCP生命周期管理器运行均已关闭。
- 我们可以看到
SAN SMBC cache to be initialized
指示bcomd logs
scsit_san_asa_table
未按预期填充的错误。
From node 1, repeated errors:
00000018.0180bd01 070c61f6 Sat Jun 03 2023 09:34:24 +02:00 [kern_bcomd:info:6792] 0x8114ed600: 8503e8000174b44d: INFO: SAN::KACOMM::KADISPATCH: src/ka_communication/kaDispatch.cc:dispatch:953 did: 40c4a - command dispatch to node cluster-02 result: (408/9) BCOMKA internal error: operation on non-empty resource
From node 2, repeated errors:
Sat Jun 03 2023 09:33:28 +02:00 [kern_bcomd:info:6705] 0x80a035f00: 8303e90000000007: ERR: SAN::VSERVER::WORKSPACE: src/bcomd/vsWorkspace.cc:scsitCacheVolumes:1219 SCSIT asa cache verification failed: entry doesn't exist
Sat Jun 03 2023 09:33:28 +02:00 [kern_bcomd:info:6705] 0x80a035f00: 8303e90000000007: ERR: SAN::VSERVER::WORKSPACE: src/bcomd/vsWorkspace.cc:get_zrto_relationships:1272 returning: 408/92 - Internal error. Waiting for the SAN SMBC cache to be initialized.
- 在此源集群上创建的测试SMBC关系处于
out of sync
状态。 - 配置一半的测试SMBC配置会导致所有ESXi主机关闭、从而导致完全中断。