磁盘写入验证上的主机内存校验和不匹配
适用场景
- FAS 存储节点(AFF 节点不受影响)
- ONTAP 9.8或9.9.1
- 在同一节点上具有本地层和云层的本地FabricPool 配置
- 一个节点托管本地层的HA对和托管云层的HA配对节点、在接管时受影响
问题描述
-
分层策略不会
none
分配给卷、而分层到云层处于活动状态。 -
节点意外重新启动并显示崩溃消息:
Host memory checksum mismatch on WRITE VERIFY: Disk <disk_ID>, Disk Block #XXXX: Volume <Volume_name>, FileId XXX,File Block #XXX: Expected 0xYYYYYYYY, Recomputed as 0xZZZZZZZZ in SK process disk_server_0 on release 9.X (C)
- 如果接管会将云层和性能层置于一个节点、则接管可能会导致崩溃。
- 配对节点发出HA接管后、可能会发生相同的意外重新启动、从而导致HA对中断。
- 如果HA对中的每个节点仅拥有本地层或云层、则只有在发出接管后才会触发崩溃。
- 发生崩溃后的RAID擦洗揭示了奇偶校验错误、并引用了云层聚合:
[node-02: raidio_thread: raid_rg_scrub_cksum_err_1:notice]: params: {'disk_rpm': '10000', 'vendor': 'NETAPP ', 'firmware_revision': 'NA01', 'shelf': '23', 'disk_info': 'Disk /<cloud_tier_aggregate>/plex0/rg1/0c.23.8 Shelf 23 Bay 8 [NETAPP X343_TA15E1T8A10 NA01] S/N [XXX] UID [5000039B:3840A21C:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]', 'site': 'Local', 'bay': '8', 'carrier': '', 'serialno': 'XXX', 'owner': '', 'model': 'X343_TA15E1T8A10', 'disk_type': '4', 'blockNum': '17612'}
[node-02: raidio_thread: raid_rg_readerr_repair_cksum_stored_1:notice]: params: {'disk_rpm': '10000', 'vendor': 'NETAPP ', 'firmware_revision': 'NA01', 'shelf': '23', 'disk_info': 'Disk /<cloud_tier_aggregate>/plex0/rg1/0c.23.8 Shelf 23 Bay 8 [NETAPP X343_TA15E1T8A10 NA01] S/N [XXX] UID [5000039B:3840A21C:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]', 'site': 'Local', 'bay': '8', 'carrier': '', 'serialno': 'XXX', 'owner': '', 'model': 'X343_TA15E1T8A10', 'disk_type': '4', 'blockNum': '17612'}
- 检测到不一致的用户数据块、请引用
<volume_name>
本地层聚合上的:
[node-01: wafl_exempt12: wafl.raid.incons.userdata:error]: WAFL inconsistent: inconsistent user data block at VBN XXX (vvbn:XXX fbn:XXX level:0) in public inode (fileid:XXX snapid:0 file_type:15 disk_flags:0x8402 error:120 raid_set:1) in volume <volume_name>@vserver:<Vserver_UUID>.