CONTAP-46582:《SnapMirror复制期间的RMONIC》
问题描述
-Node panic with
:[RPanic:page fault( Supervisor Read data,page not present ) on VA 0x3e cs:rip 0x20:0xffffffffffffffff80abfc1a rflags 0x10206 in Process NwkThd_01 on 9.10.1P15 (C)]
- EMS 日志显示,在发生恐慌时网络完整性检查失败:
[2 月 18 日星期日 20:00:01 -0600 [node8:repl_Handle_reg:repl.engine.error:debug]:params:{'replStatus':'309','replFailureMsg':'5898803','replFailureMsgDetail':'0','functionName':'void repl_spinnp::NetworkIntegrityChecker::validateIntegrity(repl_core::ReplOpData &)','lineNumber':'1190']
[2 月 18 日星期日 20:00:01 -0600 [node8:repl_Handle_reg:repl.engine.error:debug]:params:{'replStatus':'309','replFailureMsg':'5898803','replFailureMsgDetail':'0','functionName':'void repl_spinnp::NetworkIntegrityChecker::validateIntegrity(repl_core::ReplOpData &)','lineNumber':'1246'}
2 月 18 日星期日 20:00:05 -0600 [node8: rastrace_dump: rastrace.dump.saved:debug]: 模块 REPL 实例 0 的 RAS 跟踪转储存储在 /etc/log/rastrace/REPL_0_20240218_20:00:05:649324.dmp 中。
2 月 18 日星期日 20:00:06 -0600 [node8:repl_Handle_reg:repl.engine.error:debug]:params:{'replStatus':'42','replFailureMsg':'5898536','replFailureMsgDetail':'4194309','functionName':'spinnp_repl_result_t repl_core::ReplOpData::unmarshal()','lineNumber':'864'}
2 月 18 日(星期日)20:01:02 -0600 [4294967295@node8: NwkThd_01: ha.panicInfoNotSent:notice]: 本地节点无法通过 HA 互连向 HA 合作伙伴发送紧急信息消息,原因是错误:不是 HA,或者不是 ESX/MVRD 第 3 层。合作伙伴名称:node7。配对系统ID:537410192。
Sun 2月18日20:01:02-0600 [4294967295@node8:NwkThd_01:sk.panag:alry]:崩溃字符串:VA 0x3e上的页面错误(主管读取数据,页面不存在) cs:rip 0x20:0xffffffffff80abfc1a rflags 0x10206 in Process NwkThd_01 on 9.10.1P15 ]
- 在 SnapMirror 审计日志中,我们看到完整性检查由于网络问题而失败:
[2024 年 2 月 18 日(星期日)20:00:01 CST 2024 ScheduledUpdate[2 月 18 日 20:00:00]:5e691939-252a-11ec-b835-00a098a77bf5 Operation-Uuid=97a5c86f-cc08-4dce-b611-8c373b9606a5 Group=none Operation-Cookie=0 action=Defer source=src_svm:vol1 destination=dst_svm:vol1_mirror status=Failure message=传输失败。(由于传输故障或网络问题,复制操作完整性检查失败。)]