通过 SSH 运行的 Ndmpcopy 在固定时间后始终中止
适用于
- ONTAP 9
- NDMPcopy
- DumpToNull
问题描述
当 ndmpcopy 在 SSH 上运行时,无论重试次数如何,它始终在配置的 SSH 超时时间段(例如,10 分钟)后停止:
- 在源端控制台上,报告了
Write to socket failed。 - 在目标端控制台上,报告了
interrupted due to an abort。 - 在源端
backup log中观察到转储正常进行,然后使用Error (Write to socket failed)或类似方法中止。 检查备份日志中Phase_change和Error行的时间戳,这两个事件之间的经过时间将是多次尝试中的一致间隔。- 例如,Phase_change 和 error/abort 之间的经过时间始终为 15 分钟(或其他一些典型的超时值)。
- ndmpd 日志与调试级别
0000001b.0129b5ad 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: DMA>>S V4 sequence=10 (0xa)
0000001b.0129b5ae 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: Time_stamp=0x691c23d4 (Nov 18 16:44:20 2025)
0000001b.0129b5af 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: message type=0 (NDMP4_MESSAGE_REQUEST)
0000001b.0129b5b0 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: message_code=0x902 (NDMP4_CONNECT_CLOSE)
0000001b.0129b5b1 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: reply_sequence=0 (0x0)
0000001b.0129b5b2 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: error_code=0 (NDMP4_NO_ERR)
0000001b.0129b5b3 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: service_terminate called
0000001b.0129b5b4 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: received CLOSE command from [<node management LIF IP address>].37395