常见问题解答: NDMP 文件历史记录
不可不使用
适用于
- Data ONTAP 7-模式
- 集群模式 Data ONTAP 8
- ONTAP 9
- NDMP
解答
什么是文件历史记录以及如何进行通信?
- 文件历史记录是在使用引擎对 NetApp 存储上托管的卷进行网络数据管理协议( NDMP )备份期间生成的。
dump
engine. - 文件历史记录使备份应用程序或数据管理应用程序( DMA )可以为备份中的所有文件创建索引数据库。
- 此数据库使用户可以在修改特定文件时查找包含特定文件的备份以及其他有用的元数据。
- 以下是文件历史记录的两个典型应用程序:
- 提供可供人阅读的用户界面来备份数据
- 为直接访问恢复( DAR )提供基础。DAR 允许 DMA 直接访问磁带上的文件 / 目录、而无需遍历整个备份。这样可以更快地执行文件和目录恢复操作。
- 以下是如何传达文件历史记录:
- 在备份过程中、 ONTAP
dump
的过程会在备份的第 3 阶段和第 4 阶段生成文件历史记录。有关转储阶段的详细信息,请参见 Network Data Management Protocol ( NDMP ) Dump Phases Description 。 dump
将文件历史信息传达给在 ONTAP 中运行的 NDMP 服务器。此通信是运行备份的存储控制器的内部通信。- ONTAP 中的 NDMP 服务器通过网络上的 NDMP 控制连接将文件历史记录传达给备份应用程序 /DMA 。
- 备份应用程序 /DMA 从网络接收文件历史记录、保存数据并将其写入文件历史记录索引数据库。
什么是文件历史记录背压?它会产生什么影响?
- 生成、通信和生成文件历史记录始终会给备份增加一些开销。
- 备份通常在文件历史记录被禁用的情况下运行得更快、即使没有其他性能问题也是如此。
- 文件历史记录通信的一个步骤中存在瓶颈,可能会在下游触发延迟。
- 由于 NDMP 和转储的协同工作方式、文件历史记录传输或吸入延迟会导致整体备份性能降低。
- 也就是说,
dump
在备份应用程序 /DMA 完全输入并确认相关文件历史记录之前、无法继续将数据写入备份流。
- 也就是说,
如何确定文件历史记录背压?
- 检查位于
/etc/log/backup
要备份的卷所在节点上的转储备份日志。成功完成备份后将打印感兴趣的日志。已中止或未完成的备份不会提供足以诊断此问题的日志。 - 计算有关备份的阶段 3 和阶段 4 的持续时间。在以下示例中、阶段 3 的时间为 20 分钟、阶段 4 的时间为 5 小时:
dmp Thu Feb 27 12:01:36 CET 2020 /vol/NdmpBackup/(0) Phase_change (III)
dmp Thu Feb 27 12:21:36 CET 2020 /vol/NdmpBackup/(0) Phase_change (IV)
dmp Thu Feb 27 17:21:36 CET 2020 /vol/NdmpBackup/(0) Phase_change (V) - 查找
Dir to FH entry time stats
Node to FH entry time stats
以毫秒为单位表示的备份的总计和。例如:
dmp Thu Feb 27 17:21:52 CET 2020 /vol/NdmpBackup/(0) Log_msg (Dir to FH entry time stats (msec) numEntries: 2000 min: 0 max: 1526 avg: 5 tot: 15236)
dmp Thu Feb 27 17:21:52 CET 2020 /vol/NdmpBackup/(0) Log_msg (Node to FH Entry time stats (msec) numEntries: 4000 min: 0 max: 1599 avg: 7 tot: 85569) - 如果总
Dir to FH entry time
阶段 3 时间为总阶段 3 时间的 15% 或更多、则在阶段 3 中视为文件历史后台压力。在上面的示例中、 15.236 秒仅为 20 分钟阶段 3 时间的 1% 、因此不会将其视为背压。 - 如果总
Node to FH entry time
阶段 4 时间的 15% 或更多、则在阶段 4 中将被视为文件历史记录背压。在上面的示例中、 85.569 秒为 5 小时阶段 4 时间的 1% 、因此也不被认为是背压。
注意:
- ONTAP 可能会使用以下日志警告可能的文件历史记录回退:
dmp Thu Feb 27 12:05:52 CET 2020 /vol/NdmpBackup/(0) Warning (Total Dir to FH time spent is greater than 15 percent of phase 3 total time. Please verify the settings of backup application and the network connectivity)
- 在 ONTAP 9.6 之前的版本中,由于 错误 1177614 ,这些警告可能不准确。
- 建议使用上述手动计算来确认文件历史记录背压。
文件历史记录背压的常见根源和解决方案是什么?
- 备份应用程序 /DMA 中的文件历史记录生成常见原因和解决方案:
- 原因 1 :托管备份应用程序 /DMA 的服务器或 VM 上的资源争用情况,如来自托管操作系统的一般性能统计信息所示。
- 解决方案 1 :向托管 DMA 的服务器 /VM 添加其他资源或减少资源争用以加快获取和索引的速度。
- 原因 2 :写入文件历史记录索引数据库的性能较差。
- 解决方案 2 :
- 这通常是由于底层存储性能较差或 DMA 软件存在配置 / 规模估算问题所致。
- 确保托管文件历史记录索引数据库的存储具有足够的性能。
- 如果需要,请联系您的 DMA 供应商以获得调整大小的帮助或其他调整,以便更快地索引文件历史记录。
- 与备份应用程序的 NDMP 服务器通信常见原因和解决方案:
- 原因: NDMP 控制连接正在使用潜在或有损网络路径。
- 解决方案:
- 确保托管 NDMP 控制连接的网络路径具有足够的速度和吞吐量,以支持 NDMP 控制连接和文件历史记录消息。
- 检查接口统计数据以了解数据包丢失的迹象或其它问题。
- 在 NetApp 存储控制器上、可以
ifstat
使用 node - shell 命令查看接口统计信息。 - 最后、确保整个网络路径支持 ONTAP 和备份应用程序中配置的 MTU 。
其他信息
在此处添加您的文本。