跳转到主内容

对 SnapMirror 、 SnapVault 和 OSSV 性能问题进行故障排除的方法是什么?

Views:
67
Visibility:
Public
Votes:
0
Category:
snapmirror
Specialty:
dp
Last Updated:

可不使用  

适用于

  • Data ONTAP 7 及更早版本 
  • SnapMirror
  • SnapVault
  • Open Systems SnapVault 

解答

以下方法有助于解决 SnapMirror 、 SnapVault 和 OSSV 性能问题。

性能问题主要是由于以下原因:

  • 过载 SnapMirror/SnapVault 实施。
  • 非最佳空间和数据布局管理。
  • 高系统资源利用率( CPU %util 、磁盘 I/O 、通用 Internet 文件系统协议 (CIFS)/ 网络文件系统( NFS )连接 / 事务等)。
  • 低网络带宽。

症状如下:

  • 初始化或传输更新滞后。因此、延迟超出预期、并且传输持续时间不符合服务级别协议( SLA )。
  • 传输持续时间满足 SLA 要求、但吞吐量较低。

/etc/snapmirror.confsnapvault snap sched中,定义所需的滞后时间( = 两个计划更新之间的预期时间)。
然后浏览snapmirror status –lsnapvault status –l输出以获得对镜像实施的直升机视图:

  • 涉及多少个系统?
  • 有多少个镜像 / 备份服务处于活动状态?
  • 哪些系统同时是源系统和目标系统?
  • 每个源系统和目标系统设置了多少个关系?
  • 记下传输滞后并定义上次传输成功的日期 / 时间。
  • 分析 SnapMirror 日志和系统日志消息以跟踪上次成功传输之前和之后发生的情况:请求发送、启动和结束的时间?是否有任何错误?

建议

  • 尝试在同一卷中保留所有需要大致相同传输时间的关系。
  • 在目标上创建多个具有不同主卷大小和传输要求的卷。
  • 将 SnapMirror 或 SnapVault 计划错开以减少资源对目标的影响。例如,如果每小时需要四次传输,则每隔 15 分钟间隔一次。
  • 不建议每分钟安排 SnapMirror 更新。检查snapmirror.conf“计划分钟”字段(该字段中的 * 表示每分钟触发更新请求)。如果业务需要对关键数据进行同步备份、则 Sync SnapMirror 是适合使用的服务、而不是每分钟计划的异步 SnapMirror 。
  • 确保所有镜像 / 备份活动服务的 Snapshot 创建计划不会重叠。如果可能,请安排在与计划的常规卷 Snapshot 副本不同的时间进行传输。
  • 对于传统卷、 SnapMirror 可确保源卷和目标卷之间的磁盘大小 / 类型和 RAID 组大小相同。
  • 使用/etc/snapmirror.conf KBS 参数限制文件中传输的带宽:
    • 默认设置不会导致传输限制。
    • 在具有许多镜像关系的高速 LAN 中、节流尤为重要。

密切关注空间

当 OSSV 主安装分区空间不足时、更新将失败并显示错误 Failed to sort inode records Database, Temporary and Trace directories have 0% space left (5Mb)

  • 源卷和目标卷上是否有足够的空间?(使用df命令显示每个卷的可用空间)。
  • 如果卷已满、即使创建快照也可能失败:

    对于灵活卷、增加
    传统卷的卷大小、向卷添加磁盘(至少 3 个)

    • 删除不必要的未锁定快照
    • 使用 snap reclapable 命令可显示通过删除快照可以回收的空间量
  • 如果正在使用 OFM ( W2K 和 NT )、请确保要备份的文件系统在驱动器中至少有 15% 的可用磁盘空间。
  • 确保 OSSV 客户端有足够的磁盘空间来运行。
    • 启用Run estimator before each backup OSSV 2.2 提供的功能。
    • 您也可以运行 HealthCheck Utilitysvinstallcheck。它计算并显示数据库和 TMP 分区中的可用空间。
    • 请参阅 OSSV 发行说明以了解磁盘空间要求和占用情况、特别是在使用块级增量 (BLI) 时。
    • 要解决此问题、请增加包含 OSSV 数据库、临时目录和跟踪目录的分区中的空间量。如果分区大小不能增加、请将目录移动到可用空间更大的位置。请注意,如果移动了这些目录、则必须更新 SvConfigurator General (常规)选项卡中的路径、然后停止并重新启动 Windows 服务器上的 OSSV 服务。

系统资源利用率

高系统资源利用率( CPU %util 、磁盘 I/O 、 CIFS/NFS 连接 / 事务等)可能会降低传输吞吐量。

  • 收集并分析以下命令的输出:
  • perfstat 来自源和目标的输出(这也会添加statitsysstat 输出)。
  • statit 以及sysstat -m 传输过程中的输出、包括源和目标。
  • 网络详细信息(其他作业、带宽、故障、预期吞吐量、已实施节流)。

有关 SnapMirror / SnapVault 常见问题的信息、请参见 KB : Top 10 SnapMirror/SnapVault Issues and Solutions

其他信息

不适用

 

 

Sign in to view the entire content of this KB article.

New to NetApp?

Learn more about our award-winning Support

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.