跳转到主内容

对 SnapMirror 、 SnapVault 和 OSSV 性能问题进行故障排除的方法是什么?

Views:
40
Visibility:
Public
Votes:
0
Category:
snapmirror
Specialty:
dp
Last Updated:

可不使用  

适用于

  • Data ONTAP 7 及更早版本 
  • SnapMirror
  • SnapVault
  • Open Systems SnapVault 

解答

以下方法有助于解决 SnapMirror 、 SnapVault 和 OSSV 性能问题。

性能问题主要是由于以下原因:

  • 过载 SnapMirror/SnapVault 实施。
  • 非最佳空间和数据布局管理。
  • 高系统资源利用率( CPU %util 、磁盘 I/O 、通用 Internet 文件系统协议 (CIFS)/ 网络文件系统( NFS )连接 / 事务等)。
  • 低网络带宽。

症状如下:

  • 初始化或传输更新滞后。因此、延迟超出预期、并且传输持续时间不符合服务级别协议( SLA )。
  • 传输持续时间满足 SLA 要求、但吞吐量较低。

/etc/snapmirror.confsnapvault snap sched中,定义所需的滞后时间( = 两个计划更新之间的预期时间)。
然后浏览snapmirror status –lsnapvault status –l输出以获得对镜像实施的直升机视图:

  • 涉及多少个系统?
  • 有多少个镜像 / 备份服务处于活动状态?
  • 哪些系统同时是源系统和目标系统?
  • 每个源系统和目标系统设置了多少个关系?
  • 记下传输滞后并定义上次传输成功的日期 / 时间。
  • 分析 SnapMirror 日志和系统日志消息以跟踪上次成功传输之前和之后发生的情况:请求发送、启动和结束的时间?是否有任何错误?

建议

  • 尝试在同一卷中保留所有需要大致相同传输时间的关系。
  • 在目标上创建多个具有不同主卷大小和传输要求的卷。
  • 将 SnapMirror 或 SnapVault 计划错开以减少资源对目标的影响。例如,如果每小时需要四次传输,则每隔 15 分钟间隔一次。
  • 不建议每分钟安排 SnapMirror 更新。检查snapmirror.conf“计划分钟”字段(该字段中的 * 表示每分钟触发更新请求)。如果业务需要对关键数据进行同步备份、则 Sync SnapMirror 是适合使用的服务、而不是每分钟计划的异步 SnapMirror 。
  • 确保所有镜像 / 备份活动服务的 Snapshot 创建计划不会重叠。如果可能,请安排在与计划的常规卷 Snapshot 副本不同的时间进行传输。
  • 对于传统卷、 SnapMirror 可确保源卷和目标卷之间的磁盘大小 / 类型和 RAID 组大小相同。
  • 使用/etc/snapmirror.conf KBS 参数限制文件中传输的带宽:
    • 默认设置不会导致传输限制。
    • 在具有许多镜像关系的高速 LAN 中、节流尤为重要。

密切关注空间

当 OSSV 主安装分区空间不足时、更新将失败并显示错误 Failed to sort inode records Database, Temporary and Trace directories have 0% space left (5Mb)

  • 源卷和目标卷上是否有足够的空间?(使用df命令显示每个卷的可用空间)。
  • 如果卷已满、即使创建快照也可能失败:

    对于灵活卷、增加
    传统卷的卷大小、向卷添加磁盘(至少 3 个)

    • 删除不必要的未锁定快照
    • 使用 snap reclapable 命令可显示通过删除快照可以回收的空间量
  • 如果正在使用 OFM ( W2K 和 NT )、请确保要备份的文件系统在驱动器中至少有 15% 的可用磁盘空间。
  • 确保 OSSV 客户端有足够的磁盘空间来运行。
    • 启用Run estimator before each backup OSSV 2.2 提供的功能。
    • 您也可以运行 HealthCheck Utilitysvinstallcheck。它计算并显示数据库和 TMP 分区中的可用空间。
    • 请参阅 OSSV 发行说明以了解磁盘空间要求和占用情况、特别是在使用块级增量 (BLI) 时。
    • 要解决此问题、请增加包含 OSSV 数据库、临时目录和跟踪目录的分区中的空间量。如果分区大小不能增加、请将目录移动到可用空间更大的位置。请注意,如果移动了这些目录、则必须更新 SvConfigurator General (常规)选项卡中的路径、然后停止并重新启动 Windows 服务器上的 OSSV 服务。

系统资源利用率

高系统资源利用率( CPU %util 、磁盘 I/O 、 CIFS/NFS 连接 / 事务等)可能会降低传输吞吐量。

  • 收集并分析以下命令的输出:
  • perfstat 来自源和目标的输出(这也会添加statitsysstat 输出)。
  • statit 以及sysstat -m 传输过程中的输出、包括源和目标。
  • 网络详细信息(其他作业、带宽、故障、预期吞吐量、已实施节流)。

有关 SnapMirror / SnapVault 常见问题的信息、请参见 KB : Top 10 SnapMirror/SnapVault Issues and Solutions

其他信息

不适用

 

Sign in to view the entire content of this KB article.

New to NetApp?

Learn more about our award-winning Support

Scan to view the article on your device