对 SnapMirror 、 SnapVault 和 OSSV 性能问题进行故障排除的方法是什么?
不可不使用
适用于
- Data ONTAP 7 及更早版本
- SnapMirror
- SnapVault
- Open Systems SnapVault
解答
以下方法有助于解决 SnapMirror 、 SnapVault 和 OSSV 性能问题。
性能问题主要是由于以下原因:
- 过载 SnapMirror/SnapVault 实施。
- 非最佳空间和数据布局管理。
- 高系统资源利用率( CPU %util 、磁盘 I/O 、通用 Internet 文件系统协议 (CIFS)/ 网络文件系统( NFS )连接 / 事务等)。
- 低网络带宽。
症状如下:
- 初始化或传输更新滞后。因此、延迟超出预期、并且传输持续时间不符合服务级别协议( SLA )。
- 传输持续时间满足 SLA 要求、但吞吐量较低。
在/etc/snapmirror.conf
或snapvault snap sched
中,定义所需的滞后时间( = 两个计划更新之间的预期时间)。
然后浏览snapmirror status –l
或snapvault status –l
输出以获得对镜像实施的直升机视图:
- 涉及多少个系统?
- 有多少个镜像 / 备份服务处于活动状态?
- 哪些系统同时是源系统和目标系统?
- 每个源系统和目标系统设置了多少个关系?
- 记下传输滞后并定义上次传输成功的日期 / 时间。
- 分析 SnapMirror 日志和系统日志消息以跟踪上次成功传输之前和之后发生的情况:请求发送、启动和结束的时间?是否有任何错误?
建议
- 尝试在同一卷中保留所有需要大致相同传输时间的关系。
- 在目标上创建多个具有不同主卷大小和传输要求的卷。
- 将 SnapMirror 或 SnapVault 计划错开以减少资源对目标的影响。例如,如果每小时需要四次传输,则每隔 15 分钟间隔一次。
- 不建议每分钟安排 SnapMirror 更新。检查
snapmirror.conf
“计划分钟”字段(该字段中的 * 表示每分钟触发更新请求)。如果业务需要对关键数据进行同步备份、则 Sync SnapMirror 是适合使用的服务、而不是每分钟计划的异步 SnapMirror 。 - 确保所有镜像 / 备份活动服务的 Snapshot 创建计划不会重叠。如果可能,请安排在与计划的常规卷 Snapshot 副本不同的时间进行传输。
- 对于传统卷、 SnapMirror 可确保源卷和目标卷之间的磁盘大小 / 类型和 RAID 组大小相同。
- 使用
/etc/snapmirror.conf
KBS 参数限制文件中传输的带宽:- 默认设置不会导致传输限制。
- 在具有许多镜像关系的高速 LAN 中、节流尤为重要。
密切关注空间
当 OSSV 主安装分区空间不足时、更新将失败并显示错误 Failed to sort inode records Database, Temporary and Trace directories have 0% space left (5Mb)
- 源卷和目标卷上是否有足够的空间?(使用
df
命令显示每个卷的可用空间)。 - 如果卷已满、即使创建快照也可能失败:
对于灵活卷、增加
传统卷的卷大小、向卷添加磁盘(至少 3 个)- 删除不必要的未锁定快照
- 使用 snap reclapable 命令可显示通过删除快照可以回收的空间量
- 如果正在使用 OFM ( W2K 和 NT )、请确保要备份的文件系统在驱动器中至少有 15% 的可用磁盘空间。
- 确保 OSSV 客户端有足够的磁盘空间来运行。
- 启用
Run estimator before each backup
OSSV 2.2 提供的功能。 - 您也可以运行 Health
Check Utility
或svinstallcheck
。它计算并显示数据库和 TMP 分区中的可用空间。 - 请参阅 OSSV 发行说明以了解磁盘空间要求和占用情况、特别是在使用块级增量 (BLI) 时。
- 要解决此问题、请增加包含 OSSV 数据库、临时目录和跟踪目录的分区中的空间量。如果分区大小不能增加、请将目录移动到可用空间更大的位置。请注意,如果移动了这些目录、则必须更新 SvConfigurator General (常规)选项卡中的路径、然后停止并重新启动 Windows 服务器上的 OSSV 服务。
- 启用
系统资源利用率
高系统资源利用率( CPU %util 、磁盘 I/O 、 CIFS/NFS 连接 / 事务等)可能会降低传输吞吐量。
- 收集并分析以下命令的输出:
perfstat
来自源和目标的输出(这也会添加statit
和sysstat
输出)。statit
以及sysstat -m
传输过程中的输出、包括源和目标。- 网络详细信息(其他作业、带宽、故障、预期吞吐量、已实施节流)。
有关 SnapMirror / SnapVault 常见问题的信息、请参见 KB : Top 10 SnapMirror/SnapVault Issues and Solutions 。
其他信息
不适用