在MetroCluster环境中、因写入工作负载笨重而导致性能问题描述
适用场景
- ONTAP 9
- MCC环境
问题描述
- 受影响节点上的所有卷均报告运行很减分。
- 可从Data和NVLOG查看QoS统计信息中的延迟。
cluster::> qos statistics volume latency show
Workload ID Latency Network Cluster Data Disk QoS NVRAM Cloud
------------ ------ ---------- ---------- ---------- ---------- ---------- ---------- ---------- ----------
volume_1 17882 10ms 0.01ms 0ms 4.5ms 1ms 0ms 3.4ms 0ms
volume_2 5232 12ms 0.02ms 0ms 5.05ms 1ms 0ms 5.90ms 0ms
volume_3 17160 14ms 0.05ms 0ms 4.25ms 1ms 0ms 8.75ms 0ms
- 随着单个卷上的工作负载增加、CPU利用率也随之提高(接近100%)。
- 可以通过sysstat和QoS statics 命令来观察CPU利用率和前几个会话。
Cluster::> node run node1 sysstat -x 1
CPU NFS CIFS HTTP Total Net kB/s Disk kB/s
in out read write
79% 22453 0 0 22463 491948 8098 64188 631848
92% 122448 0 0 122448 1492337 8121 07184 1158216 <<<
95% 122578 0 0 122578 1492134 8106 78844 1501992
100% 123453 0 0 123453 1492587 8108 10668 1736420
Cluster1::> qos statistics workload resource cpu show -node node1 -iterations 100 -rows 3
Workload ID CPU
--------------- ----- -----
vs0-wid-102 102 60%
file-bigvmdk-.. 121 2%
vs2_vol0-wid-.. 212 2%
vs0-wid-101 102 5%
file-bigvmdk-.. 121 2%
vs2_vol0-wid-.. 212 1%
- 此类笨重的卷上的大多数工作负载都是其他和写入操作、它们需要 通过ISL链路记录到镜像集群上的远程NVRAM。
- ISL利用率提高会导致缓冲区信用被剥夺。