由于用户工作负载导致读取、写入和其他延迟、因此CPU较高
适用场景
ONTAP 9
问题描述
- CPU利用率接近100%、仍然不会对读/写延迟产生影响
- AIQUM在节点级别显示高写入/读取延迟或 CPU D-blade中的受影响卷:
- EMS日志报告
wafl.cp.toolong
错误事件 - 应用程序/作业不一致 或所用时间比平常长
- 有时、也会显示Active IQ Unified Manager警报:
High CPU utilization Error: cluster1:kernel:node1 on cluster1 is reporting high CPU utilization of 91.1024 %, placing the node into warn state
示例:由于用户工作负载、节点1的CPU较高、但集群中的其他节点处于 空闲状态/利用率极低、如node shell sysstat -x 1
命令中所示
注意: 删除了列以提高可读性
::> node run node1 sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s Disk kB/s in out read write 97% 22453 0 0 22463 1491948 8098 664188 2631848 91% 22448 0 0 22478 1492337 8121 607184 658216 94% 22478 0 0 22509 1492134 8106 78844 101992 96% 22453 0 0 23134 1492587 8108 810668 2736420 ::> qos statistics volume latency show Workload ID Latency Network Cluster Data Disk QoS NVRAM --------------- ------ ---------- ---------- ---------- ---------- --------- --------- --------- -total- - 136.49ms 99.00us 70.00us 136.17ms 153.00us 0ms 0ms vserver1_vol1.. 4201 206.05ms 130.00us 0ms 205.88ms 44.00us 0ms 0ms