由于用户工作负载导致各种问题、CPU较高
适用场景
ONTAP 9
问题描述
- CPU利用率接近100%。
- CPU D刀片式服务器的卷上显示高写入/读取延迟。
- EMS日志报告
wafl.cp.toolong
错误事件。 - 应用程序/作业不一致 或所用时间比平常长。
- 有时、也会显示Active IQ Unified Manager警报:
High CPU utilization Error: cluster1:kernel:node1 on cluster1 is reporting high CPU utilization of 91.1024 %, placing the node into warn state
- 工作负载无法减少。
示例:由于用户工作负载、节点1的CPU较高、但集群中的其他节点处于 空闲状态/利用率极低、如node shell sysstat -x 1
命令中所示。
注意: 删除了列以提高可读性
Cluster::> node run node1 sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s Disk kB/s in out read write 97% 22453 0 0 22463 1491948 8098 664188 2631848 91% 22448 0 0 22478 1492337 8121 607184 658216 94% 22478 0 0 22509 1492134 8106 78844 101992 96% 22453 0 0 23134 1492587 8108 810668 2736420 Cluster::> qos statistics volume latency show Workload ID Latency Network Cluster Data Disk QoS NVRAM --------------- ------ ---------- ---------- ---------- ---------- --------- --------- --------- -total- - 136.49ms 99.00us 70.00us 136.17ms 153.00us 0ms 0ms vserver1_vol1.. 4201 206.05ms 130.00us 0ms 205.88ms 44.00us 0ms 0ms