工作负载的突发性延迟和CPU利用率
适用场景
- ONTAP 9
- ONTAP Select v9.12.1 或更高版本
- FAS/AFA系统
- CVO
问题描述
- 中央处理器 (CPU) 持续处于高、接近或 100% 状态,或 CPU 利用率高于预期水平。
- 节点上触发了性能容量警报。
- 随处写入文件布局 (WAFL)
WAFL_Ex
可能是最繁忙的领域之一(数据处理发生的地方) 。 - 主机报告一天中特定持续时间的IO等待时间较长。
- 命令
sysstat -M 1
可用于检查最繁忙的域。 - 对于网络文件系统 (NFS) 客户端,这可能由“NFS 服务器无响应”错误指示。
- 虚拟桌面基础架构 ( VDI) 用户将遇到读/写/其他延迟问题,如受影响卷的活动 IQ 图表所示,如下所示。
例子:sysstat
输出显示由于用户工作负载增加导致 CPU 使用率上升(为便于阅读删除了列)
Cluster::> node run -node <node> -command sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s HDD kB/s in out read write 11% 1324 0 0 1324 169 131 5300 0 28% 72 0 0 72 483 526 4928 12 53% 175 0 0 175 254 407 5176 24 23% 143 0 0 143 146 72 4752 0 12% 230 0 0 230 134 259 5808 24 40% 5766 0 0 5766 207 720 44336 36956 53% 108 0 0 108 15698 14391 32340 24 46% 30 0 0 30 30975 30269 29900 0 87% 32124 0 0 32124 576397 53287 203513 12 99% 44334 0 0 44334 659406 45518 256931 251353 99% 43692 0 0 43692 609739 16930 263599 565448 99% 44492 0 0 44492 633509 41562 261366 116257