用于分析CPU系统性能的指标有哪些?
适用场景
- ONTAP 9
- Data ONTAP 8 7-模式
- Data ONTAP 7 及更早版本
问题解答
- CPU 是 Data ONTAP 可用的物理资源类型之一。
- 在分析系统性能时,请整体查看系统。
- 分析瓶颈的一般策略是同时使用服务指标(协议 / 卷 /LUN 延迟 / 工作负载)和组件指标( CPU ,磁盘 IO ,网络 IO )
- 这样可以提供系统的完整视图,并减少错误结论。
- 具体而言, CPU 资源将按优先级划分工作:
- 某些类型的工作被确定为后台工作或非必要 / 机会性工作:
- 这意味着,当后台工作使用一个或多个 CPU 核心时、它将在请求到达时有效地发挥更高优先级的作用。
- 某些类型的工作被确定为后台工作或非必要 / 机会性工作:
- 此外,随着系统负载的增加、处理优化很可能会导致非线性扩展,从而测量物理 CPU 核心利用率和逻辑 CSMP 域利用率。这在复杂的计算系统中是正常的。
CPU 瓶颈类型
以下三种 CPU 瓶颈类型可能是因为 CSMP 模型:
- 平均 CPU 核心利用率:所有核心的 CPU 核心利用率平均度量达到 100% 。
- 逻辑域瓶颈:
- 逻辑域达到其并发限制。
- 例如,如果逻辑域的并发性为 1 个 CPU 核心,并且利用率达到 100% 。
- 逻辑域之间的交互:
- 某些逻辑域是互斥的,不能与另一个相关逻辑域同时运行。
- 例如
WAFL_ex
,表示并行 WAFL 处理、而 Kahuna 则表示串行 WAFL 处理。 - 这两个逻辑域是互斥的、意味着 Kahuna 可以在 1 个 CPU 上处于活动状态、也可以
WAFL_ex
在 1 个以上的 CPU 上处于活动状态、但 Kahuna 和WAFL_Ex
两者都不能同时处于活动状态。
- 例如
- 根据工作量的不同、 Kahuna 可以限制可以执行的工作量
WAFL_ex
。- 注意: 此类瓶颈与先前的情况相比只是一种简单的变化。
- 某些逻辑域是互斥的,不能与另一个相关逻辑域同时运行。
注意:如果不达到域瓶颈或平均 CPU 瓶颈,则无法在物理 CPU 核心上产生瓶颈。因此,将物理 CPU 利用率监控作为直接衡量标准并不有效。
注意:从 Data ONTAP 8.2.1 开始,用于表示 CPU 利用率(cpu_busy
)的算法已更改,并且根据 CPU 核心总数,它具有不同的算法。
- <= 20 个 CPU 核,
cpu_busy
返回以下两个值中较高的值:-
所有 CPU 核心的平均 CPU 利用率(
avg_processor_busy
) -
并发性为 1 的最繁忙域的 CPU 利用率
-
-
>= 36 个 CPU 核,
cpu_busy
返回以下三个值中的最高值。对于具有 36 个或更多 CPU 核的平台,这些 CPU 核将分别均匀地分为两个分区。-
第一个分区(非 WAFL 分区)的平均 CPU 利用率
-
第二个分区( WAFL 分区)的平均 CPU 利用率
-
并发性为 1 的最繁忙域的 CPU 利用率
-