跳转到主内容

CPU 作为系统性能的衡量标准

Views:
6
Visibility:
Public
Votes:
0
Category:
not set
Specialty:
perf
Last Updated:

适用场景

  • ONTAP 9
  • 集群模式 Data ONTAP 8 
  • Data ONTAP 8 7-模式 
  • Data ONTAP 7 及更早版本 

问题解答

  • CPU 是 Data ONTAP 可用的物理资源类型之一。
  • 在分析系统性能时,请整体查看系统。
  • 分析瓶颈的一般策略是同时使用服务指标(协议 / 卷 /LUN 延迟 / 工作负载)和组件指标( CPU ,磁盘 IO ,网络 IO )
    • 这样可以提供系统的完整视图,并减少错误结论。
  • 具体而言, CPU 资源将按优先级划分工作:
    • 某些类型的工作被确定为后台工作或非必要 / 机会性工作:
      • 这意味着,当后台工作使用一个或多个 CPU 核心时、它将在请求到达时有效地发挥更高优先级的作用。 
  • 此外,随着系统负载的增加、处理优化很可能会导致非线性扩展,从而测量物理 CPU 核心利用率和逻辑 CSMP 域利用率。这在复杂的计算系统中是正常的。
CPU 瓶颈类型

以下三种 CPU 瓶颈类型可能是因为 CSMP 模型:

  • 平均 CPU 核心利用率:所有核心的 CPU 核心利用率平均度量达到 100% 。
  • 逻辑域瓶颈:
    • 逻辑域达到其并发限制。
    • 例如,如果逻辑域的并发性为 1 个 CPU 核心,并且利用率达到 100% 。
  • 逻辑域之间的交互:
    • 某些逻辑域是互斥的,不能与另一个相关逻辑域同时运行。
      • 例如WAFL_ex,表示并行 WAFL 处理、而 Kahuna 则表示串行 WAFL 处理。
      • 这两个逻辑域是互斥的、意味着 Kahuna 可以在 1 个 CPU 上处于活动状态、也可以WAFL_ex 在 1 个以上的 CPU 上处于活动状态、但 Kahuna 和WAFL_Ex 两者都不能同时处于活动状态。
    • 根据工作量的不同、 Kahuna 可以限制可以执行的工作量WAFL_ex
      • 注意: 此类瓶颈与先前的情况相比只是一种简单的变化。

注意:如果不达到域瓶颈或平均 CPU 瓶颈,则无法在物理 CPU 核心上产生瓶颈。因此,将物理 CPU 利用率监控作为直接衡量标准并不有效。

注意:从 Data ONTAP 8.2.1 开始,用于表示 CPU 利用率(cpu_busy)的算法已更改,并且根据 CPU 核心总数,它具有不同的算法。 

  • <= 20 个 CPU 核cpu_busy返回以下两个值中较高的值:
    • 所有 CPU 核心的平均 CPU 利用率(avg_processor_busy

    • 并发性为 1 的最繁忙域的 CPU 利用率

  • >= 36 个 CPU 核cpu_busy 返回以下三个值中的最高值。对于具有 36 个或更多 CPU 核的平台,这些 CPU 核将分别均匀地分为两个分区。

    • 第一个分区(非 WAFL 分区)的平均 CPU 利用率

    • 第二个分区( WAFL 分区)的平均 CPU 利用率

    • 并发性为 1 的最繁忙域的 CPU 利用率

追加信息

附加信息 _text