IOPS が低いときにワークロードのレイテンシが高くなるのはなぜですか?
環境
- ONTAP 9
- Data ONTAP 7-mode
回答
- ONTAPはリクエストが到着したときに応答し、リクエストが少ないワークロードは高いように見えますが、完全に問題なく応答します。
- IOPSが低いワークロード(5 IOPSと32KB/秒)では次のような効果が得られます。
- RAMキャッシュにないため、ディスクに移動する必要があります。
- サンプルサイズが大きくないため、 統計的には無関係と見なされます(追加情報で詳しく説明)。
- 異常値を平均化するのに十分なサンプルがない
- 別の言い方をすると、IOPSの低いワークロードは、他の症状(エラー、アプリケーションが応答しない、ネットワークの問題など)がない場合でも問題になりません。
- 低IOPSは一般に500~600 IOPS未満ですが、レイテンシの平均誤差が原因で、報告されるレイテンシは秒単位または数十秒単位の範囲に達する可能性があります。
- IOPSが低いボリュームのワークロードを増やすと、レイテンシの増加がレイテンシの原因であるかどうかを判断するのにさらに役立ちます。
追加情報
- 定義:
- 平均:平均、またはすべてのインスタンス値の合計をインスタンス数で割った値
- 中央値(Median):値が最小から最大に順序付けされている場合の中央のインスタンス値。
- モード:最も頻繁に発生するインスタンス値
- 数学の統計ブランチでは、平均、中央値、およびモードを使用して計算する必要があります。
例1: ある期間に3つのインスタンスで観察されたレイテンシ(たとえば1分間に3つの処理):1ミリ秒、100ミリ秒、1ミリ秒
- 平均:(1 + 100 + 1)/ 3 = 34 ms
- 中央値:1ミリ秒
- モード:1ミリ秒
- ONTAPでは平均レイテンシが発生することがよくありますが、この場合、中央値とモードはレイテンシが実際には非常に優れていることを示しています。
例2: 20個のインスタンスで観察されたレイテンシ(7ops /秒):1ミリ秒、1ミリ秒、1ミリ秒、100ミリ秒 1ミリ秒、1ミリ秒~1ミリ秒(19 @ 1ミリ秒、1 @ 100ミリ秒)
- 平均:(19 + 100)/ 20 = 5.95ミリ秒
- 中央値:1ミリ秒
- モード:1ミリ秒
- この場合、平均レイテンシは前の例よりも正確です。データが十分にあるため、数値の信頼性を高めることができます。