'fio' を使用して OCP で Etcd ディスクのパフォーマンスをチェックする方法
Issue
- etcd にはデリケートなディスク応答要件があり、多くの場合、etcd がバッキングストレージに書き込む速度が実稼働ワークロードに対して十分に高速であることを確認する必要があります。
-
Web コンソールからの etcd アラート、または以下のような頻繁なエラーメッセージは、書き込みに時間がかかりすぎていることを示唆している可能性があります。
2020-10-21T09:56:00.246667768Z 2020-10-21 09:56:00.246542 W | etcdserver: read-only range request "key:\"/kubernetes.io/serviceaccounts/openshift-kube-scheduler/localhost-recovery-client\" " with result "range_response_count:1 size:407" took too long (113.372697ms) to execute
-
etcd のパフォーマンス に関するドキュメントによると、実稼働ワークロードで
wal_fsync_duration_seconds
p99 の期間が 10ms 未満である場合は、ディスクの速度が適度に高速であることが確認できるとされています。 - ディスク速度の問題の重大度に応じて、アラートの頻発からクラスター全体の不安定化にいたるまでの影響が及ぶ可能性があります。
- インフラストラクチャー要件に関する一般的な情報については、Backend Performance Requirements for OpenShift etcd を参照してください。
Environment
- Red Hat OpenShift Container Platform (RHOCP、OCP)
- 3.11
- 4
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.