OCP 4でCluster Autoscalerがノードをスケールダウンしない。
Environment
- Red Hat OpenShift Container Platform (RHOCP)
- 4
- Red Hat OpenShift Service on AWS (ROSA)
- 4
- Red Hat OpenShift Dedicated (OSD)
- 4
- Azure Red Hat OpenShift (ARO)
- 4
- OpenShift Managed (Azure)
- 4
- クラスターオートスケーラー
Issue
- OpenShift 4でCluster Autoscalerがノードをスケールダウンしない理由を確認する方法とは?
-
cluster-autoscaler
pod に、Cluster Autoscaler によるノードの削除を阻止するメッセージがあります。高速評価: ノード [node_name] は削除できません: ローカルストレージが存在するポッド。 [pod_name] [...] 高速評価: ノード [node_name] は削除できません: openshift-marketplace/[pod_name] はレプリケートされません。
Resolution
診断手順 のセクションに従って、ノードを削除できない理由を確認します。
表示されるメッセージが以下と類似している場合(同じ openshift-marketplace
namespace の他の Pod の場合):
高速評価:ノード [node_name_4] は削除できません。openshift-marketplace/[pod_name] は複製されません。
これは、ノードの削除を妨げるデフォルトの CatalogSource
Pod の既知のバグです。 このバグは、 BZ 2019963で追跡されており、修正は OCP 4.10.3 ですでに BZ 1927478 および errata RHSA-2022:0056.
その他の理由は個別に調査する必要があります。
Root Cause
クラスターオートスケーラー
がノードのスケールダウンを防ぐ理由がいくつかあります。 詳細は、 How does scale down works in Cluster Autoscaler in OCP 4? を参照してください。
Diagnostic Steps
クラスター Autoscaler
ログをチェックして、ノードを削除できない理由を確認します。
$ oc get pods -n openshift-machine-api
[...]
$ oc logs [cluster-autoscaler-pod_name] -n openshift-machine-api
[...]
I0101 00:00:15.318491 1 scale_down.go:443] Node [node_name_1] is not suitable for removal - cpu utilization too big (0.784667)
I0101 00:00:15.319167 1 scale_down.go:443] Node [node_name_2] is not suitable - cpu utilization too big (0.648667)
[...]
I0101 00:00:15.319931 1 cluster.go:148]です。Fast evaluation: [node_name_3] for removal
I0101 00:00:15.319940 1 cluster.go:169] です。Fast evaluation: ノード [node_name_3] cannot be removed: ローカル ストレージが存在するポッド: sonarqube-lts-sonarqube-lts-0
[...]
I0101 00:00:15.320002 1 cluster.go:148] Fast evaluation: [node_name_4] for removal
I0101 00:00:15.319978 1 cluster.go:169] Fast evaluation: node [node_name_4] cannot be removed: openshift-marketplace/addon-cluster-logging-operator-catalog-xxxxx is not replicated: openshift-marketplace/addon-cluster-logging-operator-catalog-xxxxx
は、Cluster Autoscalerの詳細またはログレベルを増やして、追加情報が表示されるかどうかを確認することもできます。
This solution is part of Red Hat’s fast-track publication program, providing a huge library of solutions that Red Hat engineers have created while supporting our customers. To give you the knowledge you need the instant it becomes available, these articles may be presented in a raw and unedited form.
Comments