Red Hat Training

A Red Hat training course is available for OpenShift Container Platform

第37章 失敗した etcd メンバーの置き換え

一部の etcd メンバーが失敗しても、依然として etcd メンバーのクォーラム (定足数) がある場合、残りの etcd メンバーおよびそれらに含まれるデータを使用して、etcd またはクラスターのダウンタイムなしに etcd メンバーを追加できます。

37.1. 失敗した etcd メンバーの削除

新規の etcd ノードを追加する前に、失敗したノードを削除します。

手順

  1. アクティブな etcd ホストから、失敗した etcd ノードを削除します。

    # etcdctl -C https://<surviving host IP>:2379 \
      --ca-file=/etc/etcd/ca.crt     \
      --cert-file=/etc/etcd/peer.crt     \
      --key-file=/etc/etcd/peer.key cluster-health
    
    # etcdctl -C https://<surviving host IP>:2379 \
      --ca-file=/etc/etcd/ca.crt     \
      --cert-file=/etc/etcd/peer.crt     \
      --key-file=/etc/etcd/peer.key member remove <failed member identifier>
  2. etcd Pod 定義を削除して、失敗した etcd メンバーで etcd サービスを停止します。

    # mkdir -p /etc/origin/node/pods-stopped
    # mv /etc/origin/node/pods/* /etc/origin/node/pods-stopped/
  3. etcd ディレクトリーの内容を削除します。

    重要

    コンテンツを削除する前に、このディレクトリーをクラスター外の場所にバックアップすることが推奨されます。復元が成功した後、このバックアップを削除できます。

    # rm -rf /var/lib/etcd/*