8.8. OSD ノードでのオペレーティングシステムのアップグレード失敗からの復旧

システム管理者は、手動で Ceph OSD ノードとそのオペレーティングシステムをアップグレード する手順に障害が発生した場合に、以下の手順に従って障害から回復することができます。この手順では、ノードに Red Hat Enterprise Linux 8.4 を新規インストールし、OSD が停止している間にダウンしていた書き込み以外に、データを大幅に埋め戻すことなく OSD を回復できます。

重要

OSD をサポートするメディアや、それぞれの wal.db データベースまたは block.db データベースには影響を及ぼさないようにしてください。

前提条件

  • 稼働中の Red Hat Ceph Storage クラスターがある。
  • アップグレードに失敗した OSD ノード。
  • Red Hat Enterprise Linux 8.4 のインストールソースにアクセスできる。

手順

  1. 障害のあるノードで Red Hat Enterprise Linux 8.4 の標準的なインストールを実行し、Red Hat Enterprise Linux リポジトリーを有効にします。

  2. Red Hat Enterprise Linux 8 用の Red Hat Ceph Storage 4 用のリポジトリーを有効にします。

    1. tools リポジトリーを有効にします。

      # subscription-manager repos --enable=rhceph-4-tools-for-rhel-8-x86_64-rpms
    2. osd リポジトリーを有効にします。

      # subscription-manager repos --enable=rhceph-4-osd-for-rhel-8-x86_64-rpms
  3. ceph-osd パッケージをインストールします。

    # dnf install ceph-osd
  4. アップグレードされていないノードから、またはそれらのファイルがすでに復元されているノードから、ceph.conf ファイルを /etc/ceph に復元します。
  5. OSD サービスを起動します。

    # systemctl start ceph-osd.target
  6. オブジェクトストアデバイスをアクティブにします。

    ceph-volume lvm activate --all
  7. OSD のリカバリーおよびクラスターのバックフィルが、復旧した OSD への書き込みを確認します。

    # ceph -w

    すべての PG が active+clean の状態になるまで、出力を監視します。