8.14. スナップショットのトラブルシューティング

  • 状況

    スナップショットの作成に失敗します。

    ステップ 1

    以下の手順で、ブリックがシンプロビジョニングされているかどうかを確認します。

    1. mount コマンドを実行して、ブリックパスにマウントされているデバイス名を確認します。以下に例を示します。
      # mount
      /dev/mapper/snap_lvgrp-snap_lgvol on /rhgs/brick1 type xfs (rw)
      /dev/mapper/snap_lvgrp1-snap_lgvol1 on /rhgs/brick2 type xfs (rw)
    2. 以下のコマンドを実行して、デバイスに論理ボリュームプール名があるかどうかを確認します。
      lvs device-name
      以下に例を示します。
      #  lvs -o pool_lv /dev/mapper/snap_lvgrp-snap_lgvol
         Pool
         snap_thnpool
      
      
      
      Pool フィールドが空の場合は、ブリックはシンプロビジョニングされません。
    3. ブリックがシンプロビジョニングされていることを確認し、スナップショットの作成コマンドを再試行します。

    ステップ 2

    以下の手順を実行して、ブリックがダウンしているかどうかを確認します。

    1. 以下のコマンドを実行して、ボリュームのステータスを確認します。
      # gluster volume status VOLNAME
    2. ブリックがダウンしている場合は、以下のコマンドを実行してブリックを起動します。
      # gluster volume start VOLNAME force
    3. ブリックが稼働中かどうかを確認するには、以下のコマンドを実行します。
      # gluster volume status VOLNAME
    4. snapshot create コマンドを再試行します。

    ステップ 3

    以下の手順に従って、ノードがダウンしているかどうかを確認します。

    1. 以下のコマンドを実行して、ノードのステータスを確認します。
      # gluster volume status VOLNAME
    2. ブリックがステータスに記載されていない場合は、以下のコマンドを実行します。
      # gluster pool list
    3. 不足しているブリックをホストするノードのステータスが Disconnected の場合には、ノードの電源を切ります。
    4. snapshot create コマンドを再試行します。

    ステップ 4

    以下の手順に従い、リバランスが進行中かどうかを確認します。

    1. 以下のコマンドを実行して、リバランスのステータスを確認します。
      gluster volume rebalance VOLNAME status
    2. リバランスが進行中であれば、それが完了するまで待ちます。
    3. snapshot create コマンドを再試行します。
  • 状況

    スナップショットの削除に失敗します。

    ステップ 1

    以下の手順を実行してサーバークォーラムを満たしているかどうかを確認します。

    1. 以下のコマンドを実行してピアのステータスを確認します。
      # gluster pool list
    2. ノードがダウンし、クラスターがクォーラムでない場合は、ノードの電源をオンにします。
    3. クラスターがクォーラムにあることを確認するには、以下のコマンドを実行します。
      # gluster pool list
    4. snapshot delete コマンドを再試行します。
  • 状況

    コミットフェーズ中に一部のノードでスナップショットの削除コマンドに失敗し、システムの整合性が保たれます。

    解決策

    1. 削除コマンドに失敗したノードを特定します。この情報は、削除コマンドの出力で利用できます。以下に例を示します。
      # gluster snapshot delete snapshot1
      Deleting snap will erase all the information about the snap. Do you still want to continue? (y/n) y
      snapshot delete: failed: Commit failed on 10.00.00.02. Please check log file for details.
      Snapshot command failed
    2. delete コマンドが失敗するノードで、以下のコマンドを使用して glusterd を停止します。
      RHEL 7 および RHEL 8 で以下を実行します。
      # systemctl stop glusterd
      RHEL 6 で以下を実行します。
      # service glusterd stop
      重要
      Red Hat Gluster Storage は 3.5 Batch Update 1 以降では、Red Hat Enterprise Linux 6 (RHEL 6) でサポートされません。インストールガイドの『バージョンの詳細』表および『Red Hat Gluster Storage ソフトウェアコンポーネントおよびバージョン』 を参照してください。
    3. そのノードから /var/lib/glusterd/snaps/ 内の特定の snaps リポジトリーを削除します。以下に例を示します。
      # rm -rf /var/lib/glusterd/snaps/snapshot1
    4. 以下のコマンドを使用して、そのノードで glusterd を起動します。
      RHEL 7 および RHEL 8 で以下を実行します。
      # systemctl start glusterd
      RHEL 6 で以下を実行します。
      # service glusterd start.
      重要
      Red Hat Gluster Storage は 3.5 Batch Update 1 以降では、Red Hat Enterprise Linux 6 (RHEL 6) でサポートされません。インストールガイドの『バージョンの詳細』表および『Red Hat Gluster Storage ソフトウェアコンポーネントおよびバージョン』 を参照してください。
    5. 1st ステップでコミットが特定に失敗したすべてのノードで 2 番目の、3 番目のステップ、および 4 番目のステップを繰り返します。
    6. スナップショットの削除を再試行します。以下に例を示します。
      # gluster snapshot delete snapshot1
  • 状況

    スナップショットの復元に失敗します。

    ステップ 1

    以下の手順を実行してサーバークォーラムを満たしているかどうかを確認します。

    1. 以下のコマンドを実行してピアのステータスを確認します。
      # gluster pool list
    2. ノードがダウンし、クラスターがクォーラムでない場合は、ノードの電源をオンにします。
    3. クラスターがクォーラムにあることを確認するには、以下のコマンドを実行します。
      # gluster pool list
    4. スナップショットの復元コマンドを再試行します。

    ステップ 2

    以下の手順に従い、ボリュームが Stop 状態かどうかを確認します。

    1. 以下のコマンドを実行して、ボリューム情報を確認します。
      # gluster volume info VOLNAME
    2. ボリュームが Started 状態にある場合は、以下のコマンドを使用してボリュームを停止します。
      gluster volume stop VOLNAME
    3. スナップショットの復元コマンドを再試行します。
  • 状況

    スナップショットコマンドは失敗します。

    ステップ 1

    以下の手順に従い、オペレーティングシステムのバージョンに不一致があるかどうかを確認します。

    1. 以下のファイルを開き、操作バージョンを確認します。
      /var/lib/glusterd/glusterd.info
      operating-version が 30000 未満の場合、クラスターが動作するバージョンでスナップショットコマンドはサポートされません。
    2. クラスター内の全ノードを Red Hat Gluster Storage 3.2 以降にアップグレードします。
    3. snapshot コマンドを再試行します。
  • 状況

    ローリングアップグレードの後に、スナップショット機能は機能しません。

    解決策

    スナップショットを有効にするには、クラスターで以下の変更を加える必要があります。

    1. 以下のコマンドを使用してボリュームを再起動します。
      # gluster volume stop VOLNAME
      # gluster volume start VOLNAME
    2. すべてのノードで glusterd サービスを再起動します。
      RHEL 7 および RHEL 8 で以下を実行します。
      # systemctl restart glusterd
      RHEL 6 で以下を実行します。
      # service glusterd restart
      重要
      Red Hat Gluster Storage は 3.5 Batch Update 1 以降では、Red Hat Enterprise Linux 6 (RHEL 6) でサポートされません。インストールガイドの『バージョンの詳細』表および『Red Hat Gluster Storage ソフトウェアコンポーネントおよびバージョン』 を参照してください。