Language:
Format:

2.4. 障害のある OSD ディスクの置き換え

OSD を置き換える一般的な手順には、OSD をストレージクラスターから削除し、ドライブを置き換えてから OSD を再作成する必要があります。

前提条件

稼働中の Red Hat Ceph Storage クラスターがある。
障害の発生したディスク。

手順

ストレージクラスターの正常性を確認します。
```
[root@mon ~]# ceph health
```
CRUSH 階層で OSD の場所を特定します。
```
[root@mon ~]# ceph osd tree | grep -i down
```
OSD ノードで、OSD の起動を試行します。
構文
```
systemctl start ceph-osd@OSD_ID
```
コマンドが OSD がすでに実行されていることを示す場合、ハートビートまたはネットワークの問題がある可能性があります。OSD を再起動できない場合は、ドライブが失敗する可能性があります。
注記
OSD が down すると、OSD は最終的に out とマークされます。Ceph Storage では、これは通常の動作です。OSD が out とマークすると、失敗した OSD のデータのコピーが含まれる他の OSD がバックフィルを開始し、必要な数のコピーがストレージクラスター内に存在していることを確認します。ストレージクラスターがバックフィル状態である間、クラスターの状態は degraded になります。
Ceph のコンテナー化されたデプロイメントでは、OSD_ID で OSD コンテナーの起動してみてください。
構文
```
systemctl start ceph-osd@OSD_ID
```
コマンドが OSD がすでに実行されていることを示す場合、ハートビートまたはネットワークの問題がある可能性があります。OSD を再起動できない場合は、ドライブが失敗する可能性があります。
注記
OSD に関連付けられたドライブは、コンテナー OSD ID をドライブにマッピング して判断できます。
失敗した OSD のマウントポイントを確認します。
注記
Ceph のコンテナー化されたデプロイメントでは、OSD がダウンし、OSD ドライブのマウントが解除されるため、df を実行してマウントポイントを確認することはできません。別の方法を使用して、OSD ドライブが失敗したかどうかを判別します。たとえば、コンテナーノードからドライブで smartctl を実行します。
```
[root@osd ~]# df -h
```
OSD を再起動できない場合は、マウントポイントを確認できます。マウントポイントが表示されない場合は、OSD ドライブを再マウントして OSD を再起動することができます。マウントポイントを復元できない場合は、OSD ドライブが失敗している可能性があります。
smartctl ユーティリティー cab を使用して、ドライブが正常かどうかを確認します。
構文
```
yum install smartmontools
smartctl -H /dev/BLOCK_DEVICE
```
例
```
[root@osd ~]# smartctl -H /dev/sda
```
ドライブに障害が発生した場合は、それを置き換える必要があります。
OSD プロセスを停止します。
構文
```
systemctl stop ceph-osd@OSD_ID
```
Ceph のコンテナー化されたデプロイメントの場合は、OSD コンテナーを停止します。
構文
```
systemctl stop ceph-osd@OSD_ID
```
ストレージクラスターから OSD を削除します。
構文
```
ceph osd out OSD_ID
```
失敗した OSD がバックフィルされていることを確認します。
```
[root@osd ~]# ceph -w
```
CRUSH マップから OSD を削除します。
構文
```
ceph osd crush remove osd.OSD_ID
```
注記
この手順は、OSD を永続的に削除し、再デプロイしない場合にのみ必要になります。
OSD の認証キーを削除します。
構文
```
ceph auth del osd.OSD_ID
```
OSD のキーがリスト表示されていないことを確認します。
例
```
[root@osd ~]# ceph auth list
```
ストレージクラスターから OSD を削除します。
構文
```
ceph osd rm osd.OSD_ID
```
障害が発生したドライブパスのマウントを解除します。
構文
```
umount /var/lib/ceph/osd/CLUSTER_NAME-OSD_ID
```
例
```
[root@osd ~]# umount /var/lib/ceph/osd/ceph-0
```
注記
Ceph のコンテナー化されたデプロイメントでは、OSD がコンテナーがダウンし、OSD ドライブのマウントが解除されます。この場合、マウント解除するものがないため、この手順はスキップできます。
物理ドライブを置き換えます。ノードのハードウェアベンダーのドキュメントを参照してください。ドライブのホットスワップが可能である場合は、障害が発生したドライブを新しいドライブに置き換えます。ドライブがホットスワップできず、ノードに複数の OSD が含まれている場合は、物理ドライブを交換するためにノードを停止する必要がある場合があります。ノードを一時的に停止する必要がある場合は、バックフィルを防ぐためにクラスターを noout に設定できます。
例
```
[root@osd ~]# ceph osd set noout
```
ドライブを置き換えて、ノードとその OSD をオンラインに戻したら、noout 設定を削除します。
例
```
[root@osd ~]# ceph osd unset noout
```
新しいドライブを /dev/ ディレクトリーの下に表示されるように、ドライブパスを書き留めて作業を続行します。
OSD ドライブを特定し、ディスクをフォーマットします。
OSD を再作成します。
1. Ceph Ansible の使用
2. コマンドラインインターフェイスの使用
CRUSH 階層をチェックして、これが正確であることを確認します。
例
```
[root@osd ~]# ceph osd tree
```
CRUSH 階層の OSD の場所が適切でない場合は、move コマンドを使用して移動できます。
構文
```
ceph osd crush move BUCKET_TO_MOVE BUCKET_TYPE=PARENT_BUCKET
```
OSD がオンラインであることを確認します。

Select Your Language

2.4. 障害のある OSD ディスクの置き換え

Quick Links

Help

Site Info

Related Sites

About

Red Hat legal and privacy links

Red Hat legal and privacy links

Language and Page Formatting Options

2.4. 障害のある OSD ディスクの置き換え

Quick Links

Help

Site Info

Related Sites

Systems Status

About

Red Hat legal and privacy links

Red Hat legal and privacy links