2장. 디스크 오류 처리

스토리지 관리자는 스토리지 클러스터 수명 동안 일정 시점에서 디스크 오류를 처리해야 합니다. 실제 오류가 발생하기 전에 디스크 오류를 테스트하고 시뮬레이션하면 실제 일이 발생할 때 대비할 수 있습니다.

다음은 실패한 디스크를 교체하는 상위 수준 워크플로입니다.

  1. 실패한 OSD를 찾습니다.
  2. OSD 제거.
  3. 노드에서 OSD 데몬을 중지합니다.
  4. Ceph 상태를 확인합니다.
  5. CRUSH 맵에서 OSD를 제거합니다.
  6. OSD 권한 부여를 삭제합니다.
  7. 스토리지 클러스터에서 OSD를 제거합니다.
  8. 노드에서 파일 시스템을 마운트 해제합니다.
  9. 실패한 드라이브를 바꿉니다.
  10. OSD를 스토리지 클러스터에 다시 추가합니다.
  11. Ceph 상태를 확인합니다.

2.1. 사전 요구 사항

  • 실행 중인 Red Hat Ceph Storage 클러스터.
  • 오류가 발생한 디스크.