Red Hat Training

A Red Hat training course is available for Red Hat OpenStack Platform

5.11. 대규모 Ceph 클러스터의 재시작 지연 증가

업그레이드하는 동안 각 Ceph 모니터 및 OSD가 순차적으로 중지됩니다. 중지된 동일한 서비스가 성공적으로 다시 시작될 때까지 마이그레이션이 계속되지 않습니다. Ansible은 15초 동안 대기하고 서비스가 시작될 때까지 5번(재시도) 확인합니다. 서비스를 다시 시작하지 않으면 Operator가 개입할 수 있도록 마이그레이션이 중지됩니다.

Ceph 클러스터의 크기에 따라 재시도 또는 지연 값을 늘려야 할 수 있습니다. 이러한 매개변수 및 기본값의 정확한 이름은 다음과 같습니다.

 health_mon_check_retries: 5
 health_mon_check_delay: 15
 health_osd_check_retries: 5
 health_osd_check_delay: 15

이러한 매개변수의 기본값을 업데이트할 수 있습니다. 예를 들어 클러스터가 30번 검사하고 Ceph OSD가 확인될 때마다 40초 동안 기다린 다음, 각 확인 시 Ceph MON이 있는지 10초 동안 기다린 후 openstack overcloud deploy 명령을 사용하여 -e 를 사용하여 yaml 파일에 다음 매개 변수를 전달합니다.

parameter_defaults:
  CephAnsibleExtraConfig:
    health_osd_check_delay: 40
    health_osd_check_retries: 30
    health_mon_check_retries: 10
    health_mon_check_delay: 20