18.15. Remplacement d'un disque défaillant dans un RAID

Vous pouvez reconstruire les données des disques défaillants en utilisant les disques restants. Le niveau RAID et le nombre total de disques déterminent le nombre minimum de disques restants nécessaires pour une reconstruction réussie des données.

Dans cette procédure, le RAID /dev/md0 contient quatre disques. Le disque /dev/sdd est défaillant et vous devez le remplacer par le disque /dev/sdf.

Conditions préalables

  • Un disque de rechange pour le remplacement.
  • Le paquet mdadm est installé.

Procédure

  1. Vérifiez le disque défaillant :

    1. Consulter les journaux du noyau :

      # journalctl -k -f
    2. Recherchez un message similaire au suivant :

      md/raid:md0: Disk failure on sdd, disabling device.
      
      md/raid:md0: Operation continuing on 3 devices.
    3. Appuyer sur Ctrl+C pour quitter le programme journalctl.
  2. Marquer le disque défaillant comme défectueux :

    # mdadm --manage /dev/md0 --fail /dev/sdd
  3. Facultatif : Vérifiez si le disque défaillant a été marqué correctement :

    # mdadm --detail /dev/md0

    À la fin de la sortie se trouve une liste de disques dans le RAID /dev/md0 où le disque /dev/sdd a le statut faulty:

    Number   Major   Minor   RaidDevice State
       0       8       16        0      active sync   /dev/sdb
       1       8       32        1      active sync   /dev/sdc
       -       0        0        2      removed
       3       8       64        3      active sync   /dev/sde
    
       2       8       48        -      faulty   /dev/sdd
  4. Retirez le disque défaillant du RAID :

    # mdadm --manage /dev/md0 --remove /dev/sdd
    Avertissement

    Si votre RAID ne peut pas supporter une autre défaillance de disque, ne retirez aucun disque tant que le nouveau disque n'a pas l'état active sync. Vous pouvez surveiller la progression à l'aide de la commande watch cat /proc/mdstat.

  5. Ajoutez le nouveau disque au RAID :

    # mdadm --manage /dev/md0 --add /dev/sdf

    Le RAID /dev/md0 comprend maintenant le nouveau disque /dev/sdf et le service mdadm commencera automatiquement à copier les données des autres disques vers ce disque.

Vérification

  • Vérifiez les détails du tableau :

    # mdadm --detail /dev/md0

    Si cette commande affiche une liste de disques dans le RAID /dev/md0 où le nouveau disque a le statut spare rebuilding à la fin de la sortie, des données sont toujours copiées sur ce disque à partir d'autres disques :

    Number   Major   Minor   RaidDevice State
       0       8       16        0      active sync   /dev/sdb
       1       8       32        1      active sync   /dev/sdc
       4       8       80        2      spare rebuilding   /dev/sdf
       3       8       64        3      active sync   /dev/sde

    Une fois la copie des données terminée, le nouveau disque a l'état active sync.