Red Hat Training

A Red Hat training course is available for RHEL 8

7.3. El sistema de archivos GFS2 se cuelga y requiere el reinicio de todos los nodos

Si su sistema de archivos GFS2 se cuelga y no devuelve los comandos que se ejecutan en él, requiriendo que reinicie todos los nodos del clúster antes de utilizarlo, compruebe los siguientes problemas.

  • Es posible que haya fallado una valla. Los sistemas de archivos GFS2 se congelan para garantizar la integridad de los datos en caso de que falle una valla. Compruebe los registros de mensajes para ver si hay algún vallado fallido en el momento del cuelgue. Asegúrese de que el cercado está configurado correctamente.
  • Es posible que el sistema de archivos GFS2 se haya retirado. Busque en los registros de mensajes la palabra withdraw y compruebe si hay mensajes y rastros de llamadas de GFS2 que indiquen que el sistema de archivos se ha retirado. Una retirada es indicativa de una corrupción del sistema de archivos, un fallo de almacenamiento o un error. Cuando sea conveniente desmontar el sistema de archivos, deberá realizar el siguiente procedimiento:

    1. Reinicie el nodo en el que se produjo la retirada.

      # /sbin/reboot
    2. Detenga el recurso del sistema de archivos para desmontar el sistema de archivos GFS2 en todos los nodos.

      # pcs resource disable --wait=100 mydata_fs
    3. Capture los metadatos con el comando gfs2_edit savemeta…​. Debe asegurarse de que hay espacio suficiente para el archivo, que en algunos casos puede ser grande. En este ejemplo, los metadatos se guardan en un archivo en el directorio /root.

      # gfs2_edit savemeta /dev/vg_mydata/mydata /root/gfs2metadata.gz
    4. Actualice el paquete gfs2-utils.

      # sudo yum update gfs2-utils
    5. En un nodo, ejecute el comando fsck.gfs2 en el sistema de archivos para asegurar la integridad del sistema de archivos y reparar cualquier daño.

      # fsck.gfs2 -y /dev/vg_mydata/mydata > /tmp/fsck.out
    6. Una vez finalizado el comando fsck.gfs2, vuelva a habilitar el recurso del sistema de archivos para que vuelva a estar en servicio:

      # pcs resource enable --wait=100 mydata_fs
    7. Abra un ticket de soporte con el Soporte de Red Hat. Infórmeles de que ha experimentado una retirada de GFS2 y proporcione los registros y la información de depuración generada por los comandos sosreports y gfs2_edit savemeta.

      En algunos casos de retirada de GFS2, los comandos que intentan acceder al sistema de archivos o a su dispositivo de bloques pueden colgarse. En estos casos se requiere un reinicio duro para reiniciar el clúster.

      Para obtener información sobre la función de retirada de GFS2, consulte Sistema de archivos GFS2 no disponible para un nodo (la función de retirada de GFS2).

  • Este error puede ser indicativo de un problema de bloqueo o error. Recopile datos durante una de estas ocurrencias y abra un ticket de soporte con el Soporte de Red Hat, como se describe en Recopilación de datos de GFS2 para la resolución de problemas.