Red Hat Training

A Red Hat training course is available for RHEL 8

7.3. O sistema de arquivo GFS2 fica pendurado e requer a reinicialização de todos os nós

Se seu sistema de arquivos GFS2 estiver pendurado e não retornar comandos executados contra ele, exigindo que você reinicie todos os nós do cluster antes de usá-lo, verifique as seguintes questões.

  • Você pode ter tido uma cerca fracassada. Os sistemas de arquivos GFS2 congelarão para garantir a integridade dos dados no caso de uma cerca falhada. Verifique os registros de mensagens para ver se há alguma cerca falhada no momento do enforcamento. Certifique-se de que as cercas estejam configuradas corretamente.
  • O sistema de arquivos GFS2 pode ter sido retirado. Verifique através dos registros de mensagens a palavra withdraw e verifique se há mensagens e traços de chamadas do GFS2 indicando que o sistema de arquivo foi retirado. Uma retirada é indicativa de corrupção do sistema de arquivos, falha no armazenamento ou um bug. No primeiro momento em que for conveniente desmontar o sistema de arquivo, você deve realizar o seguinte procedimento:

    1. Reiniciar o nó em que ocorreu a retirada.

      # /sbin/reboot
    2. Parar o recurso do sistema de arquivos para desmontar o sistema de arquivos GFS2 em todos os nós.

      # pcs resource disable --wait=100 mydata_fs
    3. Capture os metadados com o comando gfs2_edit savemeta…​. Você deve garantir que haja espaço suficiente para o arquivo, que em alguns casos pode ser grande. Neste exemplo, os metadados são salvos em um arquivo no diretório /root.

      # gfs2_edit savemeta /dev/vg_mydata/mydata /root/gfs2metadata.gz
    4. Atualize o pacote gfs2-utils.

      # sudo yum update gfs2-utils
    5. Em um nó, execute o comando fsck.gfs2 no sistema de arquivos para garantir a integridade do sistema de arquivos e reparar qualquer dano.

      # fsck.gfs2 -y /dev/vg_mydata/mydata > /tmp/fsck.out
    6. Após o comando fsck.gfs2 ter sido concluído, reative o recurso do sistema de arquivos para devolvê-lo ao serviço:

      # pcs resource enable --wait=100 mydata_fs
    7. Abra um ticket de suporte com o Red Hat Support. Informe-os que você experimentou uma retirada do GFS2 e forneça os logs e as informações de depuração geradas pelos comandos sosreports e gfs2_edit savemeta.

      Em alguns casos de retirada de um GFS2, comandos podem ser pendurados que estão tentando acessar o sistema de arquivos ou seu dispositivo de bloco. Nesses casos, é necessário um reinício rígido para reiniciar o cluster.

      Para informações sobre a função de retirada GFS2, consulte o sistema de arquivos GFS2 indisponível para um nó (a função de retirada GFS2).

  • Este erro pode ser indicativo de um problema de travamento ou bug. Reúna dados durante uma dessas ocorrências e abra um ticket de suporte com o Red Hat Support, como descrito em Gathering GFS2 data for troubleshooting.