Red Hat Training

A Red Hat training course is available for RHEL 8

Capítulo 10. Configuração do tempo máximo para recuperação de erros de armazenamento com eh_deadline

Você pode configurar o tempo máximo permitido para recuperar dispositivos SCSI falhos. Esta configuração garante um tempo de resposta de E/S mesmo quando o hardware de armazenamento fica sem resposta devido a uma falha.

10.1. O parâmetro eh_deadline

O mecanismo de tratamento de erros SCSI (EH) tenta realizar a recuperação de erros em dispositivos SCSI falhos. O objeto host SCSI eh_deadline permite configurar a quantidade máxima de tempo para a recuperação. Após o tempo configurado expirar, o SCSI EH pára e restabelece todo o adaptador do barramento host (HBA).

O uso do site eh_deadline pode reduzir o tempo:

  • para fechar um caminho fracassado,
  • para mudar um caminho, ou
  • para desativar uma fatia RAID.
Atenção

Quando eh_deadline expira, SCSI EH restabelece a HBA, que afeta todos os caminhos alvo dessa HBA, e não apenas o de falha. Se alguns dos caminhos redundantes não estiverem disponíveis por outros motivos, podem ocorrer erros de E/S. Habilite eh_deadline somente se você tiver uma configuração multipath totalmente redundante em todos os alvos.

Cenários quando eh_deadline é útil

Na maioria dos cenários, você não precisa habilitar eh_deadline. Usar eh_deadline pode ser útil em certos cenários específicos, por exemplo, se ocorrer uma perda de link entre uma chave de canal de fibra (FC) e uma porta de destino, e a HBA não receber notificações de mudança de estado registrada (RSCNs). Neste caso, os pedidos de E/S e os comandos de recuperação de erros são sempre enviados ao invés de encontrar um erro. A configuração de eh_deadline neste ambiente coloca um limite superior no tempo de recuperação. Isso permite que as E/S falhadas sejam novamente testadas em outro caminho disponível pela DM Multipath.

Sob as seguintes condições, a funcionalidade eh_deadline não oferece nenhum benefício adicional, pois os comandos de E/S e recuperação de erros falham imediatamente, o que permite que a DM Multipath volte a tentar:

  • Se as RSCNs estiverem habilitadas
  • Se a HBA não registrar o link ficando indisponível

Possíveis valores

O valor do eh_deadline é especificado em segundos.

A configuração padrão é off, o que desativa o limite de tempo e permite que toda a recuperação do erro ocorra.