Red Hat Training
A Red Hat training course is available for RHEL 8
Capítulo 10. Configuração do tempo máximo para recuperação de erros de armazenamento com eh_deadline
Você pode configurar o tempo máximo permitido para recuperar dispositivos SCSI falhos. Esta configuração garante um tempo de resposta de E/S mesmo quando o hardware de armazenamento fica sem resposta devido a uma falha.
10.1. O parâmetro eh_deadline
O mecanismo de tratamento de erros SCSI (EH) tenta realizar a recuperação de erros em dispositivos SCSI falhos. O objeto host SCSI eh_deadline
permite configurar a quantidade máxima de tempo para a recuperação. Após o tempo configurado expirar, o SCSI EH pára e restabelece todo o adaptador do barramento host (HBA).
O uso do site eh_deadline
pode reduzir o tempo:
- para fechar um caminho fracassado,
- para mudar um caminho, ou
- para desativar uma fatia RAID.
Quando eh_deadline
expira, SCSI EH restabelece a HBA, que afeta todos os caminhos alvo dessa HBA, e não apenas o de falha. Se alguns dos caminhos redundantes não estiverem disponíveis por outros motivos, podem ocorrer erros de E/S. Habilite eh_deadline
somente se você tiver uma configuração multipath totalmente redundante em todos os alvos.
Cenários quando eh_deadline é útil
Na maioria dos cenários, você não precisa habilitar eh_deadline
. Usar eh_deadline
pode ser útil em certos cenários específicos, por exemplo, se ocorrer uma perda de link entre uma chave de canal de fibra (FC) e uma porta de destino, e a HBA não receber notificações de mudança de estado registrada (RSCNs). Neste caso, os pedidos de E/S e os comandos de recuperação de erros são sempre enviados ao invés de encontrar um erro. A configuração de eh_deadline
neste ambiente coloca um limite superior no tempo de recuperação. Isso permite que as E/S falhadas sejam novamente testadas em outro caminho disponível pela DM Multipath.
Sob as seguintes condições, a funcionalidade eh_deadline
não oferece nenhum benefício adicional, pois os comandos de E/S e recuperação de erros falham imediatamente, o que permite que a DM Multipath volte a tentar:
- Se as RSCNs estiverem habilitadas
- Se a HBA não registrar o link ficando indisponível
Possíveis valores
O valor do eh_deadline
é especificado em segundos.
A configuração padrão é off
, o que desativa o limite de tempo e permite que toda a recuperação do erro ocorra.