Red Hat Enterprise Linux を実行している特定の EMC Clariion SAN のパスで、Device-mapper-multipath が終了したパスを誤って再度有効にする
Issue
LUN が EMC clariion アレイに失敗したときに、Multipathd が、アレイの LUN へのパスを誤って再有効にします (つまり、ホストとアレイとの間の物理パスには問題はありませんが、バックエンドのディスクに問題がありオフラインになるため、LUN に IO を行う試みがすべて失敗します)。
上述の LUN のいずれかに I/O を実行中、ディスクの不具合を模倣するために、バックエンドディスクをアレイから物理的に削除します。アプリケーションレベルで I/O が失敗せず、永久にハングアップします。これは、Red Hat カーネルのマルチパスドライバーがパスを適切に失敗させているにも関わらず、multipathd デーモンがパスを再度有効にし続けるため、パスが実行中の LUN へのパッシブパスなのか、それとも失敗している LUN へのパスなのか分からないようです。
この目的は、ディスクに障害が発生したときに、IO が結局はアプリケーションレベルで失敗するため、アプリケーションはディスクが失敗したことを認識し、適切な処置を行います (この例のアプリケーションは Oracle ASM です)。
Environment
- 以下のバージョンを含む Red Hat Enterprise Linux (RHEL)
- kernel-2.6.18-274.el5 より前の Red Hat Enterprise Linux 5 カーネル
 - kernel-2.6.32-220.el6 より前の Red Hat Enterprise Linux 6 カーネル
 
 - 
Device-mapper-multipath (すべてのバージョン)
queue_if_no_pathまたはno_path_retryが 1 より多い- emc_clariion パスチェッカーを使用
 
 - 
EMC Clariion SAN
- SAN を先に準備せずに SAN からディスクを物理的に削除 (ハードディスクの不具合を模倣)
 
 
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.