RHEL5 上的 device-mapper-multipath 在检测存储故障导致的丢失路径时出现过多延迟,且不会产生 RSCN 或 loop/link 错误
Issue
- 当路径失败时,多路径切换到另一个路径需要超过 5 分钟的时间
- 使用基于 RDAC 的存储阵列,mpath_prio_rdac 优先级调用例程在存储没有响应时可能要花费 300 秒才失败,从而延迟了路径故障转移。
- 两个(冗余的)交换机中的一个发生故障,并取消对该交换机提供的 LUN 的分区
- 虽然有剩余的活跃路径,但应用程序在等待投票磁盘的 I/O 时超时,而多路径在 SCSI 层上等待路径失败
- 不产生寄存器状态更改通知(RSCN)或 loop/link 错误的结构上的任何故障都将至少需要 300 秒才能在 scsi 层上超时,导致 mpath 映射这么长时间没有响应。
- 服务器可能会在负载下重启
Environment
- Red Hat Enterprise Linux (RHEL) 5
- 配置了 device-mapper-multipath(自动或通过 /etc/multipath.conf),以使用 tur 或 readsector0 路径检查器或 mpath_prio_rdac 优先级调用。
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.