如何避免在使用 2 个节点的集群和红帽高可用性集群中出现隔离循环的情况?
Issue
- 为什么应在与我的集群进行通信的 Red Hat High Availability 集群的网络中设置隔离设备?
- 如何防止在集群中出现隔离循环的问题?
- 在一个 2 节点集群中,当一个节点运行时出现网络问题,则另一个节点会被引导,并隔离当前活跃的节点
- 在使用
fence_scsi
配置的 2 节点集群中,如果节点因为网络问题而被隔离,我然后重启该节点,"活跃"节点会报告 SCSI 保留冲突和路径故障,因为重新引导的节点启动其服务。 - 在启动时服务器挂起,并显示错误消息"Joining fence domain"。
Environment
- 具有高可用性附加组件(High Availability Add-On)的 Red Hat Enterprise Linux (RHEL) 5 和更新的版本
- 具有 2 个节点的红帽高可用性集群(这个问题不适用于 3 个或更多节点集群)。
- 基于
cman
的集群:没有配置仲裁磁盘。 集群只能有 2 个投票,带有two_node="1"
设置。 - 基于
corosync
+votequorum
的集群:没有设置wait_for_all
(如果启用了two_node
,则会默认设置)。 - 集群隔离设备是基于 IP 的,可通过网络进行访问。
- 隔离设备通过不同的网络来访问集群与之通信的网络。 这实际上意味着,当集群无法互连时,两个节点都可以访问隔离设备。
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.