Red Hat Training

A Red Hat training course is available for Red Hat Enterprise Linux

2.2. 隔離總覽

在一個叢集系統中能有多個節點負責處理重大的生產資料。在忙碌、多節點的叢集中,節點可能會運作異常或變得無法使用,並提示管理員進行動作。異常叢集節點所造成的問題可藉由建立一項 fencing(隔離)政策來避免。
「隔離」代表將節點由叢集的共享儲存裝置中移除。隔離會切斷所有來自共享儲存裝置的 I/O,以確保資料的完整性。叢集基礎結構會透過 STONITH 來進行隔離。
當 Pacemaker 發現一組節點失效時,它會與其它叢集基礎結構的元件進行通訊,告知該節點已失效。當向 STONITH 通知了節點失效時,它會將失效的節點隔離。其它叢集基礎結構的元件會決定該進行哪些動作,亦即會進行任何必要的復原動作。舉例來說,DLM 與 GFS2 收到節點失效的通知時,會暫時停止活動,直到偵測到 STONITH 已完成隔離失效節點為止。確認失效節點已經隔離後,DLM 與 GFS2 就會開始進行復原。DLM 會解除對於失效節點的鎖定;GFS2 會復原失效節點的日誌檔。
透過 STONITH 進行的節點等級隔離可配置各種受支援的隔離裝置,包括:
  • Uninterruptible Power Supply(UPS)— 一項含有電池的裝置,可被使用來在電源失效時隔離裝置
  • Power Distribution Unit(PDU)— 一項包含了多重電源輸出的裝置,使用於資料中心以提供純淨的電源,以及阻斷服務與電源隔離服務。
  • Blade power control devices — 安裝於資料中心裡的專門系統,配置來在失效事件發生時隔離叢集節點。
  • Lights-out devices — 用來管理叢集節點可用性的網路連接裝置,並且可讓管理員本機或遠端執行隔離、開啟/關閉電源以及其它服務