Red Hat Training

A Red Hat training course is available for Red Hat Enterprise Linux

7.2. Verlegen von Ressourcen wegen Ausfall

Beim Erstellen einer Ressource können Sie diese so konfigurieren, dass diese nach einer festgelegten Anzahl von Ausfällen auf einen anderen Knoten verlegt wird, indem Sie die Option migration-threshold für diese Ressource festlegen. Sobald dieser Grenzwert erreicht wurde, darf die Ressource nicht länger auf diesem Knoten ausgeführt werden, bis:
  • der Administrator den Ausfallzähler der Ressource manuell mithilfe des Befehls pcs resource failcount zurücksetzt oder
  • der Wert für failure-timeout für diese Ressource erreicht wird.
Standardmäßig gibt es keinen Grenzwert.

Anmerkung

Das Einstellen einer migration-threshold für eine Ressource ist nicht dasselbe wie das Konfigurieren einer Ressource für die Migration, bei der eine Ressource ohne Zustandsverlust von einem Standort auf einen anderen verlegt wird.
Das folgende Beispiel fügt einen Migrationsgrenzwert von 10 zu der Ressource namens dummy_resource hinzu, was dazu führt, dass die Ressource nach 10 Ausfällen auf einen anderen Knoten wechselt.
# pcs resource meta dummy_resource migration-threshold=10
Mithilfe des folgenden Befehls können Sie einen Migrationsgrenzwert zu den Standards für den gesamten Cluster hinzufügen.
# pcs resource defaults migration-threshold=10
Verwenden Sie den Befehl pcs resource failcount, um den aktuellen Status und die aktuellen Grenzwerte für Ausfälle für die Ressource zu bestimmen.
Es gibt zwei Ausnahmen bei Migrationsgrenzwerten: wenn der Start oder der Stopp einer Ressource fehlschlägt. Ein Fehler beim Starten führt dazu, dass der Failcount auf INFINITY gesetzt wird und die Ressource sofort verlegt wird.
Beachten Sie, dass Fehler beim Stoppen dagegen anders gehandhabt werden. Falls der Stopp einer Ressource fehlschlägt und STONITH aktiviert ist, dann grenzt der Cluster den Knoten ab, um die Ressource woanders starten zu können. Falls STONITH nicht aktiviert ist, kann der Cluster nicht fortfahren und wird nicht versuchen, die Ressource woanders zu starten. Er wird dagegen erneut versuchen, nach Ablauf der Zeitüberschreitung die Ressource zu stoppen.