Red Hat Training
A Red Hat training course is available for Red Hat Enterprise Linux
7.2. Verlegen von Ressourcen wegen Ausfall
Beim Erstellen einer Ressource können Sie diese so konfigurieren, dass diese nach einer festgelegten Anzahl von Ausfällen auf einen anderen Knoten verlegt wird, indem Sie die Option
migration-threshold
für diese Ressource festlegen. Sobald dieser Grenzwert erreicht wurde, darf die Ressource nicht länger auf diesem Knoten ausgeführt werden, bis:
- der Administrator den Ausfallzähler der Ressource manuell mithilfe des Befehls
pcs resource failcount
zurücksetzt oder - der Wert für
failure-timeout
für diese Ressource erreicht wird.
Standardmäßig gibt es keinen Grenzwert.
Anmerkung
Das Einstellen einer
migration-threshold
für eine Ressource ist nicht dasselbe wie das Konfigurieren einer Ressource für die Migration, bei der eine Ressource ohne Zustandsverlust von einem Standort auf einen anderen verlegt wird.
Das folgende Beispiel fügt einen Migrationsgrenzwert von 10 zu der Ressource namens
dummy_resource
hinzu, was dazu führt, dass die Ressource nach 10 Ausfällen auf einen anderen Knoten wechselt.
# pcs resource meta dummy_resource migration-threshold=10
Mithilfe des folgenden Befehls können Sie einen Migrationsgrenzwert zu den Standards für den gesamten Cluster hinzufügen.
# pcs resource defaults migration-threshold=10
Verwenden Sie den Befehl
pcs resource failcount
, um den aktuellen Status und die aktuellen Grenzwerte für Ausfälle für die Ressource zu bestimmen.
Es gibt zwei Ausnahmen bei Migrationsgrenzwerten: wenn der Start oder der Stopp einer Ressource fehlschlägt. Ein Fehler beim Starten führt dazu, dass der Failcount auf
INFINITY
gesetzt wird und die Ressource sofort verlegt wird.
Beachten Sie, dass Fehler beim Stoppen dagegen anders gehandhabt werden. Falls der Stopp einer Ressource fehlschlägt und STONITH aktiviert ist, dann grenzt der Cluster den Knoten ab, um die Ressource woanders starten zu können. Falls STONITH nicht aktiviert ist, kann der Cluster nicht fortfahren und wird nicht versuchen, die Ressource woanders zu starten. Er wird dagegen erneut versuchen, nach Ablauf der Zeitüberschreitung die Ressource zu stoppen.