Приложение D. Проверка ресурсов кластерных служб и ожидание восстановления

В этом приложении рассказывается о мониторинге кластерных ресурсов и изменении интервала проверки их статуса. Дополнительно рассматривается параметр __enforce_timeouts, определяющий время ожидания ответа службы.

Примечание

Здесь упоминаются параметры из файла /etc/cluster/cluster.conf, полный список которых можно найти в /usr/share/cluster/cluster.rng и /usr/share/doc/cman-X.Y.ZZ/cluster_conf.html (например, /usr/share/doc/cman-3.0.12/cluster_conf.html).

D.1. Интервал проверки статуса ресурса

rgmanager проверяет состояние отдельных ресурсов, а не служб. Дерево ресурсов будет проверяться каждые 10 секунд.
Интервал настраивается отдельно для разных агентов ресурсов. Его значение может быть явно переопределено при помощи элемента <action> в файле cluster.conf:
<action name="status" depth="*" interval="10" />
В cluster.conf эта строка определяется в секции ресурса. Так, чтобы переопределить интервал для файловой системы, можно добавить ресурс файловой системы в cluster.conf:

  <fs name="test" device="/dev/sdb3">
    <action name="status" depth="*" interval="10" />
    <nfsexport...>
    </nfsexport>
  </fs>

Некоторые агенты предоставляют несколько уровней проверки. Например, стандартный тест файловой системы (уровень 0) заключается в проверке монтирования в нужный каталог. С другой стороны, на уровне 10 будет проверена возможность чтения файлов в файловой системе, на уровне 20 — возможность записи. В приведенном выше примере используется шаблон depth="*", то есть указанные значения будут применяться ко всем уровням проверки файловой системы test.