大規模導入における Insights ガイドライン
Insights の使用方法はお客様によって異なるので、「万能型」といったテンプレートはありませんが、大型のデプロイメント用に Red Hat が Insights に用意している機能について今回ご紹介したいと思います。
これはベストプラクティスではなく、あくまでご検討いただく点としてお読みください。
デプロイメント
私は通常、Insights が SaaS であることでステップが最小限で済むことから、デプロイの容易さを強調しています。ただし、Insights を大規模で導入する場合はさらに簡単で、スタートガイド に加えて、 Puppet、 Chef および Ansible で利用可能なスクリプトも備えています。Insights が統合されている Satellite のバージョンを使ってこれらのシステムを管理している場合は、Insights の大量登録が組み込まれています (Satellite 提供の bootstrap スクリプトで)。
プロキシー
プロキシーは Insights の使用には必要ありませんが、大規模デプロイメントにおけるお客様のシステムは、個別 (または非接続環境) ではなく、プロキシー経由で Red Hat と通信するように設定されている場合が多くあります。
Insights はこのインフラストラクチャーモデルをクライアント内のオプションとしてプロキシーサポートでサポートしているので、システムが Red Hat のサーバーと通信する方法をお客様が変更する必要はありません。
Insights が統合されているバージョンの Satellite をお使いの場合は、プロキシーとして使用することが可能です。
頻度
デフォルトでは、Insights が情報を送信する頻度は 1 日 1 回で、Red Hat ではほとんどのアカウントのニーズがこれで満たされていると認識しています。
ただし、これらの全クライアントがネットワーク上でチェックインしたりペイロードを送信したりする影響について気になる場合もあるかと思います。これに対応するために、Insights クライアントが自動でチェックイン時間をずらすようにする機能をデフォルトで実装しました。これにより、同時にすべてのクライアントがチェックインするのではなく、個別またはランダムのグループでチェックインするようになります。これは設定なしで実行されます。
さらなる機能をお求めの場合は、Insights クライアントを cron (RHEL 6 を使用) または systemd (RHEL 7.5 以降を使用) でカスタマイズすると、スケジュールを完全にコントロールすることが可能です。
グループ化
さらに「グループ化」という機能もあります。これにより、(目的やローカライゼーションといった) 会社の基準をベースにした修復のプラニングが可能になり、インフラストラクチャーの制御幅が広がります。
一般的なグループ分けには以下のものが挙げられます:
-
環境 (実稼働 / 開発 / QA /ステージ、など)
-
人または部門別グループ (Amaya のシステム / Insights チーム)
-
ビジネスクリティカルなシステム (Hadoop / Oracle 、など)
-
地理的位置 (EMEA / 北米 / 中南米 / アジア太平洋)
これらのほとんどは、お客様がワークフローに沿って作成されます。ただし、Satellite や Tower などの他のツールで既に使用されているグループについては、これを複製することができます。
お使いのシステムで、特に大規模に大量のグループ化を検討されている場合は、登録時に Insights クライアントで --group 機能を使用されることをお勧めします。これを使用すると、それらのシステムの管理と体系化がすばやく実行できます。ただし、これは後で UI を使って手動で実行することもできます。もちろんこれらは Ansible や Chef、Puppet といったメソッドで自動化することも可能です。
修復
大規模な導入ではシステムのセットアップは検討事項の 1 つですが、Insights が設定されて 1000 台以上のシステムで問題が検出された場合に、どうやって対処すればよいでしょうか?
この点について、以下の方法が推奨されます:
-
Insights が生成した playbooks を Ansible 修復で使用して、インフラストラクチャーに影響を与える問題のフィクスを調整する。
-
プランナーを使って、アクションおよびシステム向けの修復プランを調整する。
-
最重要なシステム群にグループ化を適用し、アクションを大きく分ける。
-
影響度ごとに対処する - Insights 4 つの影響度 (リスク) レベルのいずれかをアクションに適用し、重要なものにフォーカスできるようにします。
-
実行可能なものから対処する - Insights は、変更による環境への影響に基づく、アクションの「変更リスク」も提供します。変更リスクが一番低い修復アクションは通常、ダウンタイムや調整が必要ありません。
Comments