第4章 環境に関する情報の収集
4.1. 監視および可観測性
この章では、Red Hat Virtualization システムからメトリクスとログを監視および取得するためのいくつかの方法について説明します。その方法には以下が含まれます。
- データウェアハウスと Grafana を使用して RHV を監視
- Elasticsearch のリモートインスタンスにメトリクスを送信
- Red Hat Virtualization Manager で Insight をデプロイ
4.1.1. データウェアハウスと Grafana を使用して RHV を監視
4.1.1.1. Grafana の概要
Grafana は、データベース名 ovirt_engine_history
で oVirt Data Warehouse PostgreSQL データベースから収集されたデータに基づいてレポートを表示するのに使用される Web ベースの UI ツールです。使用可能なレポートダッシュボードの詳細については、Grafana ダッシュボード および Grafana Web サイト - ダッシュボード を参照してください。
Manager からのデータは毎分収集され、1 時間ごとおよび 1 日ごとに集計されます。データは、エンジンセットアップ中にデータウェアハウス設定で定義されたスケール設定に従って保持されます (基本またはフルスケール)。
- Basic (デフォルト): サンプルデータは 24 時間、毎時データは 1 カ月間保存します。日次データは保存されません。
- Full (推奨) - サンプルデータは 24 時間、毎時データは 2 カ月間、日次集計は 5 年間保持されます。
Full サンプルスケーリングの場合、別の仮想マシンへの Data Warehouse の移行が必要となる場合があります。
- Data Warehouse のスケーリングの手順については、Data Warehouse サンプリングスケールの変更 を参照してください。
- Data Warehouse を別のマシンに移行するか、または別のマシンにインストールする手順については、別のマシンへの Data Warehouse の移行 および 別のマシンへの Data Warehouse のインストールおよび設定 を参照してください。
Data Warehouse データベース、Data Warehouse サービス、Grafana はそれぞれ別々のマシンにインストールできますが、Red Hat はこれらの各コンポーネントをすべて同じマシンにインストールする場合のみサポートします。
4.1.1.2. インストール
スタンドアロンマネージャーのインストールおよびセルフホスト型エンジンのインストールで Red Hat Virtualization Manager の engine-setup
を実行すると、Grafana 統合がデフォルトで有効になり、インストールされます。
Grafana はデフォルトではインストールされないため、以前のバージョンの RHV からのアップグレードの実行、バックアップの復元、Data Warehouse の別のマシンへの移行など、一部のシナリオでは手動でインストールする必要があります。
Grafana 統合を手動で有効にするには、以下を実行します。
環境をグローバルメンテナンスモードに切り替えます。
# hosted-engine --set-maintenance --mode=global
- Grafana をインストールするマシンにログインします。このマシンは、データウェアハウスが設定されているマシンと同じである必要があります (通常は Manager マシン)。
次のように
engine-setup
コマンドを実行します。# engine-setup --reconfigure-optional-components
Yes
と回答して、このマシンに Grafana をインストールします。Configure Grafana on this host (Yes, No) [Yes]:
グローバルメンテナンスモードを無効にします。
# hosted-engine --set-maintenance --mode=none
Grafana ダッシュボードにアクセスするには、以下を行います。
-
https://<engine FQDN or IP address>/ovirt-engine-grafana
にアクセスします。
または
- 管理ポータル の Web 管理ウェルカムページで Monitoring Portal をクリックします。
4.1.1.2.1. シングルサインオン用の Grafana の設定
Manager の engine-setup は、Manager の既存ユーザーが管理ポータルから SSO を使用してログインできるように Grafana を自動的に設定しますが、ユーザーを自動的に作成することはありません。新しいユーザーを作成 (Grafana UI で Invite
) し、新しいユーザーを確認すると、そのユーザーはログインできます。
- まだ定義されていない場合は、Manager でユーザーの電子メールアドレスを設定します。
- 既存の管理者ユーザー (最初に設定された管理者) で Grafana にログインします。
- Configuration → Users に移動し、Invite を選択します。
- メールアドレスおよび名前を入力し、Role を選択します。
次のいずれかのオプションを使用して招待状を送信します。
Send invite mail を選択し、Submit をクリックします。このオプションでは、Grafana マシンで設定された運用可能なローカルメールサーバーが必要です。
または
Pending Invites を選択します。
- 必要なエントリーを見つけます
- Copy invite を選択します
- このリンクをコピーして使用し、アカウントをブラウザーのアドレスバーに直接貼り付けるか、別のユーザーに送信してアカウントを作成します。
Pending Invites オプションを使用すると、電子メールは送信されません。つまり、実際にその電子メールアドレスが存在する必要はありません。Manager ユーザーの電子メールアドレスとして設定されている限り、有効なアドレスが機能します。
このアカウントでログインするには、以下を行います。
- この電子メールアドレスを持つアカウントを使用して、Red Hat Virtualization Web 管理のウェルカムページにログインします。
-
Monitoring Portal
を選択して、Grafana ダッシュボードを開きます。 - Sign in with oVirt Engine Auth を選択します。
4.1.1.3. ビルトイン Grafana ダッシュボード
Grafana の初期設定では、データセンター、クラスター、ホスト、および仮想マシンのデータをレポートするために、次のダッシュボードを使用できます。
表4.1 ビルトイン Grafana ダッシュボード
ダッシュボードタイプ | コンテンツ |
---|---|
Executive ダッシュボード |
|
Inventory ダッシュボード |
|
Service Level ダッシュボード |
|
Trend ダッシュボード |
|
Grafana ダッシュボードには、Red Hat Virtualization 管理ポータルへの直接リンクが含まれており、クラスター、ホスト、および仮想マシンの追加の詳細をすばやく表示できます。
4.1.1.4. カスタマイズされた Grafana ダッシュボード
レポートニーズに応じて、カスタマイズされたダッシュボードを作成したり、既存のダッシュボードをコピーして変更したりできます。
ビルトインダッシュボードはカスタマイズできません。
4.1.2. Elasticsearch のリモートインスタンスにメトリックとログを送信
Red Hat は Elasticsearch を所有または維持していません。このオプションをデプロイするには、Elasticsearch のセットアップとメンテナンスに精通している必要があります。
メトリクスデータおよびログを既存の Elasticsearch インスタンスに送信するように Red Hat Virtualization Manager およびホストを設定できます。
これを行うには、Manager とすべてのホストで collectd
および rsyslog
を設定する Ansible ロールを実行し、engine.log
、vdsm.log
、および collectd
メトリックを収集して、それらを Elasticsearch インスタンスに送信します。
利用可能なメトリクススキーマに関する説明が記載された完全なリストを含め、詳細は リモート Elasticsearch インスタンスへの RHV 監視データの送信 を参照してください。
4.1.2.1. collectd と rsyslog のインストール
collectd
と rsyslog
をホストにデプロイして、ログおよびメトリクスを収集します。
新しいホストに対してこの手順を繰り返す必要はありません。追加されるすべての新しいホストは、ホストのデプロイ中に Elasticsearch にデータを送信するように、Manager により自動的に設定されます。
手順
- SSH を使用して Manager マシンにログインします。
/etc/ovirt-engine-metrics/config.yml.example
をコピーして/etc/ovirt-engine-metrics/config.yml.d/config.yml
を作成します。# cp /etc/ovirt-engine-metrics/config.yml.example /etc/ovirt-engine-metrics/config.yml.d/config.yml
config.yml
のovirt_env_name
パラメーターとelasticsearch_host
パラメーターを編集し、ファイルを保存します。次の追加パラメーターをファイルに追加できます。use_omelasticsearch_cert: false rsyslog_elasticsearch_usehttps_metrics: !!str off rsyslog_elasticsearch_usehttps_logs: !!str off
-
証明書を使用する場合は、
use_omelasticsearch_cert
を true に設定します。 -
ログまたはメトリクスを無効にするには、
rsyslog_elasticsearch_usehttps_metrics
とrsyslog_elasticsearch_usehttps_logs
のいずれか 1 つ、または両方のパラメーターを使用します。
-
証明書を使用する場合は、
collectd
とrsyslog
をホストにデプロイします。# /usr/share/ovirt-engine-metrics/setup/ansible/configure_ovirt_machines_for_metrics.sh
configure_ovirt_machines_for_metrics.sh
スクリプトは、linux-system-roles
(Administration and configuration tasks using System Roles in RHEL を参照) を含む Ansible ロールを実行し、これを使用してホストにrsyslog
をデプロイおよび設定します。rsyslog
は、collectd
からメトリクスを収集し、Elasticsearch に送信します。
4.1.2.2. スキーマのログ記録およびログの分析
RHV から収集したデータをインタラクティブに探索できる Discover ページを使用します。収集された結果の各セットは、ドキュメント と呼ばれます。ドキュメントは、以下のログファイルから収集されます。
-
engine.log
- すべての oVirt Engine UI のクラッシュ、Active Directory ルックアップ、データベースの問題、およびその他のイベントが含まれます。 -
vdsm.log
- 仮想化ホスト上の Manager のエージェントである VDSM のログファイルであり、ホスト関連のイベントが含まれています。
次のフィールドを使用できます。
パラメーター | description |
---|---|
_id | ドキュメントの一意の ID |
_index |
ドキュメントが属するインデックスの ID。接頭辞として |
hostname | engine.log の場合、これは Manager のホスト名です。vdsm.log の場合、これはホストのホスト名です。 |
level | ログレコードの重大度: TRACE、DEBUG、INFO、WARN、ERROR、FATAL。 |
message | ドキュメントメッセージの本文。 |
ovirt.class | このログを生成した Java クラスの名前。 |
ovirt.correlationid | engine.log の場合のみ。この ID は、Manager によって実行される単一のタスクの複数の部分を相互に関連付けるために使用されます。 |
ovirt.thread | ログレコードが生成された Java スレッドの名前。 |
tag | データのフィルタリングに使用できる事前定義されたメタデータのセット。 |
@timestamp | レコードが発行された [time](Troubleshooting#information-is-missing-from-kibana)。 |
_score | 該当なし |
_type | 該当なし |
ipaddr4 | マシンの IP アドレス。 |
ovirt.cluster_name | vdsm.log の場合のみ。ホストが所属するクラスターの名前。 |
ovirt.engine_fqdn | マネージャーの FQDN。 |
ovirt.module_lineno |
|
4.1.3. Insights のデプロイ
Red Hat Virtualization Manager がインストールされている既存の Red Hat Enterprise Linux (RHEL) システムに Red Hat Insights をデプロイするには、以下のタスクを実行します。
- Red Hat Insights アプリケーションにシステムを登録します。
- Red Hat Virtualization 環境からのデータ収集を有効にします。
4.1.3.1. システムを Red Hat Insights に登録します。
Red Hat Insights サービスと通信し、Red Hat Insights コンソールに表示される結果を表示するには、システムを登録します。
[root@server ~]# insights-client --register
4.1.3.2. Red Hat Virtualization 環境からのデータ収集を有効にする
/etc/ovirt-engine/rhv-log-collector-analyzer/rhv-log-collector-analyzer.conf
ファイルを変更して、次の行を含めます。
upload-json=True
4.1.3.3. Insights の結果を Insights コンソールで確認
システムおよびインフラストラクチャーの結果は、Insights コンソール で確認できます。Overview
タブには、インフラストラクチャーに対する現在のリスクのダッシュボードビューが表示されます。この開始点から、特定のルールがシステムにどのように影響しているかを調査したり、システムベースのアプローチを使用して、システムにリスクをもたらすすべてのルールの一致を表示したりできます。
手順
Rule
hits by severity を選択し、インフラストラクチャーにもたらすTotal Risk
でルールを表示します (Critical
、Important
、Moderate
、またはLow
)。または、以下を実行します。
-
Rule
hits by category を選択し、インフラストラクチャーにもたらすリスクの種類を表示します (Availability
、Stability
、Performance
、またはSecurity
)。 - 特定のルールを名前で検索したり、ルールの一覧をスクロールして、Ansible Playbook のリスク、システム公開、および可用性に関するハイレベルな情報を確認して修正を自動化します。
- ルールをクリックして、ルールの説明を表示し、関連するナレッジベースの記事から詳細を確認し、影響を受けるシステムのリストを表示します。
- システムをクリックして、検出された問題に関する特定の情報と問題を解決するための手順を確認します。