Red Hat Training

A Red Hat training course is available for Red Hat Ceph Storage

第3章 ネットワーク問題のトラブルシューティング

本章では、ネットワークとネットワークタイムプロトコル (NTP) に関する基本的なトラブルシューティングの手順を説明します。

3.1. 基本的なネットワーク問題のトラブルシューティング

Red Hat Ceph Storage は、信頼性のあるネットワーク接続に大きく依存しています。Ceph ノードは、ネットワークを使用して相互に通信します。ネットワークに問題があると、OSD フラッピングや OSD が間違って down とレポートされるなどの OSD に関する多くの問題が発生しかねません。ネットワーク問題は、モニターの clock skew エラーも引き起こします。また、パケット損失や高レイテンシー、帯域幅が制限される場合には、クラスターのパフォーマンスと安定性に影響が出ます。

手順: 基本的なネットワーク問題のトラブルシューティング

  1. Ceph 設定ファイルの cluster_networkpublic_network のパラメーターに適切な値が含まれているか確認します。
  2. ネットワークインターフェイスが起動していることを確認します。詳細については、カスタマーポータルの Basic Network troubleshooting を参照してください。
  3. Ceph のノードが短いホスト名を使って相互に接続できることを確認します。Red Hat Ceph Storage 2 の Installation Guide for Red Hat Enterprise Linux または Installation Guide for UbuntuSetting DNS Name Resolution セクションを参照してください。
  4. ファイアウォールを使用する場合は、Ceph のノードが適切なポートで相互に接続できることを確認します。Red Hat Ceph Storage 2 の Installation Guide for Red Hat Enterprise Linux または Installation Guide for UbuntuConfiguring Firewall セクションを参照してください。
  5. インターフェイスカウンターにエラーがないこと、ホスト間の接続のレイテンシーが期待値内であること、パケット損失が無いことを確認します。詳細はカスタマーポータルの "ethtool" コマンドは何ですか? このコマンドを使用して、ネットワークデバイスおよびインターフェイスの情報を取得する方法は? rx_fw_discards が原因でシステムがパケットを落とします のソリューションを参照してください。
  6. パフォーマンスに問題がある場合は、レイテンシーの確認のほかに、iperf ユーティリティーを使用してクラスターの全ノード間のネットワーク帯域幅を確認します。詳細はカスタマーポータルの What are the performance benchmarking tools available for Red Hat Ceph Storage? のソリューションを参照してください。
  7. 全ホストのネットワーク相互接続スピードが同じであることを確認してください。これが違うと、遅いノードが速いノードを遅らせる可能性があります。また、スイッチ間リンクが接続されているノードの集計帯域幅を処理できることを確認します。

その他の参照先

3.2. 基本的な NTP 問題のトラブルシューティング

本セクションでは、基本的な NTP 問題のトラブルシュートの手順を説明します。

手順: 基本的な NTP 問題のトラブルシューティング

  1. ntpd デーモンがモニターホストで稼働していることを確認します。

    # systemctl status ntpd
  2. ntpd が稼働していない場合は、これを有効にして開始します。

    # systemctl enable ntpd
    # systemctl start ntpd
  3. ntpd がクロックを正常に同期していることを確認します。

    $ ntpq -p
  4. 高度な NTP トラブルシュートの手順については、カスタマーポータルにある NTP 問題のトラブルシューティング のソリューションを参照してください。

その他の参照先