11.11.2. リバランス中の表示

ボリュームリバランス操作の状態を表示するには、次のコマンドを使用します。
# gluster volume rebalance VOLNAME status
以下に例を示します。
# gluster volume rebalance test-volume status
Node          Rebalanced size   scanned failures skipped status      run time
              -files					                                       in h:m:s
------------- ---------- ------ ------- -------- ------- ----------- --------
localhost   71962      70.3GB 380852  0        0       in progress 2:02:20
server1     70489      68.8GB 502185  0        0       in progress 2:02:20
server2     70704      69.0GB 507728  0        0       in progress 2:02:20
server3     71819      70.1GB 435611  0        0       in progress 2:02:20
Estimated time left for rebalance to complete :        2:50:24
リバランス操作は、ボリュームの各ノードでリバランスプロセスを開始します。各プロセスは、独自の個別ノード上のファイルをリバランスします。リバランスステータスの出力の各行は、単一ノードでの操作の進捗を示します。
以下の表は、リバランスステータスコマンドの出力を示しています。

表11.2 リバランスステータスの出力の説明

プロパティー名 説明
ノード ノードの名前。
Rebalanced-files 正常に移行されたファイルの数。
size 移行されたファイルの合計サイズ。
スキャン済み ノード上でスキャンしたファイルの数。これには、移行したファイルが含まれます。
failures エラーが原因で移行できなかったファイルの数。
skipped さまざまなエラーや理由でスキップされたファイルの数。
status ノードのリバランス操作のステータスは in progresscompleted、および or failed です。
run time in h:m:s プロセスがノードで実行されている時間。
全ノードでリバランスが完了するまでの推定時間も表示されます。完了までの推定時間は、リバランス操作が 10 分間実行された後にのみ表示されます。残り時間が大きすぎる場合、完了までの推定時間は >2 months として表示されます。ユーザーは、後で再度確認することが推奨されます。
リバランス操作の完了にかかる時間は、ブリックにあると予想されるファイルの数と、リバランスプロセスでファイルを処理する速度により異なります。この値は、リバランスステータスコマンドが実行されるたびに再計算され、リバランスの実行時間が長く、大きなデータセットに対してより正確になります。この計算では、ファイルシステムのパーティションにブリックが 1 つ含まれることを前提としています。
リバランス操作は、すべてのノードのステータスが完了すると completed とみなされます。以下に例を示します。
  # gluster volume rebalance test-volume status
  Node       Rebalanced  size   scanned failures skipped status     run time
              -files					                                      in h:m:s
  ---------- ---------- ----- ------- -------- ------- -----------  --------
  node2         0       0Bytes       0       0       0   completed   0:02:23
  node3       234      737.8KB    3350       0     257   completed   0:02:25
  node4         3        14.6K      71       0       6   completed   0:00:02
localhost   317	       1.1MB	  3484       0     155   completed   0:02:38
  volume rebalance: test-volume: success
今回のリリースにより、リバランス操作時にスキップされたファイルの詳細を取得できるようになりました。このようなすべてのファイルのエントリーは、メッセージ ID 109126 の rebalance log で利用できます。ログファイルからメッセージ ID を検索し、省略されたファイルの一覧を取得できます。
以下に例を示します。
# grep -i 109126 /var/log/glusterfs/test-volume-rebalance.log
[2018-03-15 09:14:30.203393] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-fs-orangefs.
[2018-03-15 09:14:31.262969] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-devices.
[2018-03-15 09:14:31.842631] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-devices-system-cpu.
[2018-03-15 09:14:33.733728] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/testing/sysfs-bus-fcoe.
[2018-03-15 09:14:35.576404] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/testing/sysfs-bus-iio-frequency-ad9523.
[2018-03-15 09:14:43.378480] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/DocBook/kgdb.tmpl.
失敗したファイルの詳細は、rebalance.log ファイルで「migrate-data failed」を検索します。ただし、リバランスに失敗したファイルの数は、rebalance.log で「migrate-data failed」と照合されません。これは、失敗した数に、考えられる失敗がすべて含まれ、ファイルの移行だけではないためです。