8.6. Ceph 监控指标

表 8.2. 集群指标表

集合名称指标名称位字段值简短描述

cluster

num_mon

2

监控器数

 

num_mon_quorum

2

仲裁中的 monitor 数量

 

num_osd

2

OSD 的总数

 

num_osd_up

2

已启动的 OSD 数量

 

num_osd_in

2

集群中的 OSD 数量

 

osd_epoch

2

OSD map 的当前 epoch

 

osd_bytes

2

集群总容量(以字节为单位)

 

osd_bytes_used

2

集群中的已用字节数

 

osd_bytes_avail

2

集群中的可用字节数

 

num_pool

2

池数

 

num_pg

2

放置组总数

 

num_pg_active_clean

2

active+clean 状态的放置组数量

 

num_pg_active

2

处于活跃状态的放置组数量

 

num_pg_peering

2

处于 peering 状态的放置组数量

 

num_object

2

集群中的对象总数

 

num_object_degraded

2

降级数量(减少副本)对象

 

num_object_misplaced

2

对象中错误的原位(集群位置)数

 

num_object_unfound

2

未找到的对象数量

 

num_bytes

2

所有对象的字节数

 

num_mds_up

2

启动的 MDS 数量

 

num_mds_in

2

集群中的 MDS 数量

 

num_mds_failed

2

失败的 MDS 数量

 

mds_epoch

2

MDS 映射的当前 epoch

表 8.3. 级别数据库指标表

集合名称指标名称位字段值简短描述

leveldb

leveldb_get

10

Gets

 

leveldb_transaction

10

Transactions

 

leveldb_compact

10

Compactions

 

leveldb_compact_range

10

按范围完成

 

leveldb_compact_queue_merge

10

在压缩队列中合并范围

 

leveldb_compact_queue_len

2

压缩队列长度

表 8.4. 常规监控指标表

集合名称指标名称位字段值简短描述

mon

num_sessions

2

当前打开的 monitor 会话数量

 

session_add

10

创建的 monitor 会话数量

 

session_rm

10

monitor 中的 remove_session 调用数量

 

session_trim

10

修剪监控会话的数量

 

num_elections

10

参与的 elections monitor 数量

 

election_call

10

有 monitor 启动的选举数

 

election_win

10

监控可享受的选举数量

 

election_lose

10

监控丢失的选举数量

表 8.5. Paxos Metrics Table

集合名称指标名称位字段值简短描述

paxos

start_leader

10

以领导角色开始

 

start_peon

10

以 peon 角色启动

 

restart

10

重启

 

refresh

10

刷新

 

refresh_latency

5

刷新延迟

 

begin

10

启动和处理开始

 

begin_keys

6

开始时事务中的键

 

begin_bytes

6

开始时事务中的数据

 

begin_latency

5

开始操作的延迟

 

commit

10

提交

 

commit_keys

6

提交时事务中的键

 

commit_bytes

6

提交时事务中的数据

 

commit_latency

5

提交延迟

 

collect

10

peon 收集

 

collect_keys

6

peon collect 时事务中的键

 

collect_bytes

6

peon collect 时事务中的数据

 

collect_latency

5

peon 收集延迟

 

collect_uncommitted

10

在开始的和处理的 collect 中未提交的值

 

collect_timeout

10

收集超时

 

accept_timeout

10

接受超时

 

lease_ack_timeout

10

租期确认超时

 

lease_timeout

10

租期超时

 

store_state

10

在磁盘上存储共享状态

 

store_state_keys

6

存储在事务中的密钥

 

store_state_bytes

6

存储在存储状态下的事务中的数据

 

store_state_latency

5

存储状态延迟

 

share_state

10

状态共享

 

share_state_keys

6

共享状态的密钥

 

share_state_bytes

6

处于共享状态的数据

 

new_pn

10

新提议号查询

 

new_pn_latency

5

新的提议号获得延迟

表 8.6. throttle Metrics Table

集合名称指标名称位字段值简短描述

throttle-*

val

10

目前可用节流

 

max

10

最大值 throttle

 

get

10

Gets

 

get_sum

10

获取数据

 

get_or_fail_fail

10

在 get_or_fail 时被阻断

 

get_or_fail_success

10

在 get_or_fail 期间获得成功

 

take

10

Takes

 

take_sum

10

获取的数据

 

put

10

Puts

 

put_sum

10

放置数据

 

wait

5

等待延迟