8.7. Ceph OSD 指标

表 8.7. 写回 Throttle Metrics Table

集合名称指标名称位字段值简短描述

WBThrottle

bytes_dirtied

2

脏数据

 

bytes_wb

2

写入数据

 

ios_dirtied

2

脏操作

 

ios_wb

2

写入操作

 

inodes_dirtied

2

等待写入的条目

 

inodes_wb

2

写入条目

表 8.8. 级别数据库指标表

集合名称指标名称位字段值简短描述

leveldb

leveldb_get

10

Gets

 

leveldb_transaction

10

Transactions

 

leveldb_compact

10

Compactions

 

leveldb_compact_range

10

按范围完成

 

leveldb_compact_queue_merge

10

在压缩队列中合并范围

 

leveldb_compact_queue_len

2

压缩队列长度

表 8.9. Objecter Metrics Table

集合名称指标名称位字段值简短描述

objecter

op_active

2

活跃操作

 

op_laggy

2

Laggy 操作

 

op_send

10

发送的操作

 

op_send_bytes

10

发送的数据

 

op_resend

10

重新发送操作

 

op_ack

10

提交回调

 

op_commit

10

操作提交

 

op

10

操作

 

op_r

10

读取操作

 

op_w

10

写操作

 

op_rmw

10

Read-modify-write 操作

 

op_pg

10

PG 操作

 

osdop_stat

10

Stat 操作

 

osdop_create

10

创建对象操作

 

osdop_read

10

读取操作

 

osdop_write

10

写操作

 

osdop_writefull

10

编写完整对象操作

 

osdop_append

10

附加操作

 

osdop_zero

10

将对象设置为零操作

 

osdop_truncate

10

截断对象操作

 

osdop_delete

10

删除对象操作

 

osdop_mapext

10

映射扩展操作

 

osdop_sparse_read

10

稀疏读取操作

 

osdop_clonerange

10

克隆范围操作

 

osdop_getxattr

10

Get xattr 操作

 

osdop_setxattr

10

设置 xattr 操作

 

osdop_cmpxattr

10

xattr 比较操作

 

osdop_rmxattr

10

删除 xattr 操作

 

osdop_resetxattrs

10

重置 xattr 操作

 

osdop_tmap_up

10

TMAP 更新操作

 

osdop_tmap_put

10

TMAP put 操作

 

osdop_tmap_get

10

TMAP get 操作

 

osdop_call

10

调用(执行)操作

 

osdop_watch

10

按对象操作监视

 

osdop_notify

10

通知对象操作

 

osdop_src_cmpxattr

10

多操作中的扩展属性比较

 

osdop_other

10

其他操作

 

linger_active

2

活跃的闲置操作

 

linger_send

10

发送的闲置操作

 

linger_resend

10

重新闲置操作

 

linger_ping

10

将 ping 发送到闲置操作

 

poolop_active

2

活跃池操作

 

poolop_send

10

发送池操作

 

poolop_resend

10

重组池操作

 

poolstat_active

2

Active get pool stat 操作

 

poolstat_send

10

池 stat 操作发送

 

poolstat_resend

10

重新设置池统计

 

statfs_active

2

statfs 操作

 

statfs_send

10

发送的 FS stats

 

statfs_resend

10

重新发送的 FS stats

 

command_active

2

活跃命令

 

command_send

10

发送命令

 

command_resend

10

重新发送命令

 

map_epoch

2

OSD map epoch

 

map_full

10

收到的完整 OSD 映射

 

map_inc

10

接收的增量 OSD map

 

osd_sessions

2

开放会话

 

osd_session_open

10

会话已打开

 

osd_session_close

10

会话关闭

 

osd_laggy

2

Laggy OSD 会话

表 8.10. 读和写操作指标表

集合名称指标名称位字段值简短描述

osd

op_wip

2

复制当前正在被处理的操作(主)

 

op_in_bytes

10

客户端操作总写入大小

 

op_out_bytes

10

客户端操作总读取大小

 

op_latency

5

客户端操作的延迟(包括队列时间)

 

op_process_latency

5

客户端操作的延迟(不包括队列时间)

 

op_r

10

客户端读取操作

 

op_r_out_bytes

10

读取客户端数据

 

op_r_latency

5

读取操作的延迟(包括队列时间)

 

op_r_process_latency

5

读取操作的延迟(不包括队列时间)

 

op_w

10

客户端写入操作

 

op_w_in_bytes

10

写入的客户端数据

 

op_w_rlat

5

客户端写入操作可读/应用延迟

 

op_w_latency

5

写入操作的延迟(包括队列时间)

 

op_w_process_latency

5

写入操作的延迟(不包括队列时间)

 

op_rw

10

客户端 read-modify-write 操作

 

op_rw_in_bytes

10

客户端 read-modify-write 操作写入

 

op_rw_out_bytes

10

客户端 read-modify-write 操作读出

 

op_rw_rlat

5

客户端 read-modify-write 操作可读/应用延迟

 

op_rw_latency

5

读写操作的延迟(包括队列时间)

 

op_rw_process_latency

5

读写操作的延迟(不包括队列时间)

 

subop

10

Suboperations

 

subop_in_bytes

10

Suboperations 总数

 

subop_latency

5

Suboperations 延迟

 

subop_w

10

复制写入

 

subop_w_in_bytes

10

复制的写入数据大小

 

subop_w_latency

5

复制的写入延迟

 

subop_pull

10

Suboperations pull 请求

 

subop_pull_latency

5

Suboperations pull 延迟

 

subop_push

10

Suboperations push 消息

 

subop_push_in_bytes

10

Suboperations 推送的大小

 

subop_push_latency

5

Suboperations push 延迟

 

pull

10

发送的拉取请求

 

push

10

推送发送的消息

 

push_out_bytes

10

推送的大小

 

push_in

10

入站推送消息

 

push_in_bytes

10

入站推送的大小

 

recovery_ops

10

开始恢复操作

 

loadavg

2

CPU 负载

 

buffer_bytes

2

分配的缓冲大小总量

 

numpg

2

放置组

 

numpg_primary

2

此 osd 是主的放置组

 

numpg_replica

2

此 osd 是副本的放置组

 

numpg_stray

2

准备好从此 osd 删除 PG

 

heartbeat_to_peers

2

发送给对等点的心跳(ping)

 

heartbeat_from_peers

2

接收来自其中的心跳(ping)对等点

 

map_messages

10

OSD map 消息

 

map_message_epochs

10

OSD map epochs

 

map_message_epoch_dups

10

OSD map 重复

 

stat_bytes

2

OSD 大小

 

stat_bytes_used

2

使用的空间

 

stat_bytes_avail

2

可用空间

 

copyfrom

10

RADOS 'copy-from' 操作

 

tier_promote

10

等级提升

 

tier_flush

10

Tier flushes

 

tier_flush_fail

10

失败的分层清除

 

tier_try_flush

10

tier flush 尝试

 

tier_try_flush_fail

10

失败的分层清除尝试

 

tier_evict

10

等级驱除

 

tier_whiteout

10

Tier whiteouts

 

tier_dirty

10

设定脏层标志

 

tier_clean

10

清理脏层标志

 

tier_delay

10

Tier delays (agent waiting)

 

tier_proxy_read

10

层代理读取

 

agent_wake

10

分层代理唤醒

 

agent_skip

10

代理跳过的对象

 

agent_flush

10

分层代理清除

 

agent_evict

10

分层代理驱除

 

object_ctx_cache_hit

10

对象上下文缓存命

 

object_ctx_cache_total

10

对象上下文缓存查找

表 8.11. 恢复状态指标表

集合名称指标名称位字段值简短描述

recoverystate_perf

initial_latency

5

初始恢复状态延迟

 

started_latency

5

开始恢复状态延迟

 

reset_latency

5

重置恢复状态延迟

 

start_latency

5

启动恢复状态延迟

 

primary_latency

5

主要恢复状态延迟

 

peering_latency

5

对等恢复状态延迟

 

backfilling_latency

5

回填恢复状态延迟

 

waitremotebackfillreserved_latency

5

等待远程回填保留恢复状态延迟

 

waitlocalbackfillreserved_latency

5

等待本地回填保留恢复状态延迟

 

notbackfilling_latency

5

Notbackfilling 恢复状态延迟

 

repnotrecovering_latency

5

重新恢复恢复状态延迟

 

repwaitrecoveryreserved_latency

5

rep 等待恢复保留恢复状态延迟

 

repwaitbackfillreserved_latency

5

Rep 等待回填保留的恢复状态

 

RepRecovering_latency

5

重新恢复恢复状态延迟

 

activating_latency

5

激活恢复状态延迟

 

waitlocalrecoveryreserved_latency

5

等待本地恢复状态延迟

 

waitremoterecoveryreserved_latency

5

等待远程恢复保留状态延迟

 

recovering_latency

5

恢复状态延迟

 

recovered_latency

5

恢复状态延迟

 

clean_latency

5

清理恢复状态延迟

 

active_latency

5

主动恢复状态延迟

 

replicaactive_latency

5

Replicaactive 恢复状态延迟

 

stray_latency

5

stray 恢复状态延迟

 

getinfo_latency

5

Getinfo 恢复状态延迟

 

getlog_latency

5

Getlog 恢复状态延迟

 

waitactingchange_latency

5

Waitactingchange 恢复状态延迟

 

incomplete_latency

5

恢复状态延迟不完整

 

getmissing_latency

5

获取恢复状态延迟

 

waitupthru_latency

5

Waitupthru 恢复状态延迟

表 8.12. OSD Throttle Metrics Table

集合名称指标名称位字段值简短描述

throttle-*

val

10

目前可用节流

 

max

10

最大值 throttle

 

get

10

Gets

 

get_sum

10

获取数据

 

get_or_fail_fail

10

在 get_or_fail 时被阻断

 

get_or_fail_success

10

在 get_or_fail 期间获得成功

 

take

10

Takes

 

take_sum

10

获取的数据

 

put

10

Puts

 

put_sum

10

放置数据

 

wait

5

等待延迟