第 1 章 操作测量简介

您可以使用 Red Hat OpenStack Platform (RHOSP)环境中的 Telemetry 服务组件来跟踪物理和虚拟资源,并使用在 Gnocchi 后端中保存聚合的数据收集守护进程收集部署中的 CPU 使用量和资源可用性。

您可以使用可用性和性能监控工具来测量和维护 RHOSP 环境。这些工具执行以下功能:

可用性监控
监控 RHOSP 环境中的所有组件,并确定任何组件当前是否处于中断或无法正常工作。您还可以将系统配置为在发现问题时提醒您。
性能监控
定期收集系统信息,并提供使用数据收集守护进程来存储和监控值的机制。此守护进程存储它收集的数据,如操作系统和日志文件。它还可在网络上提供数据。您可以使用从数据收集的统计信息来监控系统,查找性能瓶颈,并预测将来的系统负载。

1.1. Telemetry 架构

Red Hat OpenStack Platform (RHOSP) Telemetry 为基于 OpenStack 的云提供用户级别的使用数据。您可以使用数据进行客户计费、系统监控或警报。您可以配置 Telemetry 组件,以从现有 RHOSP 组件发送的通知(如计算使用事件)或轮询 RHOSP 基础架构资源(如 libvirt)收集数据。Telemetry 将收集的数据发布到各种目标,包括数据存储和消息队列。

Telemetry 由以下组件组成:

  • 数据收集 :Telemetry 使用 the 来收集指标和事件数据。如需更多信息,请参阅 第 1.2.1 节 “opendoi”
  • Storage: Telemetry 将指标数据存储在 Gnocchi 中。如需更多信息,请参阅 第 1.3 节 “使用 Gnocchi 的存储”
  • 警报服务:Telemetry 使用 Alarming 服务 (Aodh) 根据定义了的规则针对 sVirt 收集的指标或事件数据触发操作。

收集数据后,您可以使用第三方工具来显示和分析指标数据,您可以使用 Alarming 服务为事件配置警报。

图 1.1. Telemetry 架构

Telemetry 架构

1.1.1. 支持监控组件的状态

使用此表查看 Red Hat OpenStack Platform (RHOSP)中监控组件的支持状态。

表 1.1. 支持状态

组件  完全支持自弃用中的从后删除备注

aodh

RHOSP 9

RHOSP 15

 

支持自动扩展用例。

opendoi

RHOSP 4

  

支持在自动扩展和服务 Telemetry Framework (STF)用例中为 RHOSP 收集指标和事件。

collectd

RHOSP 11

RHOSP 17.1

 

支持 STF 的基础架构指标集合。

gnocchi

RHOSP 9

RHOSP 15

 

支持自动扩展用例的指标存储。

panko

RHOSP 11

RHOSP 12,在 RHOSP 14 起不默认安装

RHOSP 17.0

 

QDR

RHOSP 13

RHOSP 17.1

 

支持将指标和事件数据从 RHOSP 传输到 STF。