10.3.4. 访问性能指标
MigrationController 自定义资源 (CR) 记录指标数据,并将它们拉取到集群监控存储中。您可以使用 Prometheus Query Language (PromQL) 来诊断迁移性能问题,以此查询指标数据。当 Migration Controller pod 重启时,会重置所有指标。
您可以使用 OpenShift Container Platform Web 控制台访问性能指标并运行查询。
流程
- 在 OpenShift Container Platform web 控制台中点 Monitoring → Metrics。
输入 PromQL 查询,选择一个要显示的时间窗口,然后单击 Run Queries。
如果您的 Web 浏览器没有显示所有结果,请使用 Prometheus 控制台。
10.3.4.1. 提供的指标
MigrationController 自定义资源 (CR) 提供了 MigMigration CR 计数及其 API 请求的指标。
10.3.4.1.1. cam_app_workload_migrations
此指标是一段时间内的 MigMigration CR 计数。它可用于与 mtc_client_request_count 和 mtc_client_request_elapsed 指标一起查看,以整理迁移状态变化的 API 请求信息。此指标包含在 Telemetry 中。
表 10.1. cam_app_workload_migrations metric
| 可查询的标签名称 | 标签值示例 | 标签描述 |
|---|---|---|
| status |
|
|
| type | stage, final |
|
10.3.4.1.2. mtc_client_request_count
此指标是 MigrationController 发布的 Kubernetes API 请求的累积计数。它不包含在 Telemetry 中。
表 10.2. mtc_client_request_count metric
| 可查询的标签名称 | 标签值示例 | 标签描述 |
|---|---|---|
| cluster |
| 针对发出请求的集群 |
| component |
| 发出请求的子控制器 API |
| function |
| 发出请求的功能 |
| kind |
| 为 Kubernetes 发出的请求类型 |
10.3.4.1.3. mtc_client_request_elapsed
这个指标是 MigrationController 发布的 Kubernetes API 请求的累积延迟,以毫秒为单位。它不包含在 Telemetry 中。
表 10.3. mtc_client_request_elapsed 指标
| 可查询的标签名称 | 标签值示例 | 标签描述 |
|---|---|---|
| cluster |
| 针对发出请求的集群 |
| component |
| 发出请求的子控制器 API |
| function |
| 发出请求的功能 |
| kind |
| 为请求发布的 Kubernetes 资源 |
10.3.4.1.4. 有用的查询
表格中列出了可用于监控性能的一些有用查询。
表 10.4. 有用的查询
| 查询 | 描述 |
|---|---|
|
| 发布的 API 请求数,按请求类型排序 |
|
| 发出的 API 请求总数 |
|
| API 请求延迟,根据请求类型排序 |
|
| API 请求的总延迟 |
|
| API 请求的平均延迟 |
|
| API 请求的平均延迟,按请求类型排序 |
|
| 运行的迁移计数,乘以 100 可更轻松查看请求数 |