4.3. 为 Object Service 仪表板启用监控

要在 OpenShift Container Storage 4.6 中的 Object Service 仪表板中查看对象网关(RGW)指标,您必须启用监控。如需有关对象服务仪表板的更多信息,请参阅 Object Service 仪表板中的对象服务仪表板和指标

先决条件

流程

  1. 下载用于更新和提取 Ceph 集群详细信息的 python 脚本。

    1. 点 OpenShift Web 控制台上的 Operators Installed Operators 查看安装的 Operator。
    2. Installed Operators 页面中,点击已安装的 OpenShift Container Storage Operator 的 Provided APIs 列中的 Storage Cluster 链接。
    3. Create Storage Cluster
    4. 选择 Mode 作为 External
    5. Connect to external cluster 部分中,单击 Download Script 链接,以下载用于提取 Ceph 集群详细信息的 python 脚本。
    6. 单击 Cancel,因为存储集群已创建好。
  2. 更新 Red Hat Ceph Storage 集群中 OpenShift Container Storage 客户端的权限上限。

    1. 联系您的红帽 Ceph 存储管理员,在红帽 Ceph 存储客户端节点上运行下载的 python 脚本。
    2. 运行脚本:

      # python3 ceph-external-cluster-details-exporter.py --upgrade --run-as-user=<client_name_used_for_OCS_4.5_install>

      --run-as-user 提供 OpenShift Container Storage 4.5 部署期间使用的客户端名称。如果在 OpenShift Container Storage 4.5 部署过程中没有使用这个选项,则会设置默认的客户端名称 client.healthchecker

      用户的更新权限被设置为:

      caps: [mgr] allow command config
      caps: [mon] allow r, allow command quorum_status, allow command version
      caps: [osd] allow rwx pool=default.rgw.meta, allow r pool=.rgw.root, allow rw pool=default.rgw.control, allow rx pool=default.rgw.log, allow x pool=default.rgw.buckets.index
  3. 要为 Object Service Dashboard 启用监控,必须将监控信息添加到 openshift-storage 命名空间中的外部 secret rook-ceph-external-cluster- details 中。可以通过两种方式更新 secret:

    • 要使用 CLI 更新机密,请参阅本红帽知识库文章
    • 要从 OpenShift Web 控制台更新机密,请按照以下步骤操作:

      1. 运行在第 1v 步中下载的脚本:

        # python3 ceph-external-cluster-details-exporter.py --rbd-data-pool-name <rbd block pool name> --monitoring-endpoint <ceph mgr prometheus exporter endpoint> --monitoring-endpoint-port <ceph mgr prometheus exporter port> --run-as-user <client_name_used_for_OCS_4.5_install>  [optional arguments]

        monitoring-endpoint 是可以从 OpenShift Container Platform 集群访问的活动 ceph-mgr 的 IP 地址。

        monitoring-endpoint-port 是与 --monitoring -endpoint 指定的 ceph-mgr Prometheus 导出器关联的端口。OpenShift Container Storage 4.6 仅支持端口 9283。

        注意

        确保除 monitoring -endpoint 和 monitoring-endpoint- port 以外的所有参数,包括可选参数,与以外部模式部署 OpenShift Container Storage 4.5 期间所用的参数相同。

      2. 保存上一步中运行 脚本后生成的 JSON 输出。输出示例:

        [{"name": "rook-ceph-mon-endpoints", "kind": "ConfigMap", "data": {"data": "xxx.xxx.xxx.xxx:xxxx", "maxMonId": "0", "mapping": "{}"}}, {"name": "rook-ceph-mon", "kind": "Secret", "data": {"admin-secret": "admin-secret", "fsid": "<fs-id>", "mon-secret": "mon-secret"}}, {"name": "rook-ceph-operator-creds", "kind": "Secret", "data": {"userID": "client.healthchecker", "userKey": "<user-key>"}}, {"name": "rook-csi-rbd-node", "kind": "Secret", "data": {"userID": "csi-rbd-node", "userKey": "<user-key>"}}, {"name": "ceph-rbd", "kind": "StorageClass", "data": {"pool": "ceph-rbd"}}, {"name": "monitoring-endpoint", "kind": "CephCluster", "data": {"MonitoringEndpoint": "xxx.xxx.xxx.xxx", "MonitoringPort": "xxxx"}}, {"name": "rook-csi-rbd-provisioner", "kind": "Secret", "data": {"userID": "csi-rbd-provisioner", "userKey": "<user-key>"}}, {"name": "rook-csi-cephfs-provisioner", "kind": "Secret", "data": {"adminID": "csi-cephfs-provisioner", "adminKey": "<admin-key>"}}, {"name": "rook-csi-cephfs-node", "kind": "Secret", "data": {"adminID": "csi-cephfs-node", "adminKey": "<admin-key>"}}, {"name": "cephfs", "kind": "StorageClass", "data": {"fsName": "cephfs", "pool": "cephfs_data"}}, {"name": "ceph-rgw", "kind": "StorageClass", "data": {"endpoint": "xxx.xxx.xxx.xxx:xxxx", "poolPrefix": "default"}}]
      3. 在 OpenShift Container Platform Web 控制台中,在 openshift-storage 命名空间下进入 WorkloadsSecrets,然后点击 rook-ceph-external-cluster-details:

        rook-ceph-external-cluster-details 页面示例
      4. 从操作下拉菜单中 ,单击编辑机密
      5. Edit Key/Value Secret 页面上,单击 Value 文本框旁边的 Browse,再上传之前保存的 JSON 文件。

        Edit Key/Value Secret 页面示例
      6. Save

验证步骤

  1. 点击 OpenShift Web 控制台左侧窗格中的 HomeOverview,然后点击 Object Service 选项卡。
  2. Status 卡中,验证对象服务是否显示绿色勾号图标,如下图所示:

    已验证的 Object Service 状态示例
  3. Performance 卡中,从下拉菜单中选择 Object Gateway(RGW) 来查看指标:

    对象网关(RGW)指标示例
  4. 点击 OverviewPersistent Storage 标签页,在 Status 卡中确认 OCS Cluster 有一个绿色勾号标记。