第 7 章 使用拓扑管理器

Topology Manager(拓扑管理器)是一个 Kubelet 组件,它从 CPU Manager 和设备管理器收集提示信息(hint),以匹配同一非统一内存访问 (NUMA) 节点上的 pod CPU 和设备资源。

拓扑管理器使用收集来的提示信息中获得的拓扑信息,根据配置的 Topology Manager 策略以及请求的 Pod 资源,决定节点是否被节点接受或拒绝。

拓扑管理器对希望使用硬件加速器来支持对工作延迟有极高要求的操作及高吞吐并发计算的负载很有用。

注意

拓扑管理器是 OpenShift Container Platform 中的一个 alpha 功能。

7.1. 设置拓扑管理器

先决条件

  • 将 CPU Manager 策略配置为 static。请参考扩展和性能文档中的使用 CPU Manager 部分 。

流程

  1. 启用 LatencySensitive FeatureGate

    # oc edit featuregate/cluster
  2. 添加 Feature Set: LatencySensitive 到 spec:

    # oc describe featuregate/cluster
    
    Name:         cluster
    Namespace:
    Labels:       <none>
    Annotations:  release.openshift.io/create-only: true
    API Version:  config.openshift.io/v1
    Kind:         FeatureGate
    Metadata:
      Creation Timestamp:  2019-10-30T15:06:41Z
      Generation:          2
      Resource Version:    7773803
      Self Link:           /apis/config.openshift.io/v1/featuregates/cluster
      UID:                 b00204ab-cc5e-4ca5-ad93-b9bdd738c1de
    Spec:
      Feature Set:  LatencySensitive
    Events:         <none>
  3. 使用 KubeletConfig 配置 Topology Manager 策略。

    以下 YAML 文件示例显示了一个指定的 single-numa-node 策略。

    apiVersion: machineconfiguration.openshift.io/v1
    kind: KubeletConfig
    metadata:
      name: cpumanager-enabled
    spec:
      machineConfigPoolSelector:
        matchLabels:
          custom-kubelet: cpumanager-enabled
      kubeletConfig:
         cpuManagerPolicy: static
         cpuManagerReconcilePeriod: 5s
         topologyManagerPolicy: single-numa-node 1
    1
    指定所选的拓扑管理器策略。
    # oc create -f topologymanager-kubeletconfig.yaml