11.4.2. 了解补救过程

补救过程按如下方式运行:

  1. MachineHealthCheck(MHC)控制器检测到节点不健康。
  2. MHC 通知裸机控制器,它请求关闭不健康的节点。
  3. 关闭电源后,节点会被删除,这允许集群将受影响的工作负载重新调度到其他节点上。
  4. 裸机机器控制器请求启动节点。
  5. 节点启动后,节点会重新注册到集群,从而会创建新节点。
  6. 重新创建节点后,裸机控制器会在删除前恢复不健康节点上存在的注解和标签。
注意

如果电源操作没有完成,裸机机器控制器会触发重新置备不健康的节点,除非这是 control plane 节点(也称为 master 节点)或外部置备的节点。