Language:
Format:

使用容器化 Red Hat Ceph 部署 overcloud

Red Hat OpenStack Platform 16.2

配置 director 以部署和使用容器化 Red Hat Ceph 集群

OpenStack Documentation Team

rhos-docs@redhat.com

摘要

本指南提供有关使用 Red Hat OpenStack Platform director 创建具有容器化 Red Hat Ceph Storage 集群的 overcloud 的信息。这包括通过 director 自定义 Ceph 集群的说明。

使开源包含更多

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。我们从这四个术语开始：master、slave、黑名单和白名单。由于此项工作十分艰巨，这些更改将在即将推出的几个发行版本中逐步实施。详情请查看 CTO Chris Wright 的信息。

对红帽文档提供反馈

我们感谢您对文档提供反馈信息。与我们分享您的成功秘诀。

在 JIRA 中提供文档反馈

使用 Create Issue 表单对文档提供反馈。JIRA 问题将在 Red Hat OpenStack Platform Jira 项目中创建，您可以在其中跟踪您的反馈进度。

确保您已登录到 JIRA。如果您没有 JIRA 帐户，请创建一个帐户来提交反馈。
点击以下链接打开 Create Issue 页面： Create Issue
完成 Summary 和 Description 字段。在 Description 字段中，包含文档 URL、章节或章节号以及问题的详细描述。不要修改表单中的任何其他字段。
点 Create。

第 1 章将 overcloud 与容器化 Red Hat Ceph Storage 集成

您可以使用 Red Hat OpenStack Platform (RHOSP) director 将云环境(director)与 Red Hat Ceph Storage 调用。您可以在 overcloud 配置之外管理和扩展集群本身。

有关 Red Hat Ceph Storage 的更多信息，请参阅 Red Hat Ceph Storage 架构指南。

本指南包含有关使用 overcloud 部署容器化 Red Hat Ceph Storage 集群的说明。director 使用 ceph-ansible 软件包提供的 Ansible playbook 来部署容器化 Ceph 存储集群。director 还管理集群的配置和扩展操作。

有关 Red Hat OpenStack Platform 中容器化服务的更多信息，请参阅 Director 安装和使用中的使用CLI 工具配置基本的 overcloud。

1.1. Ceph Storage 集群

Red Hat Ceph Storage 是一个分布式数据对象存储，旨在提供高性能、可靠性和可扩展性。分布式对象存储适应非结构化数据，因此客户端可以同时使用现代对象接口和旧接口。每个 Ceph 部署的核心是 Ceph Storage 集群，它由多种守护进程组成，但主要是这两个守护进程：

Ceph OSD （对象存储守护进程）: Ceph OSD 代表 Ceph 客户端存储数据。此外，Ceph OSD 使用 Ceph 节点的 CPU 和内存来执行数据复制、重新平衡、恢复、监控和报告功能。
Ceph monitor: Ceph 监控器维护 Ceph 存储集群映射的主副本，并且存储集群的当前状态。

有关 Red Hat Ceph Storage 的更多信息，请参阅 Red Hat Ceph Storage 架构指南。

1.2. 使用 overcloud 部署容器化 Ceph 存储集群的要求

在使用 overcloud 部署容器化 Ceph Storage 集群前，您的环境必须包含以下配置：

安装了 Red Hat OpenStack Platform (RHOSP) director 的 undercloud 主机。请参阅 Director 安装和使用 中的在 undercloud 上安装 director。
Red Hat Ceph Storage 建议的额外硬件。有关推荐的硬件的更多信息，请参阅 Red Hat Ceph Storage 硬件指南。

重要

Ceph 监控服务安装在 overcloud Controller 节点上，因此您必须提供足够的资源以避免性能问题。确保环境中的 Controller 节点对 Ceph 监控数据的内存和固态驱动器(SSD)存储至少使用 16GB RAM。对于大型 Ceph 安装的中型，至少提供 500GB 的 Ceph 监控数据。当集群不稳定时，需要这个空间来避免 levelDB 增长。以下示例是 Ceph Storage 集群的常见大小：

Small: 250 terabytes
Medium: 1 PB
Large：2 PB 或更多。

1.3. Ceph Storage 节点要求

如果使用 Red Hat OpenStack Platform (RHOSP) director 创建 Red Hat Ceph Storage 节点，则还有额外的要求。

有关如何为 Ceph Storage 节点选择处理器、内存、网络接口卡 (NIC) 和磁盘布局的信息，请参阅 Red Hat Ceph Storage 硬件指南中的 Red Hat Ceph Storage 的硬件选择建议。

每个 Ceph Storage 节点还需要在服务器的主板上有一个受支持的电源管理接口，如智能平台管理接口(IPMI)功能。

注意

RHOSP director 使用 ceph-ansible，不支持在 Ceph Storage 节点的根磁盘上安装 OSD。这意味着所支持的每个 Ceph Storage 节点需要至少两个磁盘。

Ceph Storage 节点和 RHEL 兼容性

RHEL 8.4 支持 RHOSP 16.2。在升级到 RHOSP 16.1 及之后的版本前，请参阅红帽知识库文章 Red Hat Ceph Storage: 支持的配置。

放置组 (PG)

Ceph Storage 使用放置组 (PG) 大规模推动动态高效的对象跟踪。如果 OSD 出现故障或集群进行重新平衡，Ceph 可移动或复制放置组及其内容，这意味着 Ceph Storage 集群可以有效地重新平衡并恢复。
director 创建的默认放置组数量并非始终最佳，因此一定要根据要求计算正确的放置组数量。您可以使用放置组计算器计算正确的数量。要使用 PG 计算器，请输入每个服务的预计存储使用量（百分比表示），以及 Ceph 集群的其他属性，如 OSD 数量。计算器返回每个池的最佳 PG 数量。有关更多信息，请参阅每个池计算器的放置组 (PG)。
自动扩展是管理放置组的替代方法。借助自动扩展功能，您可以将每个服务的预期 Ceph Storage 要求设置为百分比而不是特定数量的放置组。Ceph 根据集群的使用方式自动扩展放置组。有关更多信息，请参阅 Red Hat Ceph Storage 策略指南中的自动扩展放置组。

处理器

支持 Intel 64 或 AMD64 CPU 扩展的 64 位 x86 处理器。

网络接口卡

最少一个 1 Gbps 网络接口卡 (NIC)，但红帽建议您在生产环境中至少使用两个 NIC。对绑定的接口使用额外的 NIC，或代理标记的 VLAN 流量。为存储节点使用 10 Gbps 接口，特别是所创建的 Red Hat OpenStack Platform (RHOSP) 环境需要处理大量流量时。

电源管理

每个 Controller 节点在服务器的主板上都要有一个受支持的电源管理接口，如智能平台管理接口 (IPMI) 功能。

1.4. 用于部署 Ceph Storage 的 Ansible playbook

/usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml 环境文件指示 director 使用从 ceph-ansible 项目派生的 playbook。这些 playbook 安装在 undercloud 的 /usr/share/ceph-ansible/ 中。特别是，以下文件包含 playbook 应用的所有默认设置：

/usr/share/ceph-ansible/group_vars/all.yml.sample

警告

虽然 ceph-ansible 使用 playbook 部署容器化 Ceph Storage，但不要编辑这些文件来自定义部署。反之，使用 heat 环境文件覆盖这些 playbook 设置的默认值。如果您直接编辑 ceph-ansible playbook，您的部署会失败。

有关 director 为容器化 Ceph Storage 应用的默认设置的信息，请参阅 /usr/share/openstack-tripleo-heat-templates/deployment/ceph-ansible 中的 heat 模板。

注意

阅读这些模板需要深入了解 director 中环境文件和 heat 模板的工作方式。如需更多信息，请参阅了解 Heat 模板和环境文件。

有关 RHOSP 中容器化服务的更多信息，请参阅 Director 安装和使用中的使用CLI 工具配置基本的 overcloud。

第 2 章为 overcloud 部署准备 Ceph Storage 节点

这种场景中的所有节点都是使用 IPMI 进行电源管理的裸机系统。这些节点不需要操作系统，因为 director 将 Red Hat Enterprise Linux 8 镜像复制到每个节点。此外，这些节点上的 Ceph Storage 服务是容器化的。director 在内省和置备过程中通过 Provisioning 网络与每个节点通信。所有节点都通过原生 VLAN 连接到此网络。

2.1. 清理 Ceph Storage 节点磁盘

Ceph Storage OSD 和日志分区需要 GPT 磁盘标签。这意味着，Ceph 存储上的额外磁盘需要在安装 Ceph OSD 服务前转换为 GPT。您必须从磁盘中删除所有元数据，以允许 director 在其上设置 GPT 标签。

您可以将 director 配置为默认删除所有磁盘元数据。使用此选项时，裸机置备服务运行额外步骤来引导节点，并在每次节点设置为 可用时 清除磁盘。这个过程会在第一次内省后添加额外的电源周期，并在每个部署之前添加。裸机置备服务使用 wipefs --force --all 命令执行清理。

流程

在 /home/stack/undercloud.conf 文件中添加以下设置：
```
clean_nodes=true
```
设置此选项后，运行 openstack undercloud install 命令来执行此配置更改。
警告
wipefs --force --all 命令删除磁盘上的所有数据和元数据，但不执行安全清除。安全擦除需要更长的时间。

2.2. 注册节点

流程

将 JSON 格式的节点清单文件(instackenv.json)导入到 director，以便 director 能够与节点通信。此清单文件包含 director 可用于注册节点的硬件和电源管理详情：

{
    "nodes":[
        {
            "mac":[
                "b1:b1:b1:b1:b1:b1"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.205"
        },
        {
            "mac":[
                "b2:b2:b2:b2:b2:b2"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.206"
        },
        {
            "mac":[
                "b3:b3:b3:b3:b3:b3"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.207"
        },
        {
            "mac":[
                "c1:c1:c1:c1:c1:c1"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.208"
        },
        {
            "mac":[
                "c2:c2:c2:c2:c2:c2"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.209"
        },
        {
            "mac":[
                "c3:c3:c3:c3:c3:c3"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.210"
        },
        {
            "mac":[
                "d1:d1:d1:d1:d1:d1"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.211"
        },
        {
            "mac":[
                "d2:d2:d2:d2:d2:d2"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.212"
        },
        {
            "mac":[
                "d3:d3:d3:d3:d3:d3"
            ],
            "cpu":"4",
            "memory":"6144",
            "disk":"40",
            "arch":"x86_64",
            "pm_type":"ipmi",
            "pm_user":"admin",
            "pm_password":"p@55w0rd!",
            "pm_addr":"192.0.2.213"
        }
    ]
}

创建清单文件后，将文件保存到 stack 用户的主目录(/home/stack/instackenv.json)。
初始化 stack 用户，然后将 instackenv.json 清单文件导入到 director 中：
```
$ source ~/stackrc
$ openstack overcloud node import ~/instackenv.json
```
openstack overcloud node import 命令导入清单文件，并将每个节点注册到 director。
将内核和 ramdisk 镜像分配给每个节点：
```
$ openstack overcloud node configure <node>
```
节点已在 director 中注册和配置。

2.3. 验证可用的 Red Hat Ceph Storage 软件包

为了帮助避免 overcloud 部署失败，请验证服务器上是否存在所需的软件包。

2.3.1. 验证 ceph-ansible 软件包版本

undercloud 包含基于 Ansible 的验证，您可以在部署 overcloud 前确定潜在的问题。这些验证可帮助您避免在发生之前识别常见问题来避免 overcloud 部署失败。

流程

验证您要安装的 ceph-ansible 软件包版本：

$ ansible-playbook -i /usr/bin/tripleo-ansible-inventory /usr/share/ansible/validation-playbooks/ceph-ansible-installed.yaml

2.3.2. 验证预置备节点的软件包

Red Hat Ceph Storage (RHCS)只能服务具有特定软件包集的 overcloud 节点。使用预置备节点时，您可以验证这些软件包是否存在。

有关预置备节点的更多信息，请参阅使用预置备节点配置基本 overcloud。

流程

验证预置备节点是否包含所需的软件包：

ansible-playbook -i /usr/bin/tripleo-ansible-inventory /usr/share/ansible/validation-playbooks/ceph-dependencies-installed.yaml

2.4. 手动将节点标记为配置集

注册每个节点后，您必须检查硬件并将节点标记为特定的配置集。使用配置集标签将您的节点与类别匹配，然后将类别分配到部署角色。

流程

触发硬件内省以检索每个节点的属性：
```
$ openstack overcloud node introspect --all-manageable --provide
```
- --all-manageable 选项仅内省处于受管理状态的节点。在此示例中，所有节点都处于受管理状态。
- --provide 选项会在内省后将所有节点重置 为活动状态。
  重要
  确保此过程成功完成。它可能需要 15 分钟来检查这些裸机节点。
检索节点列表来识别它们的 UUID：
```
$ openstack baremetal node list
```

在每个节点的 properties/capabilities 参数中添加 profile 选项，来手动将节点标记到特定的配置集。添加 profile 选项将节点标记为相关的配置集。

注意

作为手动标记的替代选择，请使用自动健康检查(AHC)工具根据基准测试数据自动标记大量节点。

例如，典型的部署包含三个配置集： control、compute 和 ceph-storage。输入以下命令为每个配置集标记三个节点：

$ openstack baremetal node set --property capabilities='profile:control,boot_option:local' 1a4e30da-b6dc-499d-ba87-0bd8a3819bc0
$ openstack baremetal node set --property capabilities='profile:control,boot_option:local' 6faba1a9-e2d8-4b7c-95a2-c7fbdc12129a
$ openstack baremetal node set --property capabilities='profile:control,boot_option:local' 6faba1a9-e2d8-4b7c-95a2-c7fbdc12129a
$ openstack baremetal node set --property capabilities='profile:compute,boot_option:local' 484587b2-b3b3-40d5-925b-a26a2fa3036f
$ openstack baremetal node set --property capabilities='profile:compute,boot_option:local' d010460b-38f2-4800-9cc4-d69f0d067efe
$ openstack baremetal node set --property capabilities='profile:compute,boot_option:local' d930e613-3e14-44b9-8240-4f3559801ea6
$ openstack baremetal node set --property capabilities='profile:ceph-storage,boot_option:local' 484587b2-b3b3-40d5-925b-a26a2fa3036f
$ openstack baremetal node set --property capabilities='profile:ceph-storage,boot_option:local' d010460b-38f2-4800-9cc4-d69f0d067efe
$ openstack baremetal node set --property capabilities='profile:ceph-storage,boot_option:local' d930e613-3e14-44b9-8240-4f3559801ea6

提示

您还可以配置新的自定义配置集来标记 Ceph MON 和 Ceph MDS 服务的节点，请参阅第 3 章 在专用节点上部署 Ceph 服务。

2.5. 为多磁盘集群定义根磁盘

如果节点使用多个磁盘，则 Director 在置备过程上必须识别根磁盘。例如，大多数 Ceph Storage 节点使用多个磁盘。默认情况下，director 在置备过程中将 overcloud 镜像写入根磁盘

您可以定义多个属性以帮助 director 识别根磁盘：

model（字符串）：设备识别码。
vendor（字符串）：设备厂商。
serial（字符串）：磁盘序列号。
hctl（字符串）：SCSI 的 Host:Channel:Target:Lun。
size（整数）：设备的大小（以 GB 为单位）。
wwn（字符串）：唯一的存储 ID。
wwn_with_extension（字符串）：唯一存储 ID 附加厂商扩展名。
wwn_vendor_extension（字符串）：唯一厂商存储标识符。
rotational（布尔值）：旋转磁盘设备为 true (HDD)，否则为 false (SSD)。
name（字符串）：设备名称，例如：/dev/sdb1。

重要

仅对具有持久名称的设备使用 name 属性。不要使用 name 来设置任何其他设备的根磁盘，因为此值在节点引导时可能会改变。

您可以使用其序列号指定根设备。

步骤

从每个节点的硬件内省检查磁盘信息。运行以下命令以显示节点的磁盘信息：

(undercloud)$ openstack baremetal introspection data save 1a4e30da-b6dc-499d-ba87-0bd8a3819bc0 | jq ".inventory.disks"

例如，一个节点的数据可能会显示 3 个磁盘：

[
  {
    "size": 299439751168,
    "rotational": true,
    "vendor": "DELL",
    "name": "/dev/sda",
    "wwn_vendor_extension": "0x1ea4dcc412a9632b",
    "wwn_with_extension": "0x61866da04f3807001ea4dcc412a9632b",
    "model": "PERC H330 Mini",
    "wwn": "0x61866da04f380700",
    "serial": "61866da04f3807001ea4dcc412a9632b"
  }
  {
    "size": 299439751168,
    "rotational": true,
    "vendor": "DELL",
    "name": "/dev/sdb",
    "wwn_vendor_extension": "0x1ea4e13c12e36ad6",
    "wwn_with_extension": "0x61866da04f380d001ea4e13c12e36ad6",
    "model": "PERC H330 Mini",
    "wwn": "0x61866da04f380d00",
    "serial": "61866da04f380d001ea4e13c12e36ad6"
  }
  {
    "size": 299439751168,
    "rotational": true,
    "vendor": "DELL",
    "name": "/dev/sdc",
    "wwn_vendor_extension": "0x1ea4e31e121cfb45",
    "wwn_with_extension": "0x61866da04f37fc001ea4e31e121cfb45",
    "model": "PERC H330 Mini",
    "wwn": "0x61866da04f37fc00",
    "serial": "61866da04f37fc001ea4e31e121cfb45"
  }
]

输入 openstack baremetal node set --property root_device=，为节点设置根磁盘。包括用于定义根磁盘的最合适的硬件属性值。
```
(undercloud)$ openstack baremetal node set --property root_device='{"serial":"<serial_number>"}' <node-uuid>
```
例如：要将根设备设定为磁盘 2，其序列号为 61866da04f380d001ea4e13c12e36ad6，输入以下命令：
```
(undercloud)$ openstack baremetal node set --property root_device='{"serial": "61866da04f380d001ea4e13c12e36ad6"}' 1a4e30da-b6dc-499d-ba87-0bd8a3819bc0
```
注意
确保配置每个节点的 BIOS 以包括从您选择的根磁盘引导。将引导顺序配置为首先从网络引导，然后从根磁盘引导。
director 识别特定磁盘以用作根磁盘。运行 openstack overcloud deploy 命令时，director 置备 overcloud 镜像并将其写入根磁盘。

2.6. 使用 overcloud-minimal 镜像来避免使用红帽订阅授权

默认情况下，director 在置备过程中将 QCOW2 overcloud-full 镜像写入根磁盘。overcloud-full 镜像使用有效的红帽订阅。但是，如果您不希望运行其他 OpenStack 服务或消耗您的订阅授权，您还可以使用 overcloud-minimal 镜像来置备裸机操作系统。

在您希望只使用 Ceph 守护进程来置备节点时，会发生此情况的常见用例。对于此情况和类似用例，使用 overcloud-minimal 镜像选项以避免达到您购买的红帽订阅的极限。有关如何获取 overcloud-minimal 镜像的信息，请参阅获取 overcloud 节点的镜像。

注意

Red Hat OpenStack Platform (RHOSP) 订阅包含 Open vSwitch (OVS)，但使用 overcloud-minimal 镜像时核心服务（如 OVS）不可用。部署 Ceph Storage 节点不需要 OVS。使用 linux_bond 定义绑定，而不使用 ovs_bond。有关 linux_bond 的更多信息，请参阅 Linux 绑定选项。

步骤

要配置 director 使用 overcloud-minimal 镜像，创建包含以下镜像定义的环境文件：
```
parameter_defaults:
  <roleName>Image: overcloud-minimal
```
将 <roleName> 替换为角色的名称，并将 Image 加到角色名称的后面。以下示例显示了 Ceph 存储节点的 overcloud-minimal 镜像：
```
parameter_defaults:
  CephStorageImage: overcloud-minimal
```
在 roles_data.yaml 角色定义文件中，将 rhsm_enforce 参数设置为 False。
```
rhsm_enforce: False
```
将环境文件传递给 openstack overcloud deploy 命令。

注意

overcloud-minimal 镜像仅支持标准 Linux 网桥，不支持 OVS，因为 OVS 是需要 Red Hat OpenStack Platform 订阅权利的 OpenStack 服务。

第 3 章在专用节点上部署 Ceph 服务

默认情况下，director 在 Controller 节点上部署 Ceph MON 和 Ceph MDS 服务。这适用于小型部署。但是，在大型部署中，红帽建议您在专用节点上部署 Ceph MON 和 Ceph MDS 服务，以提高 Ceph 集群的性能。为要在专用节点上隔离的服务创建一个自定义角色。

注意

如需有关自定义角色的更多信息，请参阅高级 Overcloud 自定义指南中的创建新角色。

director 使用以下文件作为所有 overcloud 角色的默认引用：

/usr/share/openstack-tripleo-heat-templates/roles_data.yaml

3.1. 创建自定义角色文件

要创建自定义角色文件，请完成以下步骤：

流程

在 /home/stack/templates/ 中制作 roles_data.yaml 文件的副本，以便您可以添加自定义角色：

$ cp /usr/share/openstack-tripleo-heat-templates/roles_data.yaml /home/stack/templates/roles_data_custom.yaml

在 openstack overcloud deploy 命令中包含新的自定义角色文件。

3.2. 为 Ceph MON 服务创建自定义角色和类别

为 Ceph MON 角色创建自定义角色 CephMon 和 ceph-mon。

前提条件

您必须已具有默认角色数据文件的副本。更多信息请参阅第 3 章 在专用节点上部署 Ceph 服务。

流程

打开 /home/stack/templates/roles_data_custom.yaml 文件。
从 Controller 角色中删除 Ceph MON 服务 OS::TripleO::Services::CephMon 的服务条目。

将 OS::TripleO::Services::CephClient 服务添加到 Controller 角色中：

[...]
- name: Controller # the 'primary' role goes first
  CountDefault: 1
  ServicesDefault:
    - OS::TripleO::Services::CACerts
    - OS::TripleO::Services::CephMds
    - OS::TripleO::Services::CephClient
    - OS::TripleO::Services::CephExternal
    - OS::TripleO::Services::CephRbdMirror
    - OS::TripleO::Services::CephRgw
    - OS::TripleO::Services::CinderApi
[...]

在 roles_data_custom.yaml 文件的末尾，添加一个自定义 CephMon 角色，其中包含 Ceph MON 服务和所有其他必要的节点服务：

- name: CephMon
  ServicesDefault:
    # Common Services
    - OS::TripleO::Services::AuditD
    - OS::TripleO::Services::CACerts
    - OS::TripleO::Services::CertmongerUser
    - OS::TripleO::Services::Collectd
    - OS::TripleO::Services::Docker
    - OS::TripleO::Services::FluentdClient
    - OS::TripleO::Services::Kernel
    - OS::TripleO::Services::Ntp
    - OS::TripleO::Services::ContainersLogrotateCrond
    - OS::TripleO::Services::SensuClient
    - OS::TripleO::Services::Snmp
    - OS::TripleO::Services::Timezone
    - OS::TripleO::Services::TripleoFirewall
    - OS::TripleO::Services::TripleoPackages
    - OS::TripleO::Services::Tuned
    # Role-Specific Services
    - OS::TripleO::Services::CephMon

输入 openstack flavor create 命令，为 CephMon 角色定义名为 ceph-mon 的新类别：
```
$ openstack flavor create --id auto --ram 6144 --disk 40 --vcpus 4 ceph-mon
```
注意
有关此命令的更多信息，请输入： openstack flavor create --help。

将此类别映射到名为 ceph-mon 的新配置集：

$ openstack flavor set --property "cpu_arch"="x86_64" --property "capabilities:boot_option"="local" --property "capabilities:profile"="ceph-mon" ceph-mon

注意

有关此命令的更多信息，请输入 openstack flavor set --help。

将节点标记为新的 ceph-mon 配置集：

$ openstack baremetal node set --property capabilities='profile:ceph-mon,boot_option:local' UUID

将以下配置添加到 node-info.yaml 文件中，将 ceph-mon 类别与 CephMon 角色关联：
```
parameter_defaults:
  OvercloudCephMonFlavor: CephMon
  CephMonCount: 3
```

有关标记节点的更多信息，请参阅第 2.4 节 “手动将节点标记为配置集”。有关自定义角色配置集的更多信息，请参阅标记节点 Into Profiles。

3.3. 为 Ceph MDS 服务创建自定义角色和类别

完成以下步骤，为 Ceph MDS 角色创建自定义角色 CephMDS 和 ceph-mds 类别。您必须已具有默认角色数据文件的副本，如第 3 章 在专用节点上部署 Ceph 服务 所述。

流程

打开 /home/stack/templates/roles_data_custom.yaml 文件。

从 Controller 角色中删除 Ceph MDS 服务 OS::TripleO::Services::CephMds 的服务条目：

[...]
- name: Controller # the 'primary' role goes first
  CountDefault: 1
  ServicesDefault:
    - OS::TripleO::Services::CACerts
    # - OS::TripleO::Services::CephMds 1
    - OS::TripleO::Services::CephMon
    - OS::TripleO::Services::CephExternal
    - OS::TripleO::Services::CephRbdMirror
    - OS::TripleO::Services::CephRgw
    - OS::TripleO::Services::CinderApi
[...]

1: 注释掉这一行。在下一步中，您要将此服务添加到新的自定义角色中。

在 roles_data_custom.yaml 文件的末尾，添加一个自定义 CephMDS 角色，其中包含 Ceph MDS 服务以及所有其他必要的节点服务：

- name: CephMDS
  ServicesDefault:
    # Common Services
    - OS::TripleO::Services::AuditD
    - OS::TripleO::Services::CACerts
    - OS::TripleO::Services::CertmongerUser
    - OS::TripleO::Services::Collectd
    - OS::TripleO::Services::Docker
    - OS::TripleO::Services::FluentdClient
    - OS::TripleO::Services::Kernel
    - OS::TripleO::Services::Ntp
    - OS::TripleO::Services::ContainersLogrotateCrond
    - OS::TripleO::Services::SensuClient
    - OS::TripleO::Services::Snmp
    - OS::TripleO::Services::Timezone
    - OS::TripleO::Services::TripleoFirewall
    - OS::TripleO::Services::TripleoPackages
    - OS::TripleO::Services::Tuned
    # Role-Specific Services
    - OS::TripleO::Services::CephMds
    - OS::TripleO::Services::CephClient 1

1: Ceph MDS 服务需要 admin 密钥环，您可以使用 Ceph MON 或 Ceph 客户端服务进行设置。如果您在没有 Ceph MON 服务的专用节点上部署 Ceph MDS，还必须将 Ceph 客户端服务包含在新的 CephMDS 角色中。

输入 openstack flavor create 命令，为此角色定义名为 ceph-mds 的新类别：
```
$ openstack flavor create --id auto --ram 6144 --disk 40 --vcpus 4 ceph-mds
```
注意
有关这个命令的更多信息，请输入 openstack flavor create --help。

将新的 ceph-mds 类别映射到新配置集，也称为 ceph-mds ：

$ openstack flavor set --property "cpu_arch"="x86_64" --property "capabilities:boot_option"="local" --property "capabilities:profile"="ceph-mds" ceph-mds

注意

有关此命令的更多信息，请输入 openstack flavor set --help。

将节点标记为新的 ceph-mds 配置集：

$ openstack baremetal node set --property capabilities='profile:ceph-mds,boot_option:local' UUID

有关标记节点的更多信息，请参阅第 2.4 节 “手动将节点标记为配置集”。有关自定义角色配置集的更多信息，请参阅标记节点 Into Profiles。

第 4 章自定义存储服务

director 提供的 heat 模板集合已经包含必要的模板和环境文件，以启用基本的 Ceph Storage 配置。

director 使用 /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml 环境文件来创建 Ceph 集群，并在部署过程中将其与 overcloud 集成。此集群具有容器化 Ceph Storage 节点。如需有关 OpenStack 中容器化服务的更多信息，请参阅 Director 安装和使用指南中的使用 CLI 工具配置基本的 overcloud。

Red Hat OpenStack director 还将基本的默认设置应用到部署的 Ceph 集群。您还必须在自定义环境文件中定义任何其他配置。

流程

在 /home/stack/templates/ 中创建 storage-config.yaml 文件。在本例中，~/templates/storage-config.yaml 文件包含环境的大多数与 overcloud 相关的自定义设置。您在自定义环境文件中包含的参数会覆盖 /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml 文件中的相应默认设置。
在 ~/templates/storage-config.yaml 中添加 parameter_defaults 部分。本节包含 overcloud 的自定义设置。例如，要将 vxlan 设置为网络服务的网络类型(neutron)，请在自定义环境文件中添加以下代码片段：
```
parameter_defaults:
  NeutronNetworkType: vxlan
```

如有必要，根据您的要求在 parameter_defaults 下设置以下选项：

Option	描述	默认值
CinderEnableIscsiBackend	启用 iSCSI 后端	false
CinderEnableRbdBackend	启用 Ceph Storage 后端	true
CinderBackupBackend	将 ceph 或 swift 设置为卷备份的后端。更多信息请参阅第 4.4 节 “将备份服务配置为使用 Ceph”。	ceph
NovaEnableRbdBackend	为 Nova 临时存储启用 Ceph Storage	true
GlanceBackend	定义镜像服务应使用的后端： `rbd` (Ceph)、`swift` 或 `file`	rbd
GnocchiBackend	定义 Telemetry 服务应使用的后端： `rbd` (Ceph)、`swift` 或 `file`	rbd

注意

如果要使用默认设置，您可以从 ~/templates/storage-config.yaml 中省略一个选项。

自定义环境文件的内容会根据您在以下部分中应用的设置而改变。如需完整的示例，请参阅附录 A, 示例环境文件：创建 Ceph Storage 集群。

4.1. 启用 Ceph 元数据服务器

Ceph 元数据服务器(MDS)运行 ceph-mds 守护进程，后者管理与 CephFS 上存储的文件相关的元数据。CephFS 可以通过 NFS 使用。有关通过 NFS 使用 CephFS 的更多信息，请参阅文件系统指南和通过 NFS 使用 CephFS 部署共享文件系统服务。

注意

红帽支持仅通过 NFS 后端为共享文件系统服务使用 CephFS 部署 Ceph MDS。

流程

要启用 Ceph 元数据服务器，请在创建 overcloud 时调用以下环境文件： /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-mds.yaml

更多信息请参阅第 7.2 节 “启动 overcloud 部署”。有关 Ceph 元数据服务器的更多信息，请参阅配置元数据服务器守护进程。

注意

默认情况下，Ceph 元数据服务器部署在 Controller 节点上。您可以在自己的专用节点上部署 Ceph 元数据服务器。更多信息请参阅第 3.3 节 “为 Ceph MDS 服务创建自定义角色和类别”。

4.2. 启用 Ceph 对象网关

Ceph 对象网关(RGW)为应用提供 Ceph Storage 集群中对象存储功能的接口。部署 RGW 时，您可以将默认的 Object Storage 服务(swift)替换为 Ceph。如需更多信息，请参阅对象网关配置和管理指南。

流程

要在部署中启用 RGW，请在创建 overcloud 时调用以下环境文件：
- /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-rgw.yaml

更多信息请参阅第 7.2 节 “启动 overcloud 部署”。

默认情况下，Ceph Storage 允许每个 OSD 250 个 PG。启用 RGW 时，Ceph Storage 会创建 RGW 所需的六个额外的池。新池有：

.rgw.root
default.rgw.control
default.rgw.meta
default.rgw.log
default.rgw.buckets.index
default.rgw.buckets.data

注意

在部署中，default 替换为池所属的区域的名称。

因此，当启用 RGW 时，使用 CephPoolDefaultPgNum 参数设置默认的 pg_num，以考虑新池。有关如何为 Ceph 池计算放置组数量的更多信息，请参阅第 5.4 节 “为不同的 Ceph 池分配自定义属性”。

Ceph 对象网关是默认对象存储服务的直接替换。因此，通常使用 swift 的所有其他服务都可以无缝地使用 Ceph 对象网关，而无需进一步配置。如需更多信息，请参阅块存储备份指南。

4.3. 配置 Ceph 对象存储以使用外部 Ceph 对象网关

Red Hat OpenStack Platform (RHOSP) Director 支持将外部 Ceph 对象网关(RGW)配置为对象存储服务。要使用外部 RGW 服务进行身份验证，您必须配置 RGW，以验证用户及其在 Identity 服务(keystone)中的角色。

有关如何配置外部 Ceph 对象网关的更多信息，请参阅 Using Keystone with the Ceph Object Gateway Guide 中的 Configuring the Ceph Object Gateway to use Keystone authentication。

流程

将以下 parameter_defaults 添加到自定义环境文件，如 swift-external-params.yaml，并调整值以符合您的部署：
```
parameter_defaults:
   ExternalSwiftPublicUrl: 'http://<Public RGW endpoint or loadbalancer>:8080/swift/v1/AUTH_%(project_id)s'
   ExternalSwiftInternalUrl: 'http://<Internal RGW endpoint>:8080/swift/v1/AUTH_%(project_id)s'
   ExternalSwiftAdminUrl: 'http://<Admin RGW endpoint>:8080/swift/v1/AUTH_%(project_id)s'
   ExternalSwiftUserTenant: 'service'
   SwiftPassword: 'choose_a_random_password'
```
注意
示例代码片段包含与您在环境中使用的值不同的参数值：
- 远程 RGW 实例侦听 8080 的默认端口。端口可能根据配置外部 RGW 的不同而有所不同。
- overcloud 中创建的 swift 用户使用 SwiftPassword 参数定义的密码。您必须将外部 RGW 实例配置为使用同一密码通过 rgw_keystone_admin_password 与 Identity 服务进行身份验证。

将以下代码添加到 Ceph 配置文件，将 RGW 配置为使用 Identity 服务。替换变量值以适合您的环境：

    rgw_keystone_api_version = 3
    rgw_keystone_url = http://<public Keystone endpoint>:5000/
    rgw_keystone_accepted_roles = member, Member, admin
    rgw_keystone_accepted_admin_roles = ResellerAdmin, swiftoperator
    rgw_keystone_admin_domain = default
    rgw_keystone_admin_project = service
    rgw_keystone_admin_user = swift
    rgw_keystone_admin_password = <password_as_defined_in_the_environment_parameters>
    rgw_keystone_implicit_tenants = true
    rgw_keystone_revocation_interval = 0
    rgw_s3_auth_use_keystone = true
    rgw_swift_versioning_enabled = true
    rgw_swift_account_in_url = true

注意

director 默认在 Identity 服务中创建以下角色和用户：

rgw_keystone_accepted_admin_roles: ResellerAdmin, swiftoperator
rgw_keystone_admin_domain: default
rgw_keystone_admin_project: service
rgw_keystone_admin_user: swift

使用与部署相关的任何其他环境文件，使用额外的环境文件部署 overcloud：

openstack overcloud deploy --templates \
-e <your_environment_files>
-e /usr/share/openstack-tripleo-heat-templates/environments/swift-external.yaml
-e swift-external-params.yaml

验证

以 stack 用户的身份登录 undercloud。
获取 overcloudrc 文件：
```
$ source ~/stackrc
```

验证 Identity 服务(keystone)中是否存在端点：

$ openstack endpoint list --service object-store

+---------+-----------+-------+-------+---------+-----------+---------------+
| ID | Region    | Service Name | Service Type | Enabled | Interface | URL |
+---------+-----------+-------+-------+---------+-----------+---------------+
| 233b7ea32aaf40c1ad782c696128aa0e | regionOne | swift | object-store | True    | admin     | http://192.168.24.3:8080/v1/AUTH_%(project_id)s |
| 4ccde35ac76444d7bb82c5816a97abd8 | regionOne | swift | object-store | True    | public    | https://192.168.24.2:13808/v1/AUTH_%(project_id)s |
| b4ff283f445348639864f560aa2b2b41 | regionOne | swift | object-store | True    | internal  | http://192.168.24.3:8080/v1/AUTH_%(project_id)s |
+---------+-----------+-------+-------+---------+-----------+---------------+

创建测试容器：

$ openstack container create <testcontainer>
+----------------+---------------+------------------------------------+
| account | container | x-trans-id |
+----------------+---------------+------------------------------------+
| AUTH_2852da3cf2fc490081114c434d1fc157 | testcontainer | tx6f5253e710a2449b8ef7e-005f2d29e8 |
+----------------+---------------+------------------------------------+

创建配置文件以确认您可以将数据上传到容器：

$ openstack object create testcontainer undercloud.conf
+-----------------+---------------+----------------------------------+
| object          | container     | etag                             |
+-----------------+---------------+----------------------------------+
| undercloud.conf | testcontainer | 09fcffe126cac1dbac7b89b8fd7a3e4b |
+-----------------+---------------+----------------------------------+

删除 test 容器：

$ openstack container delete -r <testcontainer>

4.4. 将备份服务配置为使用 Ceph

块存储备份服务(cinder-backup)默认为禁用。要启用块存储备份服务，请完成以下步骤：

流程

在创建 overcloud 时调用以下环境文件： /usr/share/openstack-tripleo-heat-templates/environments/cinder-backup.yaml。

4.5. 为 Ceph 节点配置多个绑定接口

使用绑定接口组合多个 NIC，并为网络连接添加冗余性。如果在 Ceph 节点上有足够的 NIC，可以在每个节点上创建多个绑定接口来扩展冗余功能。

然后，您可以对节点所需的每个网络连接使用绑定接口。这可为每个网络提供冗余和专用连接。

绑定接口的最简单实现涉及使用两个绑定，一个用于 Ceph 节点使用的每个存储网络。这些网络如下：

前端存储网络(StorageNet): Ceph 客户端使用此网络与对应的 Ceph 集群交互。
后端存储网络(StorageMgmtNet): Ceph 集群使用此网络来根据集群的放置组策略来平衡数据。有关更多信息，请参阅 Red Hat Ceph 架构指南中的 放置组(PG)。

要配置多个绑定接口，您必须创建新的网络接口模板，因为 director 不提供可用于部署多个绑定 NIC 的任何示例模板。但是，director 提供部署单个绑定接口的模板。此模板为 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml。您可以在此模板中为附加 NIC 定义额外的绑定接口。

注意

有关创建自定义模板的更多信息，请参阅高级 Overcloud 自定义指南中的创建自定义模板。

以下片段包含 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml 文件中定义的单个绑定接口的默认定义：

  type: ovs_bridge // 1
  name: br-bond
  members:
    -
      type: ovs_bond // 2
      name: bond1 // 3
      ovs_options: {get_param: BondInterfaceOvsOptions} 4
      members: // 5
        -
          type: interface
          name: nic2
          primary: true
        -
          type: interface
          name: nic3
    -
      type: vlan // 6
      device: bond1 // 7
      vlan_id: {get_param: StorageNetworkVlanID}
      addresses:
        -
          ip_netmask: {get_param: StorageIpSubnet}
    -
      type: vlan
      device: bond1
      vlan_id: {get_param: StorageMgmtNetworkVlanID}
      addresses:
        -
          ip_netmask: {get_param: StorageMgmtIpSubnet}

1: 名为 br-bond 的单个网桥包含此模板中定义的绑定。这一行定义网桥类型，即 OVS。
2: br-bond 网桥的第一个成员是绑定接口本身，名为 bond1。此行定义 bond1 的绑定类型，这也是 OVS。
3: 默认绑定名为 bond1。
4: ovs_options 条目指示 director 使用一组特定的绑定模块指令。这些指令通过 BondInterfaceOvsOptions 传递，您也可以在此文件中进行配置。有关配置绑定模块指令的详情，请参考第 4.5.1 节 “配置绑定模块指令”。
5: 绑定的 member 部分定义哪些网络接口由 bond1 绑定。在本例中，绑定接口使用 nic2 （设置为主接口）和 nic3。
6: br-bond 网桥有两个其他成员：前端(StorageNetwork)和后端(StorageMgmtNetwork)存储网络的 VLAN。
7: device 参数定义 VLAN 应使用哪个设备。在本例中，两个 VLAN 都使用绑定接口 bond1。

使用至少两个 NIC，您可以定义额外的网桥和绑定接口。然后，您可以将其中一个 VLAN 移到新的绑定接口，这会提高存储网络连接的吞吐量和可靠性。

当您自定义 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml 文件时，红帽建议您使用 Linux 绑定(type: linux_bond )，而不是默认的 OVS (type: ovs_bond)。此绑定类型更适合企业生产部署。

以下编辑的代码片段定义了额外的 OVS 网桥(br-bond2)，它存放一个名为 bond2 的新 Linux 绑定。bond2 接口使用两个额外 NIC nic4 和 nic5，仅用于后端存储网络流量：

  type: ovs_bridge
  name: br-bond
  members:
    -
      type: linux_bond
      name: bond1
      bonding_options: {get_param: BondInterfaceOvsOptions} // 1
      members:
        -
          type: interface
          name: nic2
          primary: true
        -
          type: interface
          name: nic3
    -
      type: vlan
      device: bond1
      vlan_id: {get_param: StorageNetworkVlanID}
      addresses:
        -
          ip_netmask: {get_param: StorageIpSubnet}
-
  type: ovs_bridge
  name: br-bond2
  members:
    -
      type: linux_bond
      name: bond2
      bonding_options: {get_param: BondInterfaceOvsOptions}
      members:
        -
          type: interface
          name: nic4
          primary: true
        -
          type: interface
          name: nic5
    -
      type: vlan
      device: bond1
      vlan_id: {get_param: StorageMgmtNetworkVlanID}
      addresses:
        -
          ip_netmask: {get_param: StorageMgmtIpSubnet}

1: 因为 bond1 和 bond2 都是 Linux 绑定（而非 OVS），它们使用 bonding_options 而不是 ovs_options 来设置绑定指令。更多信息请参阅第 4.5.1 节 “配置绑定模块指令”。

有关此自定义模板的完整内容，请参阅附录 B, 自定义接口模板示例：多个绑定接口。

4.5.1. 配置绑定模块指令

添加并配置绑定接口后，使用 BondInterfaceOvsOptions 参数来设置您希望每个绑定接口使用的指令。您可以在 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml 文件的 parameter : 部分找到此信息。以下片段显示了此参数的默认定义（即空）：

BondInterfaceOvsOptions:
    default: ''
    description: The ovs_options string for the bond interface. Set
                 things like lacp=active and/or bond_mode=balance-slb
                 using this option.
    type: string

在 default: 行中定义您需要的选项。例如，要使用 802.3ad（模式 4）和 LACP 速率 1 (fast)，使用 'mode=4 lacp_rate=1':

BondInterfaceOvsOptions:
    default: 'mode=4 lacp_rate=1'
    description: The bonding_options string for the bond interface. Set
                 things like lacp=active and/or bond_mode=balance-slb
                 using this option.
    type: string

有关其他支持的绑定选项的更多信息，请参阅高级 Overcloud 优化 指南中的 Open vSwitch 绑定选项。有关自定义 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml 模板的完整内容，请参阅附录 B, 自定义接口模板示例：多个绑定接口。

第 5 章自定义 Ceph Storage 集群

director 使用默认配置部署容器化 Red Hat Ceph Storage。您可以通过覆盖默认设置来自定义 Ceph Storage。

先决条件

要部署容器化 Ceph Storage，必须在 overcloud 部署期间包含 /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml 文件。此环境文件定义以下资源：

CephAnsibleDisksConfig - 此资源映射 Ceph Storage 节点磁盘布局。更多信息请参阅第 5.3 节 “映射 Ceph Storage 节点磁盘布局”。
CephConfigOverrides - 此资源将所有其他自定义设置应用到 Ceph 存储集群。

使用这些资源覆盖 director 为容器化 Ceph Storage 设置的任何默认值。

流程

启用 Red Hat Ceph Storage 4 Tools 存储库：

$ sudo subscription-manager repos --enable=rhceph-4-tools-for-rhel-8-x86_64-rpms

在 undercloud 上安装 ceph-ansible 软件包：
```
$ sudo dnf install ceph-ansible
```
要自定义 Ceph Storage 集群，在新环境文件中定义自定义参数，例如 /home/stack/templates/ceph-config.yaml。您可以在环境文件的 parameter_defaults 部分中使用以下语法应用 Ceph Storage 集群设置：
```
parameter_defaults:
  CephConfigOverrides:
    section:
      KEY:VALUE
```
注意
您可以将 CephConfigOverrides 参数应用到 ceph.conf 文件的 [global] 部分，以及其他部分，如 [osd]、[mon] 和 [client]。如果指定了部分，key:value 数据将进入指定的部分。如果您没有指定部分，则数据默认进入 [global] 部分。有关 Ceph Storage 配置、自定义和支持的参数的信息，请参阅 Red Hat Ceph Storage 配置指南。
使用您要应用的 Ceph 集群设置替换 KEY 和 VALUE。例如，在 global 部分中，max_open_files 是 KEY，131072 是对应的 VALUE ：
```
parameter_defaults:
  CephConfigOverrides:
    global:
      max_open_files: 131072
    osd:
      osd_scrub_during_recovery: false
```
此配置会产生 Ceph 集群配置文件中定义的以下设置：
```
[global]
max_open_files = 131072
[osd]
osd_scrub_during_recovery = false
```

5.1. 设置 ceph-ansible 组变量

ceph-ansible 工具是用于安装和管理 Ceph Storage 集群的 playbook。

ceph-ansible 工具有一个 group_vars 目录，用于定义配置选项和这些选项的默认设置。使用 group_vars 目录来设置 Ceph Storage 参数。

有关 group_vars 目录的信息，请参阅安装指南中的安装 Red Hat Ceph Storage 集群。

流程

要更改 director 中的变量默认值，可使用 CephAnsibleExtraConfig 参数在 heat 环境文件中传递新值。例如，要将 ceph-ansible 组变量 journal_size 设置为 40960，请创建一个具有以下 journal_size 定义的环境文件：
```
parameter_defaults:
  CephAnsibleExtraConfig:
    journal_size: 40960
```
重要
使用覆盖参数更改 ceph-ansible 组变量；请勿直接在 undercloud 上的 /usr/share/ceph-ansible 目录中编辑组变量。

5.2. Ceph 容器用于带有 Ceph Storage 的 Red Hat OpenStack Platform

要将 Red Hat OpenStack Platform (RHOSP)配置为使用带有 NFS Ganesha 的 Red Hat Ceph Storage，您必须有一个 Ceph 容器。

要与 Red Hat Enterprise Linux 8 兼容，RHOSP 16 需要 Red Hat Ceph Storage 4 或 5 (Ceph 软件包 14.x 或 Ceph 软件包 16.x)。Ceph Storage 4 和 5 容器托管在 registry.redhat.io 中，这是需要身份验证的 registry。如需更多信息，请参阅容器镜像准备参数。

5.3. 映射 Ceph Storage 节点磁盘布局

部署容器化 Ceph 存储时，您必须映射磁盘布局，并为 Ceph OSD 服务指定专用块设备。您可以在之前创建的环境文件中执行此映射，以定义自定义 Ceph 参数： /home/stack/templates/ceph-config.yaml。

使用 parameter_defaults 中的 CephAnsibleDisksConfig 资源来映射磁盘布局。这个资源使用以下变量：

变量	必需？	默认值（如果未设置）	Description
osd_scenario	是	lvm 注意：默认值为 `lvm`。	`lvm` 值允许 `ceph-ansible` 使用 `ceph-volume` 配置 OSD、`block.db` 和 BlueStore WAL 设备。
devices	是	NONE.必须设置变量。	要用于节点上 OSD 的块设备列表。
dedicated_devices	是（仅在 `osd_scenario` 为 `non-collocated`时）	devices	将 `devices` 参数中每个条目映射到专用日志块设备的块设备列表。您只能在 `osd_scenario=non-collocated` 时使用此变量。
dmcrypt	否	false	设置存储在 OSD 上的数据是加密的(`true`)还是未加密的数据(`false`)。
osd_objectstore	否	bluestore 注意：默认值为 `bluestore`。	设置 Ceph 使用的存储后端。注意：虽然默认值为 `bluestore`，但您可以在 collated 或 non-collated 场景中将 `osd_scenario` 设置为 `filestore`。您可以在非并置场景中将值设置为 `filestore`，其中 `dedicated_devices` 标识日志记录磁盘。您可以在一个协调场景中将值设置为 `filestore`，在其中对设备中定义的磁盘进行分区，并将 OSD 数据和日志数据存储在同一设备上。

5.3.1. 使用 BlueStore

流程

要指定您要用作 Ceph OSD 的块设备，请使用以下代码片段的不同：

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
      - /dev/nvme0n1
    osd_scenario: lvm
    osd_objectstore: bluestore

由于 /dev/nvme0n1 位于更高的执行设备类中，所以示例 parameter_defaults 生成三个在 /dev/sdb、/dev/sdc, 和 / dev/sdd 中运行的 OSD。三个 OSD 使用 /dev/nvme0n1 作为 block.db 和 BlueStore WAL 设备。ceph-volume 工具使用 batch 子命令进行此操作。每个 Ceph Storage 节点都重复相同的配置，并假定统一的硬件。如果 block.db 和 BlueStore WAL 数据位于与 OSD 相同的磁盘上，则使用以下方法更改参数默认值：
```
parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
    osd_scenario: lvm
    osd_objectstore: bluestore
```

5.3.2. 引用具有持久名称的设备

流程

在某些节点中，磁盘路径（如 /dev/sdb 和 /dev/sdc ）可能无法在重启后指向同一块设备。如果您的 Ceph Storage 节点是这种情况，请使用 /dev/disk/by-path/ 符号链接指定每个磁盘，以确保整个部署中的块设备映射一致：
```
parameter_defaults:
  CephAnsibleDisksConfig:
    devices:

      - /dev/disk/by-path/pci-0000:03:00.0-scsi-0:0:10:0
      - /dev/disk/by-path/pci-0000:03:00.0-scsi-0:0:11:0


    dedicated_devices:
      - /dev/nvme0n1
      - /dev/nvme0n1
```

可选：因为您必须在 overcloud 部署前设置 OSD 设备列表，因此可能无法识别和设置磁盘设备的 PCI 路径。在这种情况下，在内省期间为块设备收集 /dev/disk/by-path/symlink 数据。

在以下示例中，运行第一个命令，从服务器的 b08-h03-r620-hci 文件中的 undercloud Object Storage 服务(swift)下载内省数据，并将数据保存到名为 b08-h03-r620-hci.json 的文件中。为"by-path"运行第二个命令到 grep。此命令的输出包含可用于识别磁盘的唯一 /dev/disk/by-path 值。

(undercloud) [stack@b08-h02-r620 ironic]$ openstack baremetal introspection data save b08-h03-r620-hci | jq . > b08-h03-r620-hci.json
(undercloud) [stack@b08-h02-r620 ironic]$ grep by-path b08-h03-r620-hci.json
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:0:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:1:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:3:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:4:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:5:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:6:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:7:0",
        "by_path": "/dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:0:0",

有关存储设备的命名规则的更多信息，请参阅管理存储设备指南中的持久性命名属性概述。

5.3.3. 在高级场景中配置 OSD

在环境文件中，您要列出 CephAnsibleDisksConfig 资源的 devices 变量中要用于 OSD 的块设备。

当您在没有任何其他设备配置参数的情况下使用 devices 变量时，ceph-volume lvm batch 会自动将更高的性能设备作为较慢设备的 block.db 来优化 OSD 配置。

您可以使用以下步骤配置 设备 以避免在 ceph-volume lvm batch 模式下运行。

5.3.3.1. 使用 block.db 提高性能

使用 block.db 可以通过提高吞吐量并提高响应时间来提高 Ceph 存储集群的性能。block.db 是一个由数据片段和 BlueStore write-ahead 日志(WAL)组成的数据库。

流程

在环境文件中添加以下内容：
```
parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sda
      - /dev/sdb
      - /dev/nvme0n1
      - /dev/sdc
      - /dev/sdd
      - /dev/nvme0n2
    osd_scenario: lvm
    osd_objectstore: bluestore
```
这将配置四个 OSD： sda、sdb、sdc 和 sdd。每个对都有自己的数据库：nv em0n1 和 nvme0n2。
注意
devices 列表中设备的顺序非常显著。列出驱动器，后跟 block.db 和 BlueStore WAL (DB-WAL)设备。在示例中，nvme0n1 是 sda 和 sdb 的 DB-WAL，nvme0n2 是 sdc 和 sdd 的 DB-WAL。如需更多信息，请参阅使用 BlueStore。
在部署 overcloud 时，使用 -e 选项在部署命令中包括新内容的环境文件。

5.3.3.2. 使用专用的 write-ahead 日志(WAL)设备

您可以指定专用的 write-ahead 日志(WAL)设备。使用 devices、dedicated_devices 和 bluestore_wal_devices 意味着您可以将 OSD 的所有组件隔离到单独的设备，从而提高性能。

在以下示例中，另一个额外的字典 bluestore_wal_devices 隔离 NVMe 设备 nvme0n1 和 nvme0n2 中的 write-ahead 日志。

流程

在环境文件中添加以下内容：

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sda
      - /dev/sdb
    dedicated_devices:
      - /dev/sdx
      - /dev/sdy
    bluestore_wal_devices:
      - /dev/nvme0n1
      - /dev/nvme0n2

在部署 overcloud 时，使用 -e 选项在部署命令中包括新内容的环境文件。

5.3.3.3. 使用预先创建的 LVM 来提高控制

在前面的高级场景中，ceph-volume 使用不同类型的设备列表来为 OSD 创建逻辑卷。您还可以在 ceph-volume 运行前创建逻辑卷，然后将 ceph-volume 传递为这些逻辑卷的 lvm_volumes 列表。虽然这需要预先创建逻辑卷，但这意味着您有更精确的控制。由于 director 还负责硬件置备，因此您必须使用第一次引导脚本提前创建这些 LVM。

流程

创建一个环境文件 /home/stack/templates/firstboot.yaml，它将 heat 模板注册为 OS::TripleO::NodeUserData 资源类型并包含以下内容：
```
resource_registry:
  OS::TripleO::NodeUserData: /home/stack/templates/ceph-lvm.yaml
```

创建环境文件 /home/stack/templates/ceph-lvm.yaml。添加类似以下示例的列表，其中包括三个物理卷。如果您的设备列表更长，请根据您的要求扩展示例。

heat_template_version: 2014-10-16

description: >
  Extra hostname configuration

resources:
  userdata:
    type: OS::Heat::MultipartMime
    properties:
      parts:
      - config: {get_resource: ceph_lvm_config}

  ceph_lvm_config:
    type: OS::Heat::SoftwareConfig
    properties:
      config: |
        #!/bin/bash -x
        pvcreate /dev/sda
        vgcreate ceph_vg_hdd /dev/sda
        pvcreate /dev/sdb
        vgcreate ceph_vg_ssd /dev/sdb
        pvcreate /dev/nvme0n1
        vgcreate ceph_vg_nvme /dev/nvme0n1
        lvcreate -n ceph_lv_wal1 -L 50G ceph_vg_nvme
        lvcreate -n ceph_lv_db1 -L 500G ceph_vg_ssd
        lvcreate -n ceph_lv_data1 -L 5T ceph_vg_hdd
        lvs

outputs:
  OS::stack_id:
    value: {get_resource: userdata}

使用以下方法使用 lvm_volumes 参数而不是 devices 列表：这假设已经创建了卷组和逻辑卷。在这种情况下的典型用例是 WAL 和 DB LV 位于 SSD 上，数据 LV 位于 HDD 上：

parameter_defaults:
  CephAnsibleDisksConfig:
    osd_objectstore: bluestore
    osd_scenario: lvm
    lvm_volumes:
      - data: ceph_lv_data1
        data_vg: ceph_vg_hdd
        db: ceph_lv_db1
        db_vg: ceph_vg_ssd
        wal: ceph_lv_wal1
        wal_vg: ceph_vg_nvme

在部署 overcloud 时，使用 -e 选项在部署命令中包括新内容的环境文件。
备注
只有在该 WAL 设备位于大于 DB 设备的硬件上时，才需要指定单独的 WAL 设备。通常创建单独的 DB 设备就足够了，然后对 WAL 功能使用相同的分区。

5.4. 为不同的 Ceph 池分配自定义属性

使用 CephPools 参数将不同的属性应用到每个 Ceph 存储池或创建新的自定义池。

流程

使用您要配置的池的名称替换 POOL ：

parameter_defaults:
  CephPools:
    - name: POOL

通过执行以下操作之一配置放置组：

要手动覆盖默认设置，请将 pg_num 设置为放置组数量：

parameter_defaults:
  CephPools:
    - name: POOL
      pg_num: 128
      application: rbd

另外，要自动扩展放置组，将 pg_autoscale_mode 设置为 True，并将 target_size_ratio 设置为相对于预期的 Ceph 存储要求的百分比：

parameter_defaults:
  CephPools:
    - name: POOL
      pg_autoscale_mode: True
      target_size_ratio: PERCENTAGE
      application: rbd

将 PERCENTAGE 替换为十进制。例如，0.5 等于 50 个百分比。总百分比必须等于 1.0 或 100 百分比。

以下值仅适用于：

paramter_defaults:
  CephPools:
    - {"name": backups, "target_size_ratio": 0.1, "pg_autoscale_mode": True, "application": rbd}
    - {"name": volumes, "target_size_ratio": 0.5, "pg_autoscale_mode": True, "application": rbd}
    - {"name": vms,     "target_size_ratio": 0.2, "pg_autoscale_mode": True, "application": rbd}
    - {"name": images,  "target_size_ratio": 0.2, "pg_autoscale_mode": True, "application": rbd}

有关更多信息，请参阅 Red Hat Ceph Storage 安装指南中的放置组自动缩放器。

指定应用程序类型。
Compute、Block Storage 和 Image Storage 的应用类型是'rbd'。但是，根据您使用的池是什么，您可以指定不同的应用程序类型。
例如，gnocchi 指标池的应用类型是 openstack_gnocchi。如需更多信息，请参阅存储策略指南中的 启用应用程序。
注意
如果不使用 CephPools 参数，director 会自动设置适当的应用程序类型，但仅对默认池列表设置。
可选：添加名为 custompool 的池来创建自定义池，并设置特定于您的环境需求的参数：
```
parameter_defaults:
  CephPools:
    - name: custompool
      pg_num: 128
      application: rbd
```

这除了默认池外，还会创建新的自定义池。

提示

有关常见 Ceph 用例的典型池配置，请参阅 Ceph Placement Groups (PG) per Pool Calculator。此计算器通常用于生成用于手动配置 Ceph 池的命令。在此部署中，director 根据您的规格配置池。

警告

Red Hat Ceph Storage 3 (Luminous)引入了对 OSD 可以具有的最大 PG 数量的硬限制，默认为 200。不要覆盖此参数超过 200。如果因为 Ceph PG 数量超过最大值而出现问题，请调整每个池的 pg_num 以解决问题，而不是 mon_max_pg_per_osd。

5.5. 覆盖 dissimilar Ceph Storage 节点的参数

具有托管 Ceph OSD 角色（如 CephStorage 或 ComputeHCI ）的所有节点都使用在第 5.3 节 “映射 Ceph Storage 节点磁盘布局” 中创建的全局 devices 和 dedicated_devices 列表。这些列表假定所有这些服务器都有相同的硬件。如果存在具有硬件的服务器，则必须使用特定于节点的磁盘配置，使用特定于节点的磁盘配置，使用不同 设备和 dedicated_devices 列表的详情来更新 director。

注意

托管 Ceph OSD 的角色在 roles_data.yaml 文件中包含 OS::TripleO::Services::CephOSD 服务。

没有与其他节点相同的硬件的 Ceph Storage 节点可能会导致性能问题。在标准节点和使用 Red Hat OpenStack Platform (RHOSP)环境中特定于节点的覆盖配置的节点之间，性能损失越大。

5.5.1. 特定于节点的磁盘配置

必须为没有相同硬件的服务配置 director。这称为特定于节点的磁盘配置。

您可以使用以下方法之一创建特定于节点的磁盘配置：

自动：您可以生成 JSON heat 环境文件来自动创建特定于节点的磁盘配置。
手动：您可以更改节点磁盘布局以创建特定于节点的磁盘配置。

5.5.1.1. 为 Ceph 设备生成 JSON heat 环境文件

您可以使用 /usr/share/openstack-tripleo-heat-templates/tools/make_ceph_disk_list.py 脚本从裸机置备服务(ironic)的内省数据自动创建有效的 JSON heat 环境文件。使用此 JSON 文件将特定于节点的磁盘配置传递给 director。

流程

为要部署的 Ceph 节点导出裸机置备服务的内省数据：

openstack baremetal introspection data save oc0-ceph-0 > ceph0.json
openstack baremetal introspection data save oc0-ceph-1 > ceph1.json
...

将实用程序复制到 undercloud 上的 stack 用户的主目录，并使用它来生成 node_data_lookup.json 文件。
```
./make_ceph_disk_list.py -i ceph*.json -o node_data_lookup.json -k by_path
```
将托管 Ceph OSD 的所有节点的 openstack baremetal introspection data save 命令中的内省数据文件传递给实用程序，因为您只能在部署过程中定义 NodeDataLookup 一次。-i 选项可以采用类似 192.168.1.0/24json 的表达式或文件列表作为输入。
使用 -k 选项定义您要用来识别 OSD 磁盘的裸机置备磁盘数据结构的密钥。不要使用 name，因为它会生成类似 /dev/sdd 的设备文件，这可能并不总是在重启后指向同一设备。反之，请使用 by_path。如果没有指定 -k，这是默认设置。
裸机置备服务保留系统中的其中一个可用磁盘作为根磁盘。该工具始终从生成的设备列表中排除根磁盘。
可选：您可以使用 ./make_ceph_disk_list.py -help 查看其他可用选项。

在部署 overcloud 时，包含 node_data_lookup.json 文件以及与您环境相关的任何其他环境文件：

$ openstack overcloud deploy \
--templates \
…
-e <existing_overcloud_environment_files> \
-e node_data_lookup.json \
…

5.5.1.2. 更改 Ceph Storage 节点上的磁盘布局

重要

非异步 Ceph Storage 节点可能会导致性能问题。在标准节点和使用 Red Hat OpenStack Platform (RHOSP)环境中特定于节点的覆盖配置的节点之间，性能损失越大。

要将特定于节点的磁盘配置传递给 director，您必须将 heat 环境文件（如 node-spec-overrides.yaml ）传递给 openstack overcloud deploy 命令，并且文件内容必须通过机器唯一 UUID 和本地变量列表来标识每台服务器，以覆盖全局变量。

您可以提取每个单独服务器的机器唯一 UUID，或者从裸机置备服务(ironic)数据库中提取。

备注: 在以下步骤中，您要创建一个包含嵌入式有效 JSON 的有效 YAML 环境文件。您还可以使用 make_ceph_disk_list.py 生成完整的 JSON 文件，并将其传递给部署命令，就像 YAML 一样。有关更多信息，请参阅为 Ceph 设备生成 JSON heat 环境文件。

流程

要找到单个服务器的 UUID，请登录到服务器并输入以下命令：
```
$ dmidecode -s system-uuid
```
要从裸机置备服务数据库中提取 UUID，请在 undercloud 上输入以下命令：
```
$ openstack baremetal introspection data save NODE-ID | jq .extra.system.product.uuid
```
警告
如果 undercloud.conf 在 undercloud 安装或升级和内省之前没有 inspection_extras = true，则 machine-unique UUID 不在裸机置备服务数据库中。
重要
machine-unique UUID 不是裸机置备服务 UUID。
有效的 node-spec-overrides.yaml 文件可能类似如下：
```
parameter_defaults:
  NodeDataLookup: {"32E87B4C-C4A7-418E-865B-191684A6883B": {"devices": ["/dev/sdc"]}}
```
前两行后面的所有行都必须有效 JSON。使用 jq 命令验证 JSON 是否有效。
1. 从文件中临时删除前两行(parameter_defaults: 和 NodeDataLookup:)。
2. 输入 cat node-spec-overrides.yaml | jq。
随着 node-spec-overrides.yaml 文件增长，您还可以使用 jq 命令来确保嵌入的 JSON 有效。例如，由于 devices 和 dedicated_devices 列表必须有相同的长度，因此在开始部署前，使用以下命令来验证它们的长度是否相同。在以下示例中，node-spec-c05-h17-h21-h25-6048r.yaml 在机架 c05 中有三个服务器，其中插槽 h17、h21 和 h25 缺失磁盘。
```
(undercloud) [stack@b08-h02-r620 tht]$ cat node-spec-c05-h17-h21-h25-6048r.yaml | jq '.[] | .devices | length'
33
30
33
(undercloud) [stack@b08-h02-r620 tht]$ cat node-spec-c05-h17-h21-h25-6048r.yaml | jq '.[] | .dedicated_devices | length'
33
30
33
(undercloud) [stack@b08-h02-r620 tht]$
```

验证 JSON 后，再添加这两行使其成为有效的环境 YAML 文件(parameter_defaults: 和 NodeDataLookup:)，并在部署命令中包括它并带有 -e。

在以下示例中，更新的 heat 环境文件对 Ceph 部署使用 NodeDataLookup。除了其中一个磁盘缺少磁盘外，所有服务器都有一个带有 35 磁盘的设备列表。此环境文件只覆盖该单一节点的默认设备列表，并为节点提供必须使用的 34 磁盘列表而不是全局列表。

parameter_defaults:
  # c05-h01-6048r is missing scsi-0:2:35:0 (00000000-0000-0000-0000-0CC47A6EFD0C)
  NodeDataLookup: {
    "00000000-0000-0000-0000-0CC47A6EFD0C": {
      "devices": [
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:1:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:32:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:2:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:3:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:4:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:5:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:6:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:33:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:7:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:8:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:34:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:9:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:10:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:11:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:12:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:13:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:14:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:15:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:16:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:17:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:18:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:19:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:20:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:21:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:22:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:23:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:24:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:25:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:26:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:27:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:28:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:29:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:30:0",
    "/dev/disk/by-path/pci-0000:03:00.0-scsi-0:2:31:0"
        ],
      "dedicated_devices": [
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:81:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1",
    "/dev/disk/by-path/pci-0000:84:00.0-nvme-1"
        ]
      }
    }

5.5.2. 更改 BlueStore block.db 大小

BlueStore block.db 是数据片段和 BlueStore write-ahead 日志(WAL)的数据库。更改数据库大小的方法有两种。选择这些方法之一来更改大小。

5.5.2.1. 使用 `ceph-volume` 时更改 BlueStore `block.db` 大小

使用 ceph-volume 时，使用以下流程覆盖 block.db 大小。当 osd_scenario: lvm 时使用 ceph-volume。ceph-volume 自动设置 block.db 大小。但是，您可以为高级场景覆盖 block.db 大小。

以下示例使用 ceph-ansible 主机变量，而不是 Ceph 配置文件覆盖，以便使用的 block_db_size 传递给 ceph-volume 调用。

流程

创建一个 JSON 环境文件，其内容类似如下，但根据您的要求替换值：

{
  "parameter_defaults": {
    "NodeDataLookup": {
      "32e87b4c-c4a7-41be-865b-191684a6883b": {
        "block_db_size": 3221225472
      },
      "ea6a84d6-cf89-4fe2-b7bd-869b3fe4dd6b": {
        "block_db_size": 3221225472
      }
    }
  }
}

在部署 overcloud 时，包含与您的环境相关的任何其他环境文件：

$ openstack overcloud deploy \
--templates \
…
-e <existing_overcloud_environment_files> \
-e <json_environment_file>  \
…

5.5.2.2. 使用 `ceph-disk`时更改 BlueStore `block.db` 大小

使用 ceph-disk 时，使用以下流程覆盖 block.db 大小。当 osd_scenario: non-collocated 或 osd_scenario: collocated 时，使用 ceph-disk。

以下示例对特定节点使用 Ceph 配置覆盖来设置 blustore_block_db_size。使用 ceph-volume 时，将忽略此 Ceph 配置选项，但 ceph-disk 将使用此配置选项。

流程

创建一个 JSON 环境文件，其内容类似如下，但根据您的要求替换值：

{
  "parameter_defaults": {
    "NodeDataLookup": {
      "32e87b4c-c4a7-41be-865b-191684a6883b": {
        "ceph_conf_overrides": {
          "osd": {
            "bluestore_block_db_size": 3221225472
          }
        }
      },
      "ea6a84d6-cf89-4fe2-b7bd-869b3fe4dd6b": {
        "ceph_conf_overrides": {
          "osd": {
            "bluestore_block_db_size": 3221225472
          }
        }
      }
    }
  }
}

在部署 overcloud 时，包含与您的环境相关的任何其他环境文件：

$ openstack overcloud deploy \
--templates \
…
-e <existing_overcloud_environment_files> \
-e <json_environment_file>  \
…

5.6. 为大型 Ceph 集群增加重启延迟

在部署过程中，OSD 和 monitor 等 Ceph 服务重启，部署不会继续，直到服务再次运行为止。Ansible 等待 15 秒（延迟），并检查 5 次服务启动（重试）。如果服务没有重启，部署会停止，以便 Operator 可以干预。

根据 Ceph 集群的大小，您可能需要增加重试或延迟值。这些参数的确切名称及其默认值如下：

 health_mon_check_retries: 5
 health_mon_check_delay: 15
 health_osd_check_retries: 5
 health_osd_check_delay: 15

流程

更新 CephAnsibleExtraConfig 参数，以更改默认的延迟和重试值：
```
parameter_defaults:
  CephAnsibleExtraConfig:
    health_osd_check_delay: 40
    health_osd_check_retries: 30
    health_mon_check_delay: 20
    health_mon_check_retries: 10
```
本例使集群检查 30 次，并在每次检查 Ceph OSD 之间等待 40 秒，并检查 20 次，并在每个检查 Ceph MON 之间等待 10 秒。
要纳入更改，在 openstack overcloud deploy 中使用 -e 传递更新的 yaml 文件。

5.7. 覆盖 Ansible 环境变量

Red Hat OpenStack Platform Workflow 服务(mistral)使用 Ansible 来配置 Ceph Storage，但您可以使用 Ansible 环境变量自定义 Ansible 环境。

流程

要覆盖 ANSIBLE_* 环境变量，请使用 CephAnsibleEnvironmentVariables heat 模板参数。这个示例配置会增加 fork 和 SSH 重试次数：
```
parameter_defaults:
  CephAnsibleEnvironmentVariables:
    ANSIBLE_SSH_RETRIES: '6'
    DEFAULT_FORKS: '35'
```

如需有关 Ansible 环境变量的更多信息，请参阅 Ansible 配置设置。

有关如何自定义 Ceph Storage 集群的更多信息，请参阅自定义 Ceph 存储集群。

5.8. 启用 Ceph on-wire 加密

从 Red Hat Ceph Storage 4 及更高版本开始，您可以通过引入 messenger 版本 2 协议，为网络上的所有 Ceph 流量启用加密。me senger v2 的安全模式设置加密 Ceph 守护进程和 Ceph 客户端之间的通信，从而为您提供端到端加密。

注意

此功能用于 Red Hat OpenStack Platform (RHOSP)版本 16.1 及更新的版本。在使用外部 Red Hat Ceph Storage 版本 4 的 RHOSP 版本 13 部署中不支持它。有关更多信息，请参阅 Red Hat Ceph Storage 架构指南中的 Ceph 在线加密。

流程

要在 RHOSP 中启用 Ceph on-wire 加密，请在新的或现有自定义环境文件中配置以下参数：
```
parameter_defaults:
  CephMsgrSecureMode: true
```

更新环境文件后，重新部署 overcloud：

$ openstack overcloud deploy --templates -e <environment_file>

实现此更改后，director 会使用以下设置配置 Ceph Storage 集群：

  ms_cluster_mode: secure
  ms_service_mode: secure
  ms_client_mode: secure

有关 Ceph 在线加密的更多信息，请参阅架构指南中的 Ceph 在线加密。

第 6 章使用 director 在 Ceph Storage 集群中为不同工作负载定义性能层

您可以使用 Red Hat OpenStack Platform (RHOSP) director 部署不同的 Red Hat Ceph Storage 性能层。您可以组合 Ceph CRUSH 规则和 CephPools director 参数，以使用设备类功能并构建不同的层来满足具有不同性能要求的工作负载。例如，您可以为普通工作负载定义 HDD 类，以及一个仅将数据分布到 SSD 的 SSD 类，以实现高性能负载。在这种情况下，当您创建新的块存储卷时，您可以选择性能层，可以是 HDD 或 SSD。

WARNING: 在现有环境中定义性能层可能会导致 Ceph 集群中的大量数据移动。ceph-ansible，director 在堆栈更新过程中触发，没有逻辑来检查集群中是否已定义池，以及它是否包含数据。这意味着，在现有环境中定义性能层可能具有危险，因为与池关联的默认 CRUSH 规则更改会导致数据移动。如果您需要添加或删除节点的帮助或建议，请联系红帽支持。

注意

Ceph 会自动检测磁盘类型，并根据 Linux 内核公开的硬件属性将其分配给对应的设备类，可以是 HDD、SSD 或 NVMe。但是，您也可以根据您的需要自定义类别。

前提条件

对于新部署，Red Hat Ceph Storage (RHCS)版本 4.1 或更高版本。
对于现有部署，Red Hat Ceph Storage (RHCS)版本 4.2 或更高版本。

若要部署不同的 Red Hat Ceph Storage 性能层，可创建一个包含 CRUSH map 详细信息的新环境文件，然后将它包含在部署命令中。

在以下步骤中，每个 Ceph Storage 节点包含三个 OSD，sdb 和 sdc 是旋转磁盘，sdd 是 SSD。Ceph 会自动检测正确的磁盘类型。然后，配置两个 CRUSH 规则 HDD 和 SSD，以映射到两个对应的设备类。HDD 规则是默认设置，适用于所有池，除非您使用不同的规则配置池。

最后，您要创建一个名为 fastpool 的额外池，并将其映射到 SSD 规则。这个池最终通过 Block Storage (cinder)后端公开。任何消耗此块存储后端的工作负载都只支持 SSD 来快速性能。您可以将其用于数据或从卷引导。

6.1. 配置性能层

WARNING: 在现有环境中定义性能层可能会导致 Ceph 集群中的大量数据移动。ceph-ansible，director 在堆栈更新过程中触发，没有逻辑来检查集群中是否已定义池，以及它是否包含数据。这意味着，在现有环境中定义性能层可能具有危险，因为与池关联的默认 CRUSH 规则更改会导致数据移动。如果您需要添加或删除节点的帮助或建议，请联系红帽支持。

director 不会公开特定参数来满足此功能，但您可以通过完成以下步骤来生成 ceph-ansible 预期变量。

流程

以 stack 用户身份登录 undercloud 节点。
创建一个环境文件，如 /home/stack/templates/ceph-config.yaml，使其包含 Ceph 配置参数和设备类变量。或者，您可以将以下配置添加到现有环境文件中。

在环境文件中，使用 CephAnsibleDisksConfig 参数列出您要用作 Ceph OSD 的块设备：

CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
    osd_scenario: lvm
    osd_objectstore: bluestore

可选：Ceph 会自动检测磁盘类型并将其分配到对应的设备类。但是，您还可以使用 crush_device_class 属性来强制特定设备属于特定的类或创建自己的自定义类。以下示例包含具有指定类的相同 OSD 列表：

CephAnsibleDisksConfig:
    lvm_volumes:
      - data: ‘/dev/sdb’
        crush_device_class: ‘hdd’
      - data: ‘/dev/sdc’
        crush_device_class: ‘hdd’
      - data: ‘/dev/sdd’
        crush_device_class: ‘ssd’
    osd_scenario: lvm
    osd_objectstore: bluestore

添加 CephAnsibleExtraVars 参数。crush_rules 参数必须包含您定义或 Ceph 自动检测到的每个类的规则。在创建新池时，如果没有指定规则，则会选择您希望 Ceph 用作默认规则。

CephAnsibleExtraConfig:
    crush_rule_config: true
    create_crush_tree: true
    crush_rules:
      - name: HDD
        root: default
        type: host
        class: hdd
        default: true
      - name: SSD
        root: default
        type: host
        class: ssd
        default: false

添加 CephPools 参数：
- 使用 rule_name 参数指定不使用默认规则的每个池的层。在以下示例中，fastpool 池使用配置为快速层的 SSD 设备类来管理块存储卷。
- 将 <appropriate_PG_num > 替换为适当的放置组数量(PG)。或者，使用放置组 auto-scaler 计算 Ceph 池的 PG 数量。
  有关更多信息，请参阅将自定义属性分配给不同的 Ceph 池。
- 使用 CinderRbdExtraPools 参数将 fastpool 配置为块存储后端。
```
CephPools:
  - name: fastpool
    pg_num: <appropraiate_PG_num>
    rule_name: SSD
    application: rbd
CinderRbdExtraPools: fastpool
```

使用以下示例来确保环境文件包含正确的值：

parameter_defaults:
    CephAnsibleDisksConfig:
        devices:
            - '/dev/sdb'
            - '/dev/sdc'
            - '/dev/sdd'
        osd_scenario: lvm
        osd_objectstore: bluestore
    CephAnsibleExtraConfig:
        crush_rule_config: true
        create_crush_tree: true
        crush_rules:
            - name: HDD
              root: default
              type: host
              class: hdd
              default: true
            - name: SSD
              root: default
              type: host
              class: ssd
              default: false
    CinderRbdExtraPools: fastpool
    CephPools:
        - name: fastpool
          pg_num: <appropriate_PG_num>
          rule_name: SSD
          application: rbd

在 openstack overcloud deploy 命令中包含新环境文件。
```
$ openstack overcloud deploy \
--templates \
…
-e <other_overcloud_environment_files> \
-e /home/stack/templates/ceph-config.yaml  \
…
```
将 <other_overcloud_environment_files > 替换为作为部署一部分的其他环境文件的列表。

重要

如果将环境文件应用到现有的 Ceph 集群，则预先存在的 Ceph 池不会使用新规则更新。因此，您必须在部署完成后输入以下命令，才能将规则设置为指定的池。

$ ceph osd pool set <pool> crush_rule <rule>

将 <pool> 替换为您要将新规则应用到的池的名称。
将 <rule> 替换为您通过 crush_rules 参数指定的规则名称之一。
将 <appropriate_PG_num> 替换为适当的放置组数量或 target_size_ratio，并将 pg_autoscale_mode 设置为 true。

对于您使用这个命令更改的每个规则，更新现有条目或在现有模板的 CephPools 参数中添加新条目：

CephPools:
    - name: <pool>
      pg_num: <appropriate_PG_num>
      rule_name: <rule>
      application: rbd

6.2. 将块存储(cinder)类型映射到新的 Ceph 池

WARNING: 在现有环境中定义性能层可能会导致 Ceph 集群中的大量数据移动。ceph-ansible，director 在堆栈更新过程中触发，没有逻辑来检查集群中是否已定义池，以及它是否包含数据。这意味着，在现有环境中定义性能层可能具有危险，因为与池关联的默认 CRUSH 规则更改会导致数据移动。如果您需要添加或删除节点的帮助或建议，请联系红帽支持。

完成配置步骤后，使用 Block Storage (cinder)创建映射到您创建的 fastpool 层的类型，使性能层功能可供 RHOSP 租户使用。

流程

以 stack 用户身份登录 undercloud 节点。
获取 overcloudrc 文件：
```
$ source overcloudrc
```
检查块存储卷现有类型：
```
$ cinder type-list
```
创建新的块存储卷 fast_tier ：
```
$ cinder type-create fast_tier
```
检查是否创建了 Block Storage 类型：
```
$ cinder type-list
```
当 fast_tier Block Storage 类型可用时，将 fastpool 设置为您创建的新层的 Block Storage 卷后端：
```
$ cinder type-key fast_tier set volume_backend_name=tripleo_ceph_fastpool
```

使用新层创建新卷：

$ cinder create 1 --volume-type fast_tier --name fastdisk

6.3. 验证您是否创建了 CRUSH 规则，并且您的池是否已设置为正确的 CRUSH 规则

WARNING: 在现有环境中定义性能层可能会导致 Ceph 集群中的大量数据移动。ceph-ansible，director 在堆栈更新过程中触发，没有逻辑来检查集群中是否已定义池，以及它是否包含数据。这意味着，在现有环境中定义性能层可能具有危险，因为与池关联的默认 CRUSH 规则更改会导致数据移动。如果您需要添加或删除节点的帮助或建议，请联系红帽支持。

流程

以 heat-admin 用户身份登录 overcloud Controller 节点。
要验证 OSD 层是否已成功设置，请输入以下命令。将 <controller_hostname > 替换为主机 Controller 节点的名称。
```
$ sudo podman exec -it ceph-mon-<controller_hostname> ceph osd tree
```
在生成的树视图中，验证 CLASS 列是否显示您设置的每个 OSD 的正确设备类。
另外，使用以下命令，验证 OSD 是否已正确分配给设备类。将 <controller_hostname > 替换为主机 Controller 节点的名称。
```
$ sudo podman exec -it ceph-mon-<controller_hostname> ceph osd crush tree --show-shadow
```
将生成的层次结构与以下命令的结果进行比较，以确保为每个规则应用相同的值。
- 将 <controller_hostname > 替换为主机 Controller 节点的名称。
- 将 <rule_name> 替换为您要检查的规则的名称。
```
$ sudo podman exec <controller_hostname> ceph osd crush rule dump <rule_name>
```
根据您部署期间使用的 crush_rules 参数，验证您创建的规则名称和 ID 是否正确。将 <controller_hostname > 替换为主机 Controller 节点的名称。
```
$ sudo podman exec -it ceph-mon-<controller_hostname>  ceph osd crush rule dump | grep -E "rule_(id|name)"
```
验证 Ceph 池是否已绑定到在第 3 步中检索的正确 CRUSH 规则 ID。将 <controller_hostname > 替换为主机 Controller 节点的名称。
```
$ sudo podman exec -it ceph-mon-<controller_hostname> ceph osd dump | grep pool
```
对于每个池，请确保规则 ID 与您期望的规则名称匹配。

第 7 章创建 overcloud

当自定义环境文件就绪时，您可以指定每个角色使用的类别和节点，然后执行部署。以下小节更详细地解释了这两个步骤。

7.1. 将节点和类型分配给角色

规划 overcloud 部署涉及指定节点数量以及分配给各个角色的类别。与所有 Heat 模板参数一样，这些角色规格也会在环境文件的 parameter_defaults 部分中声明（本例中为 ~/templates/storage-config.yaml）。

为此，请使用以下参数：

表 7.1. Overcloud 节点的角色和类别

Heat 模板参数	Description
ControllerCount	扩展的 Controller 节点数量
OvercloudControlFlavor	用于 Controller 节点的 flavor (`控制`)
ComputeCount	扩展的 Compute 节点数量
OvercloudComputeFlavor	Compute 节点使用的 flavor (`计算`)
CephStorageCount	扩展的 Ceph 存储(OSD)节点数量
OvercloudCephStorageFlavor	用于 Ceph Storage (OSD)节点的 flavor (`ceph-storage`)
CephMonCount	扩展的专用 Ceph MON 节点数量
OvercloudCephMonFlavor	用于专用 Ceph MON 节点的 flavor (`ceph-mon`)
CephMdsCount	扩展的专用 Ceph MDS 节点数量
OvercloudCephMdsFlavor	用于专用 Ceph MDS 节点的 flavor (`ceph-mds`)

重要

CephMonCount、CephMdsCount、OvercloudCephMonFlavor 和 OvercloudCephMdsFlavor 参数（以及 ceph-mon 和 ceph-mds 类别）只有在您创建了自定义 CephMON 和 CephMds 角色时才有效，如第 3 章 在专用节点上部署 Ceph 服务 所述。

例如，若要将 overcloud 配置为为每个角色(Controller、Compute、Ceph-Storage 和 CephMon)部署三个节点，请将以下内容添加到您的 parameter_defaults 中：

parameter_defaults:
  ControllerCount: 3
  OvercloudControlFlavor: control
  ComputeCount: 3
  OvercloudComputeFlavor: compute
  CephStorageCount: 3
  OvercloudCephStorageFlavor: ceph-storage
  CephMonCount: 3
  OvercloudCephMonFlavor: ceph-mon
  CephMdsCount: 3
  OvercloudCephMdsFlavor: ceph-mds

注意

如需更完整的 Heat 模板参数列表，请参阅 Director 安装和使用指南中的使用 CLI 工具创建 Overcloud。

7.2. 启动 overcloud 部署

注意

在 undercloud 安装过程中，在 undercloud.conf 文件中设置 generate_service_certificate=false。否则，在部署 overcloud 时您必须注入信任锚，如高级 Overcloud 自定义指南中的 在 Overcloud 公共端点上启用 SSL/TLS 中所述。

备注: 如果要在 overcloud 部署期间添加 Ceph 仪表板，请参阅第 8 章 将 Red Hat Ceph Storage 仪表板添加到 overcloud 部署中。

创建 overcloud 需要 openstack overcloud deploy 命令的额外参数。例如：

$ openstack overcloud deploy --templates -r /home/stack/templates/roles_data_custom.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-rgw.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-mds.yaml
  -e /usr/share/openstack-tripleo-heat-templates/environments/cinder-backup.yaml \
  -e /home/stack/templates/storage-config.yaml \
  -e /home/stack/templates/ceph-config.yaml \
  --ntp-server pool.ntp.org

以上命令使用以下选项：

--templates - 从默认的 Heat 模板集合创建 Overcloud （即 /usr/share/openstack-tripleo-heat-templates/）。
-r /home/stack/templates/roles_data_custom.yaml - 指定第 3 章 在专用节点上部署 Ceph 服务 中的自定义角色定义文件，它为 Ceph MON 或 Ceph MDS 服务添加自定义角色。这些角色允许将任何一个服务安装到专用节点上。
-e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml - 设置 director 来创建 Ceph 集群。特别是，此环境文件将部署具有 容器化 Ceph Storage 节点的 Ceph 集群。
-e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-rgw.yaml - 启用 Ceph 对象网关，如第 4.2 节 “启用 Ceph 对象网关” 所述。
-e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-mds.yaml - 启用 Ceph 元数据服务器，如第 4.1 节 “启用 Ceph 元数据服务器” 所述。
-e /usr/share/openstack-tripleo-heat-templates/environments/cinder-backup.yaml - 启用块存储备份服务(cinder-backup)，如第 4.4 节 “将备份服务配置为使用 Ceph” 所述。
-e /home/stack/templates/storage-config.yaml - 添加包含自定义 Ceph Storage 配置的环境文件。
-e /home/stack/templates/ceph-config.yaml - 添加包含自定义 Ceph 集群设置的环境文件，如第 5 章 自定义 Ceph Storage 集群 所述。
--ntp-server pool.ntp.org - 设置 NTP 服务器。

提示

您还可以使用 回答文件 调用所有模板和环境文件。例如，您可以使用以下命令部署相同的 overcloud：

$ openstack overcloud deploy -r /home/stack/templates/roles_data_custom.yaml \
  --answers-file /home/stack/templates/answers.yaml --ntp-server pool.ntp.org

在这种情况下，回答文件 /home/stack/templates/answers.yaml 包含：

templates: /usr/share/openstack-tripleo-heat-templates/
environments:
  - /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml
  - /usr/share/openstack-tripleo-heat-templates/environments/ceph-rgw.yaml
  - /usr/share/openstack-tripleo-heat-templates/environments/ceph-mds.yaml
  - /usr/share/openstack-tripleo-heat-templates/environments/cinder-backup.yaml
  - /home/stack/templates/storage-config.yaml
  - /home/stack/templates/ceph-config.yaml

如需了解更多详细信息，请参阅 overcloud 部署中包含环境文件。

如需完整的选项列表，请输入：

$ openstack help overcloud deploy

如需更多信息，请参阅 Director 安装和使用指南中的使用 CLI 工具配置基本的 overcloud。

overcloud 创建过程开始，director 会置备节点。完成此过程需要一些时间。要查看 overcloud 创建的状态，请以 stack 用户身份打开一个单独的终端，并输入以下命令：

$ source ~/stackrc
$ openstack stack list --nested

7.2.1. 限制运行 `ceph-ansible` 的节点

您可以通过限制运行 ceph-ansible 的节点来缩短部署更新时间。当 Red Hat OpenStack Platform (RHOSP)使用 config-download 配置 Ceph 时，您可以使用 --limit 选项指定节点列表，而不是在整个部署中运行 config-download 和 ceph-ansible。此功能很有用，例如，作为扩展 overcloud 的一部分或替换失败的磁盘的一部分。在这些情况下，部署只能在添加到环境中的新节点上运行。

在故障磁盘替换中使用 --limit 的示例

在以下示例中，Ceph 存储节点 oc0-cephstorage-0 有一个磁盘故障，以便它收到新的工厂清理磁盘。Ansible 需要在 oc0-cephstorage-0 节点上运行，以便新磁盘可以用作 OSD，但它不需要在所有其他 Ceph 存储节点上运行。将示例环境文件和节点名称替换为您的环境。

流程

以 stack 用户身份登录 undercloud 节点，并提供 stackrc 凭证文件：
```
# source stackrc
```
完成以下步骤以之一，以便使用新磁盘来启动缺少的 OSD。
- 运行堆栈更新并包含 --limit 选项，以指定您希望 ceph-ansible 运行的节点：
```
$ openstack overcloud deploy --templates \
  -r /home/stack/roles_data.yaml \
  -n /usr/share/openstack-tripleo-heat-templates/network_data_dashboard.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \
  -e ~/my-ceph-settings.yaml \
  -e <other-environment_files> \
  --limit oc0-controller-0:oc0-controller-2:oc0-controller-1:oc0-cephstorage-0:undercloud
```
  在本例中，包含控制器，因为 Ceph mons 需要 Ansible 来更改其 OSD 定义。
- 如果 config-download 创建了 ansible-playbook-command.sh 脚本，您也可以使用 --limit 选项运行脚本，将指定节点传递给 ceph-ansible ：
```
./ansible-playbook-command.sh --limit oc0-controller-0:oc0-controller-2:oc0-controller-1:oc0-cephstorage-0:undercloud
```
  警告
  在使用 --limit 时，您必须始终在限制列表中包含 undercloud，否则无法执行 ceph-ansible。这是必要的，因为 ceph-ansible 执行通过 external_deploy_steps_tasks playbook 进行，该 playbook 仅在 undercloud 上运行。

第 8 章将 Red Hat Ceph Storage 仪表板添加到 overcloud 部署中

默认情况下，Red Hat Ceph Storage Dashboard 被禁用，但您可以使用 Red Hat OpenStack Platform director 在 overcloud 中启用它。Ceph 控制面板是一个内置的基于 Web 的 Ceph 管理和监控应用，用于管理集群中的各种方面和对象。Red Hat Ceph Storage Dashboard 包含以下组件：

Ceph 控制面板管理器模块提供用户界面，并嵌入平台前端 Grafana。
Prometheus，监控插件。
Alertmanager 将警报发送到仪表板。
节点导出器将集群数据导出到仪表板。

注意

Ceph Storage 4.1 或更高版本支持此功能。有关如何确定系统上安装的 Ceph Storage 版本的更多信息，请参阅 Red Hat Ceph Storage 发行版本以及对应的 Ceph 软件包版本。

注意

Red Hat Ceph Storage 仪表板始终与其他 Ceph 管理器组件位于同一个节点上。[NOTE] 如果要在初始 overcloud 部署期间添加 Ceph 仪表板，请在第 7.2 节 “启动 overcloud 部署” 中部署初始 overcloud 前完成本章中的步骤。

下图显示了 Red Hat OpenStack Platform 上的 Ceph 仪表板架构：

有关控制面板及其功能及限制的更多信息，请参阅 Red Hat Ceph Storage Dashboard 指南中的控制面板功能。

与 Ceph 控制面板的 TLS

控制面板前端与任何地方的 TLS 集成。您可以在任何地方启用 TLS，您可以拥有所需的环境文件，并将它们包含在 overcloud deploy 命令中。这会在 overcloud 部署期间触发 Grafana 和 Ceph 仪表板和生成的 证书和密钥文件 的证书请求。有关如何为仪表板启用 TLS 和其他 openstack 服务的说明，请参阅高级 Overcloud 自定义指南中的 以下位置：

注意

到达 Ceph 控制面板的端口即使在 TLS 上下文中保持不变。

8.1. 包含 Ceph 仪表板所需的容器

在将 Ceph 控制面板模板添加到 overcloud 之前，您必须使用 containers-prepare-parameter.yaml 文件包含必要的容器。要生成 containers-prepare-parameter.yaml 文件来准备您的容器镜像，请完成以下步骤：

流程

以 stack 用户身份登录 undercloud 主机。

生成默认的容器镜像准备文件：

$ sudo openstack tripleo container image prepare default \
  --local-push-destination \
  --output-env-file containers-prepare-parameter.yaml

编辑 containers-prepare-parameter.yaml 文件并进行修改以满足您的要求。以下示例 containers-prepare-parameter.yaml 文件包含与仪表板服务相关的镜像位置和标签，包括 Grafana、Prometheus、Alertmanager 和 Node Exporter。根据您的具体场景编辑值：

parameter_defaults:
    ContainerImagePrepare:
    - push_destination: true
        set:
            ceph_alertmanager_image: ose-prometheus-alertmanager
            ceph_alertmanager_namespace: registry.redhat.io/openshift4
            ceph_alertmanager_tag: v4.6
            ceph_grafana_image: rhceph-4-dashboard-rhel8
            ceph_grafana_namespace: registry.redhat.io/rhceph
            ceph_grafana_tag: 4
            ceph_image: rhceph-4-rhel8
            ceph_namespace: registry.redhat.io/rhceph
            ceph_node_exporter_image: ose-prometheus-node-exporter
            ceph_node_exporter_namespace: registry.redhat.io/openshift4
            ceph_node_exporter_tag: v4.6
            ceph_prometheus_image: ose-prometheus
            ceph_prometheus_namespace: registry.redhat.io/openshift4
            ceph_prometheus_tag: v4.6
            ceph_tag: latest

有关使用 containers-prepare-parameter.yaml 文件的 registry 和镜像配置的更多信息，请参阅过渡到 Containerized Services 指南中的容器镜像准备参数。

8.2. 部署 Ceph 仪表板

包含用于部署 Ceph 仪表板的 ceph-dashboard 环境文件。

注意

如果要使用可组合网络部署 Ceph 控制面板，请参阅第 8.3 节 “使用可组合网络部署 Ceph 仪表板”。

注意

Ceph 控制面板 admin 用户角色默认设置为只读模式。要更改 Ceph 控制面板 admin 默认模式，请参阅第 8.4 节 “更改默认权限”。

流程

以 stack 用户身份登录 undercloud 节点。
可选： Ceph Dashboard 网络默认设置为 provisioning 网络。如果要部署 Ceph 控制面板并通过其他网络访问它，请创建一个环境文件，例如： ceph_dashboard_network_override.yaml。将 CephDashboardNetwork 设置为现有 overcloud 路由网络之一，如 external ：
```
  parameter_defaults:
    ServiceNetMap:
      CephDashboardNetwork: external
```
重要
更改 CephDashboardNetwork 值，以在初始部署后不支持从不同网络访问 Ceph 控制面板。
在 openstack overcloud deploy 命令中包含以下环境文件。包含属于部署一部分的所有环境文件，以及 ceph_dashboard_network_override.yaml 文件（如果选择更改默认网络）：
```
$ openstack overcloud deploy \
 --templates \
 -e <overcloud_environment_files> \
 -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \
 -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-dashboard.yaml \
 -e ceph_dashboard_network_override.yaml
```
将 <overcloud_environment_files > 替换为作为部署一部分的环境文件列表。
结果
生成的部署包含一个带有 grafana、prometheus、alertmanager 和 node-exporter 容器的外部堆栈。Ceph 控制面板管理器模块是此堆栈的后端，它嵌入 grafana 布局，以便为最终用户提供 ceph 集群特定指标。

8.3. 使用可组合网络部署 Ceph 仪表板

您可以在可组合网络上部署 Ceph 控制面板，而不是部署到默认的 Provisioning 网络中。这消除了在 Provisioning 网络上公开 Ceph 控制面板服务的需要。当您在可组合网络上部署仪表板时，您还可以实施单独的授权配置集。

您必须在部署前选择使用哪个网络，因为只能在首次部署 overcloud 时将控制面板应用到新网络中。在部署前，使用以下步骤选择可组合网络。

流程

以 stack 用户的身份登录 undercloud。
生成特定于 Controller 的角色，使其包含 Dashboard 可组合网络：
```
$ openstack overcloud roles generate -o /home/stack/roles_data_dashboard.yaml ControllerStorageDashboard Compute BlockStorage ObjectStorage CephStorage
```
结果
在 roles_data.yaml 中生成新的 ControllerStorageDashboard 角色，定义为命令的输出。使用 overcloud deploy 命令时，您必须将此文件包含在模板列表中。
注意： ControllerStorageDashboard 角色不包含 CephNFS 或 network_data_dashboard.yaml。
director 提供了一个网络环境文件，其中定义了可组合网络。此文件的默认位置为 /usr/share/openstack-tripleo-heat-templates/network_data_dashboard.yaml。使用 overcloud deploy 命令时，您必须将此文件包含在 overcloud 模板列表中。

在 openstack overcloud deploy 命令中包含以下环境文件，以及属于部署的所有环境文件：

$ openstack overcloud deploy \
  --templates \
  -r /home/stack/roles_data.yaml \
  -n /usr/share/openstack-tripleo-heat-templates/network_data_dashboard.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/network-isolation.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/network-environment.yaml \
  -e <overcloud_environment_files> \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \
  -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-dashboard.yaml

将 <overcloud_environment_files > 替换为作为部署一部分的环境文件列表。

结果: 生成的部署包含一个带有 grafana、prometheus、alertmanager 和 node-exporter 容器的外部堆栈。Ceph 控制面板管理器模块是此堆栈的后端，它嵌入 grafana 布局，为最终用户提供特定于 Ceph 集群的指标。

8.4. 更改默认权限

Ceph 控制面板 admin 用户角色默认设置为只读模式，以安全监控 Ceph 集群。要允许 admin 用户具有升级的特权，以便使用控制面板更改 Ceph 集群的元素，您可以使用 CephDashboardAdminRO 参数更改默认的 admin 权限。

警告: 具有完整权限的用户可能会更改 director 配置的集群的元素。这可能会导致在运行堆栈更新时与 director 配置选项冲突。为避免这个问题，请不要通过 Ceph 控制面板更改 director 配置的选项，例如 Ceph OSP 池属性。

流程

以 stack 用户的身份登录 undercloud。

创建以下 ceph_dashboard_admin.yaml 环境文件：

  parameter_defaults:
     CephDashboardAdminRO: false

运行 overcloud deploy 命令以更新现有堆栈，并包含您使用现有部署一部分的所有其他环境文件创建的环境文件：
```
$ openstack overcloud deploy \
--templates \
-e <existing_overcloud_environment_files> \
-e ceph_dashboard_admin.yml
```
使用作为现有部署一部分的环境文件列表替换。<existing_overcloud_environment_files>

8.5. 访问 Ceph 仪表板

要测试 Ceph 控制面板是否正确运行，请完成以下验证步骤来访问它，并检查它是否从 Ceph 集群显示的数据是否正确。

流程

以 stack 用户身份登录 undercloud 节点。

检索仪表板 admin 登录凭证：

[stack@undercloud ~]$ grep dashboard_admin_password /var/lib/mistral/overcloud/ceph-ansible/group_vars/all.yml

检索 VIP 地址来访问 Ceph 仪表板：

[stack@undercloud-0 ~]$ grep dashboard_frontend_vip /var/lib/mistral/overcloud/ceph-ansible/group_vars/all.yml

使用 Web 浏览器指向前端 VIP 并访问控制面板。director 在 provisioning 网络中配置和公开控制面板，因此您可以使用您检索的 VIP 直接在 TCP 端口 8444 上访问仪表板。确保满足以下条件：
- Web 客户端主机为第 2 层连接到 provisioning 网络。
- 置备网络已正确路由或代理，可以从 web 客户端主机访问。如果没有满足这些条件，您仍然可以打开 SSH 隧道来访问 overcloud 上的 Dashboard VIP：
```
client_host$ ssh -L 8444:<dashboard_vip>:8444 stack@<your undercloud>
```
  将 <dashboard_vip> 替换为您检索的 control plane VIP 的 IP 地址。
要访问仪表板，使用浏览器访问 http://localhost:8444，并使用以下详情进行登录：
- ceph-ansible 创建的默认用户： admin。
- /var/lib/mistral/overcloud/ceph-ansible/group_vars/all.yml 中的密码。
  结果
- 您可以访问 Ceph 控制面板。
- 控制面板显示的数字和图形反映了 CLI 命令 ceph -s 返回的同一集群状态。

有关 Red Hat Ceph Storage 仪表板的更多信息，请参阅 Red Hat Ceph Storage 管理指南

第 9 章 post-deployment

以下小节描述了用于管理 Ceph 集群的几个部署后操作。

9.1. 访问 overcloud

director 会生成脚本来配置和帮助认证 undercloud 与 overcloud 的交互。director 将此文件保存为 stack 用户主目录的 overcloudrc 文件。

运行以下命令来使用此文件：
```
$ source ~/overcloudrc
```
这会加载必要的环境变量，以便从 undercloud CLI 与 overcloud 交互。要返回与 undercloud 进行交互的状态，请运行以下命令：
```
$ source ~/stackrc
```

9.2. 监控 Ceph Storage 节点

创建 overcloud 后，检查 Ceph Storage 集群的状态，以确保它正常工作。

流程

以 heat-admin 用户身份登录 Controller 节点：
```
$ nova list
$ ssh heat-admin@192.168.0.25
```
检查集群的健康状况：
```
$ sudo podman exec ceph-mon-<HOSTNAME> ceph health
```
如果集群没有问题，命令会报告 HEALTH_OK。这意味着集群可以安全地使用。
登录到运行 Ceph 监控服务的 overcloud 节点，并检查集群中的所有 OSD 的状态：
```
$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd tree
```
检查 Ceph Monitor 仲裁的状态：
```
$ sudo podman exec ceph-mon-<HOSTNAME> ceph quorum_status
```
这显示了参与仲裁的监控器，另一个是领导。

验证所有 Ceph OSD 是否正在运行：

$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd stat

有关监控 Ceph Storage 集群的更多信息，请参阅 Red Hat Ceph Storage 管理指南中的 监控。

第 10 章重新引导环境

在某些情况下，您可能需要重新引导环境。例如，当您可能需要修改物理服务器时，您可能需要从电源中断中恢复。在这种情况下，务必要确保 Ceph Storage 节点正确引导。

确保按照以下顺序引导节点：

首先引导所有 Ceph 监控节点 - 这样可确保 Ceph 监控服务在高可用性集群中处于活动状态。默认情况下，Ceph Monitor 服务安装在 Controller 节点上。如果 Ceph Monitor 与自定义角色中的 Controller 分开，请确保此自定义 Ceph Monitor 角色处于活动状态。
引导所有 Ceph Storage 节点 - 这样可确保 Ceph OSD 集群可以连接到 Controller 节点上的活跃 Ceph Monitor 集群。

10.1. 重新引导 Ceph Storage (OSD) 集群

完成以下步骤以重新引导 Ceph Storage (OSD) 节点集群。

先决条件

在运行 ceph-mon 服务的 Ceph Monitor 或 Controller 节点上，检查 Red Hat Ceph Storage 集群状态是否健康，pg 状态为 active+clean ：
```
$ sudo podman exec -it ceph-mon-controller-0 ceph -s
```
如果 Ceph 集群处于健康状态，它会返回 HEALTH_OK 状态。
如果 Ceph 集群状态不健康，它会返回 HEALTH_WARN 或 HEALTH_ERR 的状态。有关故障排除指南，请参阅 Red Hat Ceph Storage 4 故障排除指南。

步骤

登录到运行 ceph-mon 服务的 Ceph Monitor 或 Controller 节点，并临时禁用 Ceph Storage 集群重新平衡：
```
$ sudo podman exec -it ceph-mon-controller-0 ceph osd set noout
$ sudo podman exec -it ceph-mon-controller-0 ceph osd set norebalance
```
注意
如果您有多堆栈或分布式计算节点(DCN)架构，您必须在设置 noout 和 norebalance 标志时指定集群名称。例如： sudo podman exec -it ceph-mon-controller-0 ceph osd set noout --cluster <cluster_name>
选择第一个要重新引导的 Ceph Storage 节点并登录到该节点。
重新引导节点：
```
$ sudo reboot
```
稍等片刻，直到节点启动。
登录到节点，并检查集群的状态：
```
$ sudo podman exec -it ceph-mon-controller-0 ceph status
```
确认 pgmap 报告的所有 pgs 的状态是否都正常 (active+clean)。
注销节点，重新引导下一个节点，并检查其状态。重复此过程，直到您已重新引导所有 Ceph Storage 节点。
完成后，登录到运行 ceph-mon 服务的 Ceph Monitor 或 Controller 节点，然后重新启用集群重新平衡：
```
$ sudo podman exec -it ceph-mon-controller-0 ceph osd unset noout
$ sudo podman exec -it ceph-mon-controller-0 ceph osd unset norebalance
```
注意
如果您有多堆栈或分布式计算节点(DCN)架构，您必须在取消设置 noout 和 norebalance 标志时指定集群名称。例如： sudo podman exec -it ceph-mon-controller-0 ceph osd set noout --cluster <cluster_name>
执行最后的状态检查，确认集群报告 HEALTH_OK：
```
$ sudo podman exec -it ceph-mon-controller-0 ceph status
```

如果发生所有 overcloud 节点同时引导的情况，Ceph OSD 服务可能无法在 Ceph Storage 节点上正确启动。在这种情况下，重新引导 Ceph Storage OSD，以便它们能够连接到 Ceph Monitor 服务。

使用以下命令，验证 Ceph Storage 节点的集群的 HEALTH_OK 状态：
```
$ sudo ceph status
```

第 11 章扩展 Ceph Storage 集群

11.1. 扩展 Ceph Storage 集群

您可以使用您需要的 Ceph Storage 节点数量重新运行部署来扩展 overcloud 中的 Ceph Storage 节点数量。

在执行此操作前，请确保您有足够的节点可用于更新的部署。这些节点必须使用 director 注册，并相应地标记。

注册新的 Ceph Storage 节点

要将新的 Ceph 存储节点注册到 director，请完成以下步骤。

流程

以 stack 用户身份登录 undercloud，并初始化 director 配置：
```
$ source ~/stackrc
```
在新节点定义模板中定义新节点的硬件和电源管理详情，例如 instackenv-scale.json。
将此文件导入到 director：
```
$ openstack overcloud node import ~/instackenv-scale.json
```
导入节点定义模板会将定义的每个节点注册到 director。
将内核和 ramdisk 镜像分配给所有节点：
```
$ openstack overcloud node configure
```

注意

有关注册新节点的详情请参考第 2.2 节 “注册节点”。

手动标记新节点

注册每个节点后，您必须检查硬件并将节点标记为特定的配置集。使用配置集标签将您的节点与类别匹配，然后将类别分配到部署角色。

流程

触发硬件内省以检索每个节点的属性：
```
$ openstack overcloud node introspect --all-manageable --provide
```
- --all-manageable 选项仅内省处于受管理状态的节点。在此示例中，所有节点都处于受管理状态。
- --provide 选项会在内省后将所有节点重置 为活动状态。
  重要
  确保此过程成功完成。它可能需要 15 分钟来检查这些裸机节点。
检索节点列表来识别它们的 UUID：
```
$ openstack baremetal node list
```

在每个节点的 properties/capabilities 参数中添加 profile 选项，来手动将节点标记到特定的配置集。添加 profile 选项将节点标记为相关的配置集。

注意

作为手动标记的替代选择，请使用自动健康检查(AHC)工具根据基准测试数据自动标记大量节点。例如，以下命令使用 ceph-storage 配置集标记三个额外的节点：

$ openstack baremetal node set --property capabilities='profile:baremetal,boot_option:local' 551d81f5-4df2-4e0f-93da-6c5de0b868f7
$ openstack baremetal node set --property capabilities='profile:baremetal,boot_option:local' 5e735154-bd6b-42dd-9cc2-b6195c4196d7
$ openstack baremetal node set --property capabilities='profile:baremetal,boot_option:local' 1a2b090c-299d-4c20-a25d-57dd21a7085b

提示

如果您标记和注册的节点使用多个磁盘，您可以将 director 设置为在每个节点上使用特定的根磁盘。更多信息请参阅第 2.5 节 “为多磁盘集群定义根磁盘”。

使用额外的 Ceph Storage 节点重新部署 overcloud

注册并标记新节点后，您可以通过重新部署 overcloud 来扩展 Ceph Storage 节点的数量。

流程

在重新部署 overcloud 之前，请在环境文件的 parameter_defaults 中设置 CephStorageCount 参数，本例中为 ~/templates/storage-config.yaml。在第 7.1 节 “将节点和类型分配给角色” 中，overcloud 配置为部署三个 Ceph Storage 节点。以下示例将 overcloud 扩展为 6 个节点：
```
parameter_defaults:
  ControllerCount: 3
  OvercloudControlFlavor: control
  ComputeCount: 3
  OvercloudComputeFlavor: compute
  CephStorageCount: 6
  OvercloudCephStorageFlavor: ceph-storage
  CephMonCount: 3
  OvercloudCephMonFlavor: ceph-mon
```
重新部署 overcloud。overcloud 现在有六个 Ceph Storage 节点，而不是三个。

11.2. 缩减和替换 Ceph Storage 节点

在某些情况下，您可能需要缩减 Ceph 集群，甚至替换 Ceph Storage 节点，例如，如果 Ceph Storage 节点出现故障。在这两种情况下，您必须禁用并重新平衡您要从 overcloud 中删除的任何 Ceph Storage 节点，以避免数据丢失。

注意

此流程使用 Red Hat Ceph Storage 管理指南中的 步骤手动删除 Ceph Storage 节点。有关手动删除 Ceph Storage 节点的更多信息，请参阅启动、停止和重启容器中运行的 Ceph 守护进程，并使用命令行界面删除 Ceph OSD。

流程

以 heat-admin 用户身份登录 Controller 节点。director stack 用户具有访问 heat-admin 用户的 SSH 密钥。

列出 OSD 树，再查找节点的 OSD。例如，您要删除的节点可能包含以下 OSD：

-2 0.09998     host overcloud-cephstorage-0
0 0.04999         osd.0                         up  1.00000          1.00000
1 0.04999         osd.1                         up  1.00000          1.00000

禁用 Ceph Storage 节点上的 OSD。在本例中，OSD ID 是 0 和 1。

[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd out 0
[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd out 1

Ceph Storage 集群开始重新平衡。等待此过程完成。使用以下命令跟踪状态：
```
[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph -w
```

Ceph 集群完成重新平衡后，以 heat-admin 用户身份登录您要删除的 Ceph Storage 节点，本例中为 overcloud-cephstorage-0，再停止并禁用节点。

[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl stop ceph-osd@0
[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl stop ceph-osd@1
[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl disable ceph-osd@0
[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl disable ceph-osd@1

停止 OSD。

[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl stop ceph-osd@0
[heat-admin@overcloud-cephstorage-0 ~]$ sudo systemctl stop ceph-osd@1

[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd crush remove osd.0
[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd crush remove osd.1

移除 OSD 身份验证密钥。

[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph auth del osd.0
[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph auth del osd.1

从集群中移除 OSD。

[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd rm 0
[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd rm 1

从 CRUSH map 中删除存储节点：

[heat-admin@overcloud-controller-0 ~]$ sudo docker exec ceph-mon-<HOSTNAME> ceph osd crush rm <NODE>
[heat-admin@overcloud-controller-0 ~]$ sudo ceph osd crush remove <NODE>

您可以通过搜索 CRUSH 树来确认 CRUSH map 中定义的 <NODE> 名称：

[heat-admin@overcloud-controller-0 ~]$ sudo podman exec ceph-mon-<HOSTNAME> ceph osd crush tree | grep overcloud-osd-compute-3 -A 4
                "name": "overcloud-osd-compute-3",
                "type": "host",
                "type_id": 1,
                "items": []
            },
[heat-admin@overcloud-controller-0 ~]$

在 CRUSH 树中，确保项目列表为空。如果列表不为空，请重新查看第 7 步。

退出节点，以 stack 用户身份返回到 undercloud。

[heat-admin@overcloud-controller-0 ~]$ exit
[stack@director ~]$

禁用 Ceph Storage 节点，以便 director 不会重新置备该节点。

[stack@director ~]$ openstack baremetal node list
[stack@director ~]$ openstack baremetal node maintenance set UUID

移除 Ceph Storage 节点需要利用本地模板文件对 director 中的 overcloud 堆栈进行更新。首先确定 overcloud 堆栈的 UUID：
```
$ openstack stack list
```
识别您要删除的 Ceph Storage 节点的 UUID：
```
$ openstack server list
```
从堆栈中删除节点：
```
(undercloud)$ openstack overcloud node delete --stack <overcloud> <node>
```
- 将 <overcloud> 替换为 overcloud 堆栈的名称或 UUID。
- 将 & lt;node > 替换为您要删除的节点的主机名或 UUID。
等待堆栈完成更新。使用 heat stack-list --show-nested 命令监控堆栈更新。
将新节点添加到 director 节点池中，并将它们部署为 Ceph Storage 节点。使用环境文件的 parameter_defaults 中的 CephStorageCount 参数，本例中为 ~/templates/storage-config.yaml，以在 overcloud 中定义 Ceph Storage 节点总数。
```
parameter_defaults:
  ControllerCount: 3
  OvercloudControlFlavor: control
  ComputeCount: 3
  OvercloudComputeFlavor: compute
  CephStorageCount: 3
  OvercloudCephStorageFlavor: ceph-storage
  CephMonCount: 3
  OvercloudCephMonFlavor: ceph-mon
```
注意
有关如何定义每个角色的节点数量的更多信息，请参阅第 7.1 节 “将节点和类型分配给角色”。
更新环境文件后，重新部署 overcloud：
```
$ openstack overcloud deploy --templates -e <ENVIRONMENT_FILE>
```
director 置备新节点并使用新节点的详细信息更新整个堆栈。
以 heat-admin 用户身份登录 Controller 节点，并检查 Ceph Storage 节点的状态：
```
[heat-admin@overcloud-controller-0 ~]$ sudo ceph status
```
确认 osdmap 部分中的值与您想要的集群中的节点数量匹配。您移除的 Ceph Storage 节点被替换为新节点。

11.3. 将 OSD 添加到 Ceph Storage 节点

此流程演示了如何将 OSD 添加到节点。有关 Ceph OSD 的更多信息，请参阅 Red Hat Ceph Storage Operations 指南中的 Ceph OSD。

流程

请注意，以下 heat 模板使用三个 OSD 设备部署 Ceph Storage：

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
    osd_scenario: lvm
    osd_objectstore: bluestore

要添加 OSD，更新节点磁盘布局，如第 5.3 节 “映射 Ceph Storage 节点磁盘布局” 所述。在本例中，将 /dev/sde 添加到模板中：

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
      - /dev/sde
    osd_scenario: lvm
    osd_objectstore: bluestore

运行 openstack overcloud deploy 以更新 overcloud。

注意

在本例中，具有 OSD 的所有主机都有一个名为 /dev/sde 的新设备。如果您不希望所有节点都具有新设备，请更新 heat 模板。有关如何使用不同 devices 列表定义主机的详情，请参考第 5.5 节 “覆盖 dissimilar Ceph Storage 节点的参数” 和第 5.5.1.2 节 “更改 Ceph Storage 节点上的磁盘布局”。

11.4. 从 Ceph Storage 节点移除 OSD

此流程演示了如何从节点中删除 OSD。它假设以下有关环境的信息：

服务器(ceph-storage0)有一个 OSD (ceph-osd@4)，运行在 /dev/sde。
Ceph 监控服务(ceph-mon)在 controller0 上运行。
有足够的 OSD 来确保存储集群没有达到接近满比率。

有关 Ceph OSD 的更多信息，请参阅 Red Hat Ceph Storage Operations 指南中的 Ceph OSD。

流程

SSH 到 ceph-storage0，并以 root 身份登录。

禁用并停止 OSD 服务：

[root@ceph-storage0 ~]# systemctl disable ceph-osd@4
[root@ceph-stoarge0 ~]# systemctl stop ceph-osd@4

从 ceph-storage0 断开连接。
SSH 到 controller0，并以 root 身份登录。

识别 Ceph 监控容器的名称：

[root@controller0 ~]# podman ps | grep ceph-mon
ceph-mon-controller0
[root@controller0 ~]#

启用 Ceph 监控容器，将不需要的 OSD 标记为 out ：
```
[root@controller0 ~]# podman exec ceph-mon-controller0 ceph osd out 4
```
注意
此命令使 Ceph 重新平衡存储集群，并将数据复制到集群中的其他 OSD。在重新平衡完成前，集群会临时保留 active+clean 状态。
运行以下命令并等待存储集群状态变为 active+clean ：
```
[root@controller0 ~]# podman exec ceph-mon-controller0 ceph -w
```

从 CRUSH map 中删除 OSD，以便它不再接收数据：

[root@controller0 ~]# podman exec ceph-mon-controller0 ceph osd crush remove osd.4

删除 OSD 身份验证密钥：

[root@controller0 ~]# podman exec ceph-mon-controller0 ceph auth del osd.4

删除 OSD：

[root@controller0 ~]# podman exec ceph-mon-controller0 ceph osd rm 4

从 controller0 断开连接。
以 stack 用户身份 SSH 到 undercloud，并找到您定义 CephAnsibleDisksConfig 参数的 heat 环境文件。

注意 heat 模板包含四个 OSD：

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
      - /dev/sde
    osd_scenario: lvm
    osd_objectstore: bluestore

修改模板以删除 /dev/sde。

parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
    osd_scenario: lvm
    osd_objectstore: bluestore

运行 openstack overcloud deploy 以更新 overcloud。
注意
在本例中，您将从具有 OSD 的所有主机中删除 /dev/sde 设备。如果您没有从所有节点中删除同一设备，请更新 heat 模板。有关如何使用不同 devices 列表定义主机的详情，请参考第 5.5 节 “覆盖 dissimilar Ceph Storage 节点的参数”。

第 12 章替换失败的磁盘

如果其中一个磁盘在 Ceph 集群中失败，请完成以下步骤来替换它：

确定是否存在设备名称更改，请参阅第 12.1 节 “确定设备名称是否有变化”。
确保 OSD 已关闭并销毁，请参阅第 12.2 节 “确保 OSD 已关闭并销毁”。
从系统中删除旧磁盘并安装替换磁盘，请参阅第 12.3 节 “从系统中删除旧磁盘并安装替换磁盘”。
验证磁盘替换是否成功，请参阅第 12.4 节 “验证磁盘替换是否成功”。

12.1. 确定设备名称是否有变化

在替换磁盘前，请确定替换 OSD 的替换磁盘在操作系统中是否与您要替换的设备不同。如果替换磁盘具有不同的名称，您必须更新 devices 列表的 Ansible 参数，以便后续运行 ceph-ansible，包括 director 运行 ceph-ansible 时不会因为更改而失败。有关使用 director 时必须更改的设备列表示例，请参阅第 5.3 节 “映射 Ceph Storage 节点磁盘布局”。

警告

如果设备名称更改，并且您按照以下流程在 ceph-ansible 或 director 之外更新您的系统，则配置管理工具不会与它们管理的系统不同步，直到您更新系统定义文件并重新处理配置，且配置没有错误。

存储设备的持久性命名

sd 驱动程序管理的存储设备在重启后可能并不总是有相同的名称。例如，通常由 /dev/sdc 识别的磁盘可能命名为 /dev/sdb。即使您希望将一个磁盘作为 /dev/sdc 的替换磁盘，对于替换磁盘 /dev/sdc 在操作系统中也可以显示为 /dev/sdd。要解决这个问题，请使用持久且与以下模式匹配的名称： /dev/disk/by the。如需更多信息，请参阅 Red Hat Enterprise Linux (RHEL) 7 存储管理指南中的 持久命名。

根据您用于部署 Ceph 的命名方法，您可能需要在替换 OSD 后更新 devices 列表。使用以下命名方法列表来确定是否必须更改 devices 列表：

主号和次号范围方法

如果您使用 sd 并希望在安装新磁盘后继续使用它，请检查名称是否已改变。如果名称没有改变，例如，如果与 /dev/sdd 正确出现相同的名称，则不需要在完成磁盘替换过程后更改名称。

重要

不建议使用这个命名方法，因为名称仍然会在一段时间内不一致。如需更多信息，请参阅 RHEL 7 存储管理指南中的持久命名。

by-path 方法

如果您使用此方法，且在同一插槽中添加替换磁盘，则路径一致，且不需要更改。

重要

虽然这种命名方法优先于主号和次号范围方法，但请谨慎操作以确保目标号不会改变。例如，如果主机适配器移到不同的 PCI 插槽，则使用持久性绑定和更新名称。另外，如果 HBA 无法探测到，或者如果在系统中安装了新的 HBA，则 SCSI 主机号可能会改变。在 RHEL7 和 RHEL8 之间，by-path 命名方法也有所不同。如需更多信息，请参阅：

文章 [在 RHEL8 和 RHEL7 中创建"by-path"链接之间有什么区别 https://access.redhat.com/solutions/5171991
RHEL 8 管理文件系统 指南中的持久性命名属性概述。

by-uuid 方法

如果使用此方法，您可以使用 blkid 实用程序将新磁盘设置为具有与旧磁盘相同的 UUID。如需更多信息，请参阅 RHEL 7 存储管理指南中的持久命名。

by-id 方法

如果使用这个方法，您必须更改 devices 列表，因为这个标识符是该设备的属性，设备已被替换。

将新磁盘添加到系统时，如果可以根据 RHEL7 Storage 管理员指南 修改持久命名属性，请参阅持久性命名机制，以便设备名称保持不变，则不需要更新设备列表并重新运行 ceph-ansible，或者触发 director 重新运行 ceph-ansible，您可以继续磁盘替换过程。但是，您可以重新运行 ceph-ansible，以确保更改不会产生任何不一致。

警告

确认替换磁盘的大小与原始磁盘相同，以确保 Red Hat Ceph Storage 性能一致。如果同一大小的磁盘不可用，请在继续磁盘替换前联系 Red Hat Ceph Storage 支持。

12.2. 确保 OSD 已关闭并销毁

在托管 Ceph Monitor 的服务器上，在运行的 monitor 容器中使用 ceph 命令，以确保要替换的 OSD 为 down，然后销毁它。

流程

识别正在运行的 Ceph 监控容器的名称，并将其存储在名为 MON 的环境变量中：
```
MON=$(podman ps | grep ceph-mon | awk {'print $1'})
```
别名 ceph 命令，使其在运行 Ceph 监控容器内执行：
```
alias ceph="podman exec $MON ceph"
```

使用新别名来验证要替换的 OSD 是否已停机：

[root@overcloud-controller-0 ~]# ceph osd tree | grep 27
27   hdd 0.04790         osd.27                    down  1.00000 1.00000

销毁 OSD。以下示例命令销毁 OSD 27 ：

[root@overcloud-controller-0 ~]# ceph osd destroy 27 --yes-i-really-mean-it
destroyed osd.27

12.3. 从系统中删除旧磁盘并安装替换磁盘

在容器主机上，使用您要替换的 OSD，从系统中删除旧磁盘并安装替换磁盘。

先决条件：

验证设备 ID 是否已更改。更多信息请参阅第 12.1 节 “确定设备名称是否有变化”。

ceph-volume 命令存在于 Ceph 容器中，但不安装在 overcloud 节点上。创建一个别名，以便 ceph-volume 命令在 Ceph 容器内运行 ceph-volume 二进制文件。然后，使用 ceph-volume 命令清理新磁盘，并将它添加为 OSD。

流程

确保失败的 OSD 没有运行：
```
systemctl stop ceph-osd@27
```
识别 ceph 容器镜像的镜像 ID，并将其存储在名为 IMG 的环境变量中：
```
IMG=$(podman images | grep ceph | awk {'print $3'})
```

别名 ceph-volume 命令，使其在 $IMG Ceph 容器中运行，以及 ceph-volume 入口点和相关目录：

alias ceph-volume="podman run --rm --privileged --net=host --ipc=host -v /run/lock/lvm:/run/lock/lvm:z -v /var/run/udev/:/var/run/udev/:z -v /dev:/dev -v /etc/ceph:/etc/ceph:z -v /var/lib/ceph/:/var/lib/ceph/:z -v /var/log/ceph/:/var/log/ceph/:z --entrypoint=ceph-volume $IMG --cluster ceph"

验证 aliased 命令是否成功运行：
```
ceph-volume lvm list
```

检查您的新 OSD 设备是否尚未是 LVM 的一部分。使用 pvdisplay 命令检查设备，并确保 VG Name 字段为空。将 <NEW_DEVICE > 替换为新 OSD 设备的 /dev ö 路径：

[root@overcloud-computehci-2 ~]# pvdisplay <NEW_DEVICE>
  --- Physical volume ---
  PV Name               /dev/sdj
  VG Name               ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2
  PV Size               50.00 GiB / not usable 1.00 GiB
  Allocatable           yes (but full)
  PE Size               1.00 GiB
  Total PE              49
  Free PE               0
  Allocated PE          49
  PV UUID               kOO0If-ge2F-UH44-6S1z-9tAv-7ypT-7by4cp
[root@overcloud-computehci-2 ~]#

如果 VG Name 字段不为空，则该设备属于您必须删除的卷组。

如果设备属于卷组，请使用 lvdisplay 命令检查卷组中是否存在逻辑卷。将 <VOLUME_GROUP > 替换为您从 pvdisplay 命令检索的 VG Name 字段的值：

[root@overcloud-computehci-2 ~]# lvdisplay | grep <VOLUME_GROUP>
  LV Path                /dev/ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2/osd-data-a0810722-7673-43c7-8511-2fd9db1dbbc6
  VG Name                ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2
[root@overcloud-computehci-2 ~]#

如果 LV Path 字段不为空，则该设备包含必须删除的逻辑卷。

如果新设备是逻辑卷或卷组的一部分，请删除逻辑卷、卷组和逻辑卷作为 LVM 系统中的物理卷关联的设备。

将 <LV_PATH > 替换为 LV Path 字段的值。
将 <VOLUME_GROUP > 替换为 VG Name 字段的值。

将 <NEW_DEVICE > 替换为新 OSD 设备的 /dev ö 路径。

[root@overcloud-computehci-2 ~]# lvremove --force <LV_PATH>
  Logical volume "osd-data-a0810722-7673-43c7-8511-2fd9db1dbbc6" successfully removed

[root@overcloud-computehci-2 ~]# vgremove --force <VOLUME_GROUP>
  Volume group "ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2" successfully removed

[root@overcloud-computehci-2 ~]# pvremove <NEW_DEVICE>
  Labels on physical volume "/dev/sdj" successfully wiped.

确保新 OSD 设备清理干净。在以下示例中，设备为 /dev/sdj ：

[root@overcloud-computehci-2 ~]# ceph-volume lvm zap /dev/sdj
--> Zapping: /dev/sdj
--> --destroy was not specified, but zapping a whole device will remove the partition table
Running command: /usr/sbin/wipefs --all /dev/sdj
Running command: /bin/dd if=/dev/zero of=/dev/sdj bs=1M count=10
 stderr: 10+0 records in
10+0 records out
10485760 bytes (10 MB, 10 MiB) copied, 0.010618 s, 988 MB/s
--> Zapping successful for: <Raw Device: /dev/sdj>
[root@overcloud-computehci-2 ~]#

使用新设备创建具有现有 OSD ID 的新 OSD，但传递 --no-systemd，以便 ceph-volume 不会尝试启动 OSD。无法从容器内实现：
```
ceph-volume lvm create --osd-id 27 --data /dev/sdj --no-systemd
```
重要
如果您使用自定义参数部署 Ceph，如单独的 block.db，请确保在替换 OSD 时使用自定义参数。
在容器外启动 OSD：
```
systemctl start ceph-osd@27
```

12.4. 验证磁盘替换是否成功

要检查您的磁盘替换是否成功，在 undercloud 上完成以下步骤。

流程

检查设备名称已更改，根据您用于部署 Ceph 的命名方法更新 devices 列表。更多信息请参阅第 12.1 节 “确定设备名称是否有变化”。
为确保更改没有引入任何不一致的情况，请重新运行 overcloud deploy 命令来执行堆栈更新。
如果您有具有不同设备列表的主机，您可能需要定义异常。例如，您可以使用以下示例 heat 环境文件来部署具有三个 OSD 设备的节点。
```
parameter_defaults:
  CephAnsibleDisksConfig:
    devices:
      - /dev/sdb
      - /dev/sdc
      - /dev/sdd
    osd_scenario: lvm
    osd_objectstore: bluestore
```
CephAnsibleDisksConfig 参数应用到托管 OSD 的所有节点，因此您无法使用新设备列表更新 devices 参数。相反，您必须为具有不同设备列表的新主机定义一个例外。有关定义异常的详情请参考第 5.5 节 “覆盖 dissimilar Ceph Storage 节点的参数” 和第 5.5.1.2 节 “更改 Ceph Storage 节点上的磁盘布局”。

附录 A. 示例环境文件：创建 Ceph Storage 集群

以下自定义环境文件在整个第 2 章 为 overcloud 部署准备 Ceph Storage 节点 中使用了许多选项。此示例不包含任何注释选项。有关环境文件的概述，请参阅 Environment Files (包括在 Advanced Overcloud Customization 指南中）。

/home/stack/templates/storage-config.yaml

parameter_defaults: 1
  CinderBackupBackend: ceph 2
  CephAnsibleDisksConfig: 3
    osd_scenario: lvm
    osd_objectstore: bluestore
    dmcrypt: true
    devices:
      - /dev/disk/by-path/pci-0000:03:00.0-scsi-0:0:10:0
      - /dev/disk/by-path/pci-0000:03:00.0-scsi-0:0:11:0
      - /dev/nvme0n1
  ControllerCount: 3 4
  OvercloudControlFlavor: control
  ComputeCount: 3
  OvercloudComputeFlavor: compute
  CephStorageCount: 3
  OvercloudCephStorageFlavor: ceph-storage
  CephMonCount: 3
  OvercloudCephMonFlavor: ceph-mon
  CephMdsCount: 3
  OvercloudCephMdsFlavor: ceph-mds
  NeutronNetworkType: vxlan 5

1: parameter_defaults 部分修改所有模板中的参数的默认值。此处列出的大多数条目在第 4 章 自定义存储服务 中进行了描述。
2: 如果要部署 Ceph 对象网关，您可以使用 Ceph Object Storage (ceph-rgw)作为备份目标。要配置此功能，请将 CinderBackupBackend 设置为 swift。详情请查看第 4.2 节 “启用 Ceph 对象网关”。
3: CephAnsibleDisksConfig 部分定义使用 BlueStore 部署的自定义磁盘布局。
4: 对于每个角色，Chat CountCount 参数分配多个节点，而 Overcloud theFlavor 参数则分配一个类别。例如，Controller Count: 3 将 3 个节点分配给 Controller 角色，而 OvercloudControlFlavor: control 将每个角色设置为使用 control 类型。详情请查看第 7.1 节 “将节点和类型分配给角色”。
注意
CephMonCount、CephMdsCount、OvercloudCephMonFlavor 和 OvercloudCephMdsFlavor 参数（以及 ceph-mon 和 ceph-mds 类别）只有在您创建了自定义 CephMON 和 CephMds 角色时才有效，如第 3 章 在专用节点上部署 Ceph 服务 所述。
5: NeutronNetworkType ： 设置 neutron 服务应使用的网络类型（本例中为 vxlan）。

附录 B. 自定义接口模板示例：多个绑定接口

以下模板是 /usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml 的自定义版本。它具有多个绑定接口来隔离后端和前端存储网络流量，以及两个连接的冗余性，如第 4.5 节 “为 Ceph 节点配置多个绑定接口” 所述。

它还使用自定义绑定选项 'mode=4 lacp_rate=1'，如第 4.5.1 节 “配置绑定模块指令” 所述。

/usr/share/openstack-tripleo-heat-templates/network/config/bond-with-vlans/ceph-storage.yaml (custom)

heat_template_version: 2015-04-30

description: >
  Software Config to drive os-net-config with 2 bonded nics on a bridge
  with VLANs attached for the ceph storage role.

parameters:
  ControlPlaneIp:
    default: ''
    description: IP address/subnet on the ctlplane network
    type: string
  ExternalIpSubnet:
    default: ''
    description: IP address/subnet on the external network
    type: string
  InternalApiIpSubnet:
    default: ''
    description: IP address/subnet on the internal API network
    type: string
  StorageIpSubnet:
    default: ''
    description: IP address/subnet on the storage network
    type: string
  StorageMgmtIpSubnet:
    default: ''
    description: IP address/subnet on the storage mgmt network
    type: string
  TenantIpSubnet:
    default: ''
    description: IP address/subnet on the tenant network
    type: string
  ManagementIpSubnet: # Only populated when including environments/network-management.yaml
    default: ''
    description: IP address/subnet on the management network
    type: string
  BondInterfaceOvsOptions:
    default: 'mode=4 lacp_rate=1'
    description: The bonding_options string for the bond interface. Set
                 things like lacp=active and/or bond_mode=balance-slb
                 using this option.
    type: string
    constraints:
      - allowed_pattern: "^((?!balance.tcp).)*$"
        description: |
          The balance-tcp bond mode is known to cause packet loss and
          should not be used in BondInterfaceOvsOptions.
  ExternalNetworkVlanID:
    default: 10
    description: Vlan ID for the external network traffic.
    type: number
  InternalApiNetworkVlanID:
    default: 20
    description: Vlan ID for the internal_api network traffic.
    type: number
  StorageNetworkVlanID:
    default: 30
    description: Vlan ID for the storage network traffic.
    type: number
  StorageMgmtNetworkVlanID:
    default: 40
    description: Vlan ID for the storage mgmt network traffic.
    type: number
  TenantNetworkVlanID:
    default: 50
    description: Vlan ID for the tenant network traffic.
    type: number
  ManagementNetworkVlanID:
    default: 60
    description: Vlan ID for the management network traffic.
    type: number
  ControlPlaneSubnetCidr: # Override this via parameter_defaults
    default: '24'
    description: The subnet CIDR of the control plane network.
    type: string
  ControlPlaneDefaultRoute: # Override this via parameter_defaults
    description: The default route of the control plane network.
    type: string
  ExternalInterfaceDefaultRoute: # Not used by default in this template
    default: '10.0.0.1'
    description: The default route of the external network.
    type: string
  ManagementInterfaceDefaultRoute: # Commented out by default in this template
    default: unset
    description: The default route of the management network.
    type: string
  DnsServers: # Override this via parameter_defaults
    default: []
    description: A list of DNS servers (2 max for some implementations) that will be added to resolv.conf.
    type: comma_delimited_list
  EC2MetadataIp: # Override this via parameter_defaults
    description: The IP address of the EC2 metadata server.
    type: string

resources:
  OsNetConfigImpl:
    type: OS::Heat::StructuredConfig
    properties:
      group: os-apply-config
      config:
        os_net_config:
          network_config:
            -
              type: interface
              name: nic1
              use_dhcp: false
              dns_servers: {get_param: DnsServers}
              addresses:
                -
                  ip_netmask:
                    list_join:
                      - '/'
                      - - {get_param: ControlPlaneIp}
                        - {get_param: ControlPlaneSubnetCidr}
              routes:
                -
                  ip_netmask: 169.254.169.254/32
                  next_hop: {get_param: EC2MetadataIp}
                -
                  default: true
                  next_hop: {get_param: ControlPlaneDefaultRoute}
            -
              type: ovs_bridge
              name: br-bond
              members:
                -
                  type: linux_bond
                  name: bond1
                  bonding_options: {get_param: BondInterfaceOvsOptions}
                  members:
                    -
                      type: interface
                      name: nic2
                      primary: true
                    -
                      type: interface
                      name: nic3
                -
                  type: vlan
                  device: bond1
                  vlan_id: {get_param: StorageNetworkVlanID}
                  addresses:
                    -
                      ip_netmask: {get_param: StorageIpSubnet}
            -
              type: ovs_bridge
              name: br-bond2
              members:
                -
                  type: linux_bond
                  name: bond2
                  bonding_options: {get_param: BondInterfaceOvsOptions}
                  members:
                    -
                      type: interface
                      name: nic4
                      primary: true
                    -
                      type: interface
                      name: nic5
                -
                  type: vlan
                  device: bond1
                  vlan_id: {get_param: StorageMgmtNetworkVlanID}
                  addresses:
                    -
                      ip_netmask: {get_param: StorageMgmtIpSubnet}
outputs:
  OS::stack_id:
    description: The OsNetConfigImpl resource.
    value: {get_resource: OsNetConfigImpl}

法律通告

The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.

Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.

Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.

Linux® is the registered trademark of Linus Torvalds in the United States and other countries.

Java® is a registered trademark of Oracle and/or its affiliates.

XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.

MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.

Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.

The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.

All other trademarks are the property of their respective owners.

Language and Page Formatting Options

使用容器化 Red Hat Ceph 部署 overcloud

配置 director 以部署和使用容器化 Red Hat Ceph 集群

OpenStack Documentation Team

使开源包含更多

对红帽文档提供反馈

第 1 章 将 overcloud 与容器化 Red Hat Ceph Storage 集成

1.1. Ceph Storage 集群

1.2. 使用 overcloud 部署容器化 Ceph 存储集群的要求

1.3. Ceph Storage 节点要求

1.4. 用于部署 Ceph Storage 的 Ansible playbook

第 2 章 为 overcloud 部署准备 Ceph Storage 节点

2.1. 清理 Ceph Storage 节点磁盘

2.2. 注册节点

2.3. 验证可用的 Red Hat Ceph Storage 软件包

2.3.1. 验证 ceph-ansible 软件包版本

2.3.2. 验证预置备节点的软件包

2.4. 手动将节点标记为配置集

2.5. 为多磁盘集群定义根磁盘

2.6. 使用 overcloud-minimal 镜像来避免使用红帽订阅授权

第 3 章 在专用节点上部署 Ceph 服务

3.1. 创建自定义角色文件

3.2. 为 Ceph MON 服务创建自定义角色和类别

3.3. 为 Ceph MDS 服务创建自定义角色和类别

第 4 章 自定义存储服务

4.1. 启用 Ceph 元数据服务器

4.2. 启用 Ceph 对象网关

4.3. 配置 Ceph 对象存储以使用外部 Ceph 对象网关

4.4. 将备份服务配置为使用 Ceph

4.5. 为 Ceph 节点配置多个绑定接口

4.5.1. 配置绑定模块指令

第 5 章 自定义 Ceph Storage 集群

5.1. 设置 ceph-ansible 组变量

5.2. Ceph 容器用于带有 Ceph Storage 的 Red Hat OpenStack Platform

5.3. 映射 Ceph Storage 节点磁盘布局

5.3.1. 使用 BlueStore

5.3.2. 引用具有持久名称的设备

5.3.3. 在高级场景中配置 OSD

5.3.3.1. 使用 block.db 提高性能

5.3.3.2. 使用专用的 write-ahead 日志(WAL)设备

5.3.3.3. 使用预先创建的 LVM 来提高控制

5.4. 为不同的 Ceph 池分配自定义属性

5.5. 覆盖 dissimilar Ceph Storage 节点的参数

5.5.1. 特定于节点的磁盘配置

5.5.1.1. 为 Ceph 设备生成 JSON heat 环境文件

5.5.1.2. 更改 Ceph Storage 节点上的磁盘布局

5.5.2. 更改 BlueStore block.db 大小

5.5.2.1. 使用 ceph-volume 时更改 BlueStore block.db 大小

5.5.2.2. 使用 ceph-disk时更改 BlueStore block.db 大小

5.6. 为大型 Ceph 集群增加重启延迟

5.7. 覆盖 Ansible 环境变量

5.8. 启用 Ceph on-wire 加密

第 6 章 使用 director 在 Ceph Storage 集群中为不同工作负载定义性能层

6.1. 配置性能层

6.2. 将块存储(cinder)类型映射到新的 Ceph 池

6.3. 验证您是否创建了 CRUSH 规则，并且您的池是否已设置为正确的 CRUSH 规则

第 7 章 创建 overcloud

7.1. 将节点和类型分配给角色

7.2. 启动 overcloud 部署

7.2.1. 限制运行 ceph-ansible 的节点

第 8 章 将 Red Hat Ceph Storage 仪表板添加到 overcloud 部署中

8.1. 包含 Ceph 仪表板所需的容器

8.2. 部署 Ceph 仪表板

8.3. 使用可组合网络部署 Ceph 仪表板

8.4. 更改默认权限

8.5. 访问 Ceph 仪表板

第 9 章 post-deployment

9.1. 访问 overcloud

9.2. 监控 Ceph Storage 节点

第 10 章 重新引导环境

10.1. 重新引导 Ceph Storage (OSD) 集群

第 11 章 扩展 Ceph Storage 集群

11.1. 扩展 Ceph Storage 集群

11.2. 缩减和替换 Ceph Storage 节点

11.3. 将 OSD 添加到 Ceph Storage 节点

11.4. 从 Ceph Storage 节点移除 OSD

第 12 章 替换失败的磁盘

12.1. 确定设备名称是否有变化

12.2. 确保 OSD 已关闭并销毁

12.3. 从系统中删除旧磁盘并安装替换磁盘

第 1 章将 overcloud 与容器化 Red Hat Ceph Storage 集成

第 2 章为 overcloud 部署准备 Ceph Storage 节点

第 3 章在专用节点上部署 Ceph 服务

第 4 章自定义存储服务

第 5 章自定义 Ceph Storage 集群

5.5.2.1. 使用 `ceph-volume` 时更改 BlueStore `block.db` 大小

5.5.2.2. 使用 `ceph-disk`时更改 BlueStore `block.db` 大小

第 6 章使用 director 在 Ceph Storage 集群中为不同工作负载定义性能层

第 7 章创建 overcloud

7.2.1. 限制运行 `ceph-ansible` 的节点

第 8 章将 Red Hat Ceph Storage 仪表板添加到 overcloud 部署中

第 10 章重新引导环境

第 11 章扩展 Ceph Storage 集群

第 12 章替换失败的磁盘