Red Hat Training

A Red Hat training course is available for Red Hat Virtualization

6.2.2. 恢复自托管引擎管理器

以下流程概述了如何使用 engine-backup 工具自动恢复备份自托管引擎管理器虚拟机和数据仓库的配置设置和数据库内容。该流程只适用于在初始 engine-setup 期间自动配置的组件。如果您在 engine-setup 过程中手动配置了数据库,请按照 第 6.2.3 节 “手动恢复自托管引擎管理器” 中的说明手动恢复备份环境。

过程 6.5. 恢复自托管引擎管理器

  1. 保护将备份文件复制到新 Manager 虚拟机。这个示例将文件复制到 第 6.1 节 “备份自托管引擎管理器虚拟机” 中的网络存储服务器中。在本例中,Storage.example.com 是存储服务器的完全限定域名,/backup/EngineBackupFiles 是存储服务器上备份文件的指定文件路径,/backup/ 是文件将在新管理器中复制的路径。
    # scp -p Storage.example.com:/backup/EngineBackupFiles /backup/
  2. 使用 engine-backup 工具恢复完整的备份。
    • 如果您只恢复 Manager,请运行:
      # engine-backup --mode=restore --file=file_name --log=log_file_name --provision-db --restore-permissions
    • 如果您要恢复 Manager 和数据仓库,请运行:
      # engine-backup --mode=restore --file=file_name --log=log_file_name --provision-db --provision-dwh-db --restore-permissions
    如果成功,则会显示以下输出:
    You should now run engine-setup.
    Done.
  3. 配置恢复的 Manager 虚拟机。这个过程标识现有的配置设置和数据库内容。确认设置。完成后,设置会提供 SSH 指纹和内部证书颁发机构哈希。
    # engine-setup
    [ INFO  ] Stage: Initializing
    [ INFO  ] Stage: Environment setup
    Configuration files: ['/etc/ovirt-engine-setup.conf.d/10-packaging.conf', '/etc/ovirt-engine-setup.conf.d/20-setup-ovirt-post.conf']
    Log file: /var/log/ovirt-engine/setup/ovirt-engine-setup-20140304075238.log
    Version: otopi-1.1.2 (otopi-1.1.2-1.el6ev)
    [ INFO  ] Stage: Environment packages setup
    [ INFO  ] Yum Downloading: rhel-65-zstream/primary_db 2.8 M(70%)
    [ INFO  ] Stage: Programs detection
    [ INFO  ] Stage: Environment setup
    [ INFO  ] Stage: Environment customization
             
              --== PACKAGES ==--
             
    [ INFO  ] Checking for product updates...
    [ INFO  ] No product updates found
             
              --== NETWORK CONFIGURATION ==--
             
    Setup can automatically configure the firewall on this system.
    Note: automatic configuration of the firewall may overwrite current settings.
    Do you want Setup to configure the firewall? (Yes, No) [Yes]: 
    [ INFO  ] iptables will be configured as firewall manager.
             
              --== DATABASE CONFIGURATION ==--
             
             
              --== OVIRT ENGINE CONFIGURATION ==--
             
              Skipping storing options as database already prepared
             
              --== PKI CONFIGURATION ==--
             
              PKI is already configured
             
              --== APACHE CONFIGURATION ==--
             
             
              --== SYSTEM CONFIGURATION ==--
             
             
              --== END OF CONFIGURATION ==--
             
    [ INFO  ] Stage: Setup validation
    [ INFO  ] Cleaning stale zombie tasks
             
              --== CONFIGURATION PREVIEW ==--
             
              Database name                      : engine
              Database secured connection        : False
              Database host                      : X.X.X.X
              Database user name                 : engine
              Database host name validation      : False
              Database port                      : 5432
              NFS setup                          : True
              Firewall manager                   : iptables
              Update Firewall                    : True
              Configure WebSocket Proxy          : True
              Host FQDN                          : Manager.example.com
              NFS mount point                    : /var/lib/exports/iso
              Set application as default page    : True
              Configure Apache SSL               : True
             
              Please confirm installation settings (OK, Cancel) [OK]:
  4. 从 Restored 环境中删除主机

    如果恢复的自托管引擎的部署位于备份引擎中不存在唯一的名称的新硬件上,请跳过这一步。此步骤仅适用于在故障转移主机 hosted_engine_1 上发生的部署。因为创建备份时,此主机存在于环境中,所以它会在恢复的引擎中维护一个存在的,因此必须首先从环境中删除,然后才能进行最终同步。
    1. 登录管理门户。
    2. 单击 Hosts 选项卡。故障转移主机 hosted_engine_1 将处于维护模式,且没有虚拟负载,因为这是如何为备份做好准备。
    3. 点击 Remove
    4. 单击确定
    注意
    如果您要删除的主机无法正常工作,请参阅 第 6.2.4 节 “从恢复的自托管引擎环境中删除非操作主机” 来强制删除主机。
  5. 同步主机和管理器

    返回到主机,并通过选择选项 1 继续运行 hosted-engine 部署脚本:
    (1) Continue setup - engine installation is complete
    [ INFO  ] Engine replied: DB Up!Welcome to Health Status!
    [ INFO  ] Waiting for the host to become operational in the engine. This may take several minutes...
    [ INFO  ] Still waiting for VDSM host to become operational...
    此时,hosted_engine_1 将在进入 Non Operational 状态前在管理门户中可见,并带有 InstallingInitializing 状态。主机将继续等待 VDSM 主机变为正常运行,直到最终超时为止。这是因为环境中的另一台主机维护存储池管理器(SPM)角色和 hosted_engine_1 无法与存储域交互,因为 SPM 主机处于 Non Responsive 状态。当此过程超时时,系统会提示您关闭虚拟机以完成部署。部署完成后,可以手动将主机置于维护模式,并通过管理门户激活主机。
    [ INFO  ] Still waiting for VDSM host to become operational...
    [ ERROR ] Timed out while waiting for host to start. Please check the logs.
    [ ERROR ] Unable to add hosted_engine_2 to the manager
              Please shutdown the VM allowing the system to launch it as a monitored service.
              The system will wait until the VM is down.
  6. 关闭新 Manager 虚拟机。
    # shutdown -h now
  7. 返回到主机,以确认它检测到 Manager 虚拟机已关闭。
    [ INFO  ] Enabling and starting HA services
              Hosted Engine successfully set up
    [ INFO  ] Stage: Clean up
    [ INFO  ] Stage: Pre-termination
    [ INFO  ] Stage: Termination
    
  8. 激活主机。
    1. 登录管理门户。
    2. 单击 Hosts 选项卡。
    3. 选择 hosted_engine_1,再单击 维护 按钮。在进入维护模式前,主机可能需要几分钟时间。
    4. Activate 按钮。
    处于活动状态后,hosted_engine_1 会立即标记为 SPM,存储域和数据中心将变为活动状态。
  9. 通过手动隔离不响应的主机将虚拟机迁移到活动主机。在管理门户中,右键单击主机并选择 Confirm 'Host has Rebooted'
    在备份时在该主机上运行的任何虚拟机都将从该主机中删除,并从 Unknown 状态移到 Down 状态。这些虚拟机现在可以在 hosted_engine_1 上运行。现在,隔离的主机可以使用 REST API 强制删除。
现在,环境已恢复到 active _engine_1 处于活动状态,并且能够在恢复的环境中运行虚拟机。现在,可以按照 第 6.2.4 节 “从恢复的自托管引擎环境中删除非操作主机” 中的步骤删除剩余的自托管引擎节点,然后按照 第 7 章 在自托管环境中安装其他主机 中的步骤重新安装到环境中。
注意
如果 Manager 数据库成功恢复,但 Manager 虚拟机似乎为 Down,且无法迁移到另一个自托管引擎节点,您可以启用新的 Manager 虚拟机,并按照 中提供 https://access.redhat.com/solutions/1517683 的步骤从环境中删除死管理器虚拟机。