Red Hat Training

A Red Hat training course is available for RHEL 8

15.7. 测试 kdump 配置

配置 kdump 后,您必须手动测试系统崩溃,并确保在定义的 kdump 目标中生成了 vmcore 文件。vmcore 文件是从新引导的内核上下文中捕获的,因此具有帮助调试内核崩溃的重要信息。

警告

不要对活动状态的生产环境系统测试 kdump。测试 kdump 的命令将导致内核崩溃,且数据丢失。根据您的系统架构,确保您安排了充足的维护时间,因为 kdump 测试可能需要多次重启,且启动时间很长。

如果 vmcore 文件在 kdump 测试过程中没有生成 ,请在再次运行测试前识别并修复问题,以使 kdump 测试成功。

重要

确保安排了充足的维护时间,因为 kdump 测试可能需要多次重启,且启动时间很长。

如果进行任何手动系统修改,您必须在任何系统修改的最后测试 kdump 配置。例如,如果您进行任何以下更改,请确保测试 kdump 配置,以获得最佳 kdump 性能:

  • 软件包升级。
  • 硬件级别的更改,如存储或网络更改。
  • 固件和 BIOS 升级。
  • 包括第三方模块的新安装和应用程序升级。
  • 如果您使用热插拔机制在支持此机制的硬件上添加更多内存。
  • /etc/kdump.conf/etc/sysconfig/kdump 文件中进行更改后。

先决条件

  • 您在系统上具有 root 权限。
  • 您已保存了所有重要数据。测试 kdump 的命令导致内核崩溃及数据丢失。
  • 您已根据系统架构安排了大量机器维护时间。

流程

  1. 启用 kdump 服务:

    # kdumpctl restart
  2. 检查 kdump 服务的状态。使用 kdumpctl 命令,您可以在控制台上打印输出。

    # kdumpctl status
      kdump:Kdump is operational

    或者,如果您使用 systemctl 命令,输出在 systemd 日志中打印。

  3. 启动内核崩溃来测试 kdump 配置。sysrq-trigger 组合键导致内核崩溃,并在需要时可能重启系统。

    # echo c > /proc/sysrq-trigger

    在内核重启时,address-YYYY-MM-DD-HH:MM:SS/vmcore 文件在您在 /etc/kdump.conf 文件中指定的位置创建。默认值为 /var/crash/

其它资源