Translated message

A translation of this page exists in English.

升级到 Red Hat Enterprise Linux 6.2 后，在控制台上看到几个 "page allocation failure.1, mode:0x20" 消息

Solution Verified - Updated 2024-11-13T04:15:57+00:00 -

Environment

2.6.32-220.el6 后的 Red Hat Enterprise Linux 6 内核

Issue

在升级到更新 2 后，控制台上看到以下警告消息：

Mar 18 14:39:17 hostname kernel: glusterfsd: page allocation failure. order:1, mode:0x20
Mar 18 14:39:17 hostname kernel: swapper: page allocation failure. order:1, mode:0x20
Mar 21 11:27:06 hostname kernel: swapper: page allocation failure. order:1, mode:0x20
Mar 21 18:25:45 hostname kernel: swapper: page allocation failure. order:1, mode:0x20
Mar 21 21:59:18 hostname kernel: swapper: page allocation failure. order:1, mode:0x20

因为页分配失败，Swapper 无法分配内存：

kernel: swapper: page allocation failure. order:1, mode:0x20
kernel: Pid: 0, comm: swapper Not tainted 2.6.32-358.2.1.el6.x86_64 #1
kernel: Call Trace:
kernel: <IRQ>  [<ffffffff8112c207>] ? __alloc_pages_nodemask+0x757/0x8d0
kernel: [<ffffffff81166ab2>] ? kmem_getpages+0x62/0x170
kernel: [<ffffffff811676ca>] ? fallback_alloc+0x1ba/0x270
kernel: [<ffffffff8116711f>] ? cache_grow+0x2cf/0x320
kernel: [<ffffffff81167449>] ? ____cache_alloc_node+0x99/0x160
kernel: [<ffffffff811683cb>] ? kmem_cache_alloc+0x11b/0x190
kernel: [<ffffffff81439d58>] ? sk_prot_alloc+0x48/0x1c0
kernel: [<ffffffff8143ae32>] ? sk_clone+0x22/0x2e0
kernel: [<ffffffff81489d66>] ? inet_csk_clone+0x16/0xd0
kernel: [<ffffffff814a2c73>] ? tcp_create_openreq_child+0x23/0x450
kernel: [<ffffffff814a046d>] ? tcp_v4_syn_recv_sock+0x4d/0x310
kernel: [<ffffffff814a2a16>] ? tcp_check_req+0x226/0x460
kernel: [<ffffffff8149ff0b>] ? tcp_v4_do_rcv+0x35b/0x430
kernel: [<ffffffff81082034>] ? mod_timer+0x144/0x220
kernel: [<ffffffff814a171e>] ? tcp_v4_rcv+0x4fe/0x8d0
kernel: [<ffffffff814a171e>] ? tcp_v4_rcv+0x4fe/0x8d0
kernel: [<ffffffff8147f50d>] ? ip_local_deliver_finish+0xdd/0x2d0
kernel: [<ffffffff8147f798>] ? ip_local_deliver+0x98/0xa0
kernel: [<ffffffff8147ec5d>] ? ip_rcv_finish+0x12d/0x440
kernel: [<ffffffff8147f1e5>] ? ip_rcv+0x275/0x350
kernel: [<ffffffff814483bb>] ? __netif_receive_skb+0x4ab/0x750
kernel: [<ffffffff8144a798>] ? netif_receive_skb+0x58/0x60
kernel: [<ffffffffa008b975>] ? vmxnet3_rq_rx_complete+0x365/0x890 [vmxnet3]
kernel: [<ffffffff8128d2b0>] ? swiotlb_map_page+0x0/0x100
kernel: [<ffffffffa008c0f3>] ? vmxnet3_poll_rx_only+0x43/0xc0 [vmxnet3]
kernel: [<ffffffff8144cf63>] ? net_rx_action+0x103/0x2f0
kernel: [<ffffffff81076fb1>] ? __do_softirq+0xc1/0x1e0
kernel: [<ffffffff810e1720>] ? handle_IRQ_event+0x60/0x170
kernel: [<ffffffff8100c1cc>] ? call_softirq+0x1c/0x30
kernel: [<ffffffff8100de05>] ? do_softirq+0x65/0xa0
kernel: [<ffffffff81076d95>] ? irq_exit+0x85/0x90
kernel: [<ffffffff81516f15>] ? do_IRQ+0x75/0xf0
kernel: [<ffffffff8100b9d3>] ? ret_from_intr+0x0/0x11
kernel: <EOI>  [<ffffffff8103b90b>] ? native_safe_halt+0xb/0x10
kernel: [<ffffffff8101495d>] ? default_idle+0x4d/0xb0
kernel: [<ffffffff81009fc6>] ? cpu_idle+0xb6/0x110
kernel: [<ffffffff81506d9c>] ? start_secondary+0x2ac/0x2ef

Resolution

修复

更新至 kernel-2.6.32-358.el6 或更高版本，其包含下面 Root Cause 部分中描述的增强。

请注意，此更新（或更新版本）无法完全消除发生页分配失败的可能性。
以下提到的临时解决方案也可在 2.6.32-358.el6 及更新版本中工作，如果更新后问题仍然存在。

临时解决方案

以下可调项可用于尝试缓解或防止报告的情况：

将 vm.min_free_kbytes 值增加到，例如比单个分配请求更高的值。
将 vm.zone_reclaim_mode 变为 1，如果其被设置为零，以便系统可以从 cached 内存回收内存。

这两个设置都可以在 /etc/sysctl.conf 中设置，并使用 sysctl -p /etc/sysctl.conf 加载。

有关这些可调项的更多信息，请安装 kernel-doc 软件包并参考文件 /usr/share/doc/kernel-doc-2.6.32/Documentation/sysctl/vm.txt.

Root Cause

在 RHEL 6.4 之前，kswapd 不会尝试释放连续页。当系统中没有其他内存碎片整理操作时，这可能导致 GFP_ATOMIC 分配请求重复失败。在 RHEL 6.4 及更新版本中，kswapd 将在需要时压缩(碎片整理)可用内存。

请注意，仍可能会发生分配失败。例如，当发生大量 GFP_ATOMIC 分配时，kswapd 可能难以跟上。但是，这些分配最终应该会成功。

另外，还有其他更具体情况可以导致页分配失败，并导致其它问题。如需更多信息，请参阅以下文章：

Diagnostic Steps

This solution is part of Red Hat’s fast-track publication program, providing a huge library of solutions that Red Hat engineers have created while supporting our customers. To give you the knowledge you need the instant it becomes available, these articles may be presented in a raw and unedited form.

Select Your Language

Translated message

升级到 Red Hat Enterprise Linux 6.2 后，在控制台上看到几个 "page allocation failure.1, mode:0x20" 消息

Environment

Issue

Resolution

修复

临时解决方案

Root Cause

Diagnostic Steps

Comments

Quick Links

Help

Site Info

Related Sites

About

Red Hat legal and privacy links

Red Hat legal and privacy links

Translated message

Environment

Issue

Resolution

修复

临时解决方案

Root Cause

Diagnostic Steps

Comments

Quick Links

Help

Site Info

Related Sites

Systems Status

About

Red Hat legal and privacy links

Red Hat legal and privacy links