RHEL 8.8/8.6(EUS): hung_task_timeout_secs at migration_entry_wait_on_locked
Issue
- RHEL 8.8로 업그레이드한 후, 일부 명령이 중단되고 시스템 부하 평균이 매우 높게 나타납니다.
- 백트레이스에서
migration_entry_wait_on_locked()
와 함께 hung_task_timeout_secs가 여러 번 발생한 것으로 로그에서 확인됩니다.
INFO: task task1:1618 blocked for more than 120 seconds.
Not tainted 4.18.0-477.10.1.el8_8.x86_64 #1
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
task:task1 state:D stack: 0 pid: 1618 ppid: 1 flags:0x00000080
Call Trace:
__schedule+0x2d1/0x870
schedule+0x55/0xf0
io_schedule+0x12/0x40
migration_entry_wait_on_locked+0x1ea/0x290
do_swap_page+0x5b0/0x710
__handle_mm_fault+0x453/0x6c0
handle_mm_fault+0xca/0x2a0
__do_page_fault+0x1f0/0x450
do_page_fault+0x37/0x130
page_fault+0x1e/0x30
- RHEL 8.6 EUS
kernel-4.18.0-372.91.1.el8_6
으로 업그레이드한 후, 일부 명령이 중단되고 시스템 부하 평균이 매우 높게 나타납니다. - 백트레이스에서
migration_entry_wait_on_locked()
와 함께 hung_task_timeout_secs가 여러 번 발생한 것으로 로그에서 확인됩니다.
INFO: task task2:2159306 blocked for more than 120 seconds.
Tainted: GOE ----------- 4.18.0-372.91.1.el8_6.x86_64 #1
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
task:task2 state:D stack: 0 pid:2159306 ppid: 1 flags:0x00000084
Call Trace:
__schedule+0x2d1/0x860
schedule+0x55/0xf0
io_schedule+0x12/0x40
migration_entry_wait_on_locked+0x1e0/0x280
do_swap_page+0x5b0/0x710
__handle_mm_fault+0x453/0x6d0
handle_mm_fault+0xca/0x2a0
__do_page_fault+0x1d0/0x420
do_page_fault+0x37/0x12d
page_fault+0x1e/0x30
- 이 문제로 인해 시스템이 정상적으로 재부팅되지 않을 수 있으므로 하드 리셋이 필요할 수 있습니다.
Environment
- Red Hat Enterprise Linux 8.8
kernel-4.18.0-477.10.1.el8_8
- Red Hat Enterprise Linux 8.6 EUS
kernel-4.18.0-372.91.1.el8_6
이상
- Red Hat OpenShift Container Platform 4.12.49
kernel-4.18.0-372.89.1.el8_6
- Red Hat OpenShift Container Platform 4.12.50
kernel-4.18.0-372.89.1.el8_6
- Red Hat OpenShift Container Platform 4.12.51
kernel-4.18.0.372.93.1.el8_6
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.