ECS / 华为云录 · 2024年10月18日

华为云–服务器oom导致kill进程

出现原因:
服务器CPU/内存长期使用过高使用率(超90%)触发系统级oom保护机制,选择性的部分终止进程,释放资源,以避免系统崩溃。

查询服务器日志是否出现oom
cat /var/log/messages |grep -i oom

/proc/sys/vm/panic_on_oom 值为0:内存不足时,启动 OOM killer。 值为1:内存不足时,有可能会触发 kernel panic(系统重启),也有可能启动 OOM killer。 值为2:内存不足时,表示强制触发 kernel panic,内核崩溃GG(系统重启)。

echo “vm.panic_on_oom=2” >> /etc/sysctl.conf
sysctl -p