我的容器为啥被杀屎了?
Linux 允许进程在申请内存的时候是 overcommit 的,也就是说允许进程申请超过实际物理内存上限的内存。(超卖)
因为 malloc() 申请的是内存的虚拟地址,系统只是给了程序一个地址范围,由于没有写入数据,所以程序并没有得到真正的物理内存。物理内存只有程序真的往这个地址写入数据的时候,才会分配给程序。可以看得出来,这种 overcommit 的内存申请模式可以带来一个好处,它可以有效提高系统的内存利用率。
当遇到内存不够的这种情况,Linux 采取的措施就是杀死某个正在运行的进程。(OOM)
- 问:在发生 OOM 的时候,Linux 到底是根据什么标准来选择被杀的进程呢?
- 答:在 Linux 内核里有一个 oom_badness() 函数定义了选择进程的标准。其实这里的判断标准也很简单,函数中涉及两个条件:
- 进程已经使用的物理内存页面数。
- 每个进程的 OOM 校准值 oom_score_adj。在 /proc 文件系统中,每个进程都有一个 /proc/[pid]/oom_score_adj 的接口文件。我们可以在这个文件中输入 -1000 到 1000 之间的任意一个数值,调整进程被 OOM Kill 的几率。
用系统总的可用页面数,乘以 OOM 校准值 oom_score_adj,再加上进程已经使用的物理页面数,计算出来的值越大,那么这个进程被 OOM Kill 的几率也就越大。
- Memory Cgroup 的虚拟文件系统的挂载点一般在"/sys/fs/cgroup/memory"这个目录下,我们可以在 Memory Cgroup 的挂载点目录下,创建一个子目录作为控制组。
- 挑出与OOM最相关的三个参数说明(参考

本文探讨了Linux容器内存管理的问题,包括为何容器会被杀掉、如何判断容器是否因OOM被杀、容器内存使用量为何常达临界值以及容器是否能使用Swap空间。通过分析Linux的内存过量承诺、oom_score_adj、Memory Cgroup参数和swappiness值,解释了内存管理的关键概念,并提供了应对策略。
最低0.47元/天 解锁文章
555

被折叠的 条评论
为什么被折叠?



