-
线程数控制
启动线程过多会导致资源不足引发的lxc-start命令无法执行问题,到致大量容器只执行了lxc-copy,而无法真正运行。具体情况应视服务器硬件条件(cpu,内存--在本项目部署中主要瓶颈在于cpu)以及当前服务器状态(当前主要是cpu占有率过高问题)而定。实测在cpu高占用下(90%+)线程数应为5以下,正常应为10-20线程数。
-
由于多线程运行,无法有效监测执行针对lxc容器复制启动及运行所产生的cpu与内存开销改为在不启动其他应用程序的情况下监测整个物理机的cpu和内存使用率,且这一数据更有实际意义。

-
cpu占用过高问题
如图所示在lxc容器数量部署到1300左右cpu占用率开始从20%以下开始飙升,部署到2300左右飙升至80%,随后增速下降至3500台左右稳定在95-99%。(图示是按时间次序的,有所出入)
问题一是由于cpu占用率过高导致系统卡顿,最后几百台启动失败,最后甚至只能开启一个terminal终端窗

在大规模部署LXC容器时,遇到了CPU占用过高导致系统卡顿、容器启动失败、网卡启动问题以及TTY限制。通过调整线程数、监控CPU与内存、规划多网段、禁用NetworkManager以及禁用tty,成功部署约4100台容器,但CPU瓶颈限制了进一步扩展。
最低0.47元/天 解锁文章
3177

被折叠的 条评论
为什么被折叠?



