cgroups控制cpu,memory,io使用率

[size=medium]Cgroups是control groups的缩写,最初由Google工程师提出,后来编进linux内核。
Cgroups是实现IaaS虚拟化(kvm、lxc等),PaaS容器沙箱(Docker等)的资源管理控制部分的底层基础。
[/size]
首先来一张来对比下当前进行操作系统资源使用率的技术。
[img]http://dl2.iteye.com/upload/attachment/0119/2551/e6358041-64ff-3abc-8193-da438921690d.jpg[/img]

本文将采用三个示例来展示cgroups的作用。

测试环境准备:
1.win7下安装virtualbox,虚拟机中安装了centos6.8.
2.下文将会用到iotop命令进行io使用率的查看,这个版本中没有安装,请在有网络的情况下执行一下命令进行安装:
yum install iotop

3.请确保cgroups服务已经启动了,如果没有请先启动服务,相关命令如下:
service cgconfig status   #查看cgroups服务当前的运行状态
service cgconfig start #开启cgroups服务
chkconfig cgconfig on #开启开启启动,如果不想开机自启动时,此处可以不用执行

4.在/cgroup,有如下文件夹,默认是多挂载点的形式,即各个子系统的配置在不同的子文件夹下
[code="java"]# ls /cgroup/
blkio cpu cpuacct cpuset devices freezer memory net_cls
#
[/code]
[size=large][b]cgroups管理进程cpu资源[/b][/size]

模拟耗cpu很多的脚本:
[code="java"]# cat t1.sh
#!/bin/bash

x=0;
while [ true ]
do
x=$x+1
done;

#
[/code]top可以看到这个脚本基本占了100%的cpu资源
[code="java"]# top

top - 22:13:41 up 1:52, 4 users, load average: 0.99, 1.09, 1.07
Tasks: 187 total, 2 running, 185 sleeping, 0 stopped, 0 zombie
Cpu(s): 97.3%us, 2.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.7%hi, 0.0%si, 0.0%st
Mem: 1020076k total, 929336k used, 90740k free, 165328k buffers
Swap: 1257468k total, 202312k used, 1055156k free, 195172k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3834 root 20 0 103m 1348 1012 R 91.4 0.1 0:11.14 t1.sh
[/code]下面用cgroups控制这个进程的cpu资源
mkdir -p /cgroup/cpu/foo/   #新建一个控制组foo
echo 50000 > /cgroup/cpu/foo/cpu.cfs_quota_us #将cpu.cfs_quota_us设为50000,相对于cpu.cfs_period_us的100000是50%
echo 3834 > /cgroup/cpu/foo/tasks #将当前的进程号写进这个文件中就能动态控制了,如果要控制多个进程的话,以添加模式写入此文件即可

当时在执行这个命令之前有一个疑问,就是我并没有创建上述几个文件,我只是创建了foo目录,实际上cgroups在你创建这个foo目录的时候已经帮你创建好了。

然后top的实时统计数据如下,cpu占用率将近50%,看来cgroups关于cpu的控制起了效果
[code="java"]# top

top - 22:16:18 up 1:55, 4 users, load average: 1.40, 1.21, 1.12
Tasks: 183 total, 2 running, 181 sleeping, 0 stopped, 0 zombie
Cpu(s): 52.5%us, 0.7%sy, 0.0%ni, 46.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 1020076k total, 929392k used, 90684k free, 165572k buffers
Swap: 1257468k total, 193008k used, 1064460k free, 211440k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3834 root 20 0 104m 1808 1012 R 49.9 0.2 2:24.99 t1.sh
[/code]
[size=large][b]cgroups管理进程内存资源[/b][/size]

模拟耗内存很多的脚本:
[code="java"]# cat t2.sh
#!/bin/bash

x="a";

while [ true ]
do
x=$x$x
done;
#
[/code]top看内存占用持续上升,直至内存耗尽(此处模拟了好几次,因此伤处脚本运行太快了,导致机器卡死了,所以就不贴出对应的结果了)
下面用cgroups控制这个进程的内存资源
mkdir -p /cgroup/memory/foo
echo 1048576 > /cgroup/memory/foo/memory.limit_in_bytes #分配1MB的内存给这个控制组
echo 3865 > /cgroup/memory/foo/tasks #当前t2.sh运行时的进程id

[code="java"]# top

top - 22:29:10 up 2:08, 4 users, load average: 0.96, 1.16, 1.21
Tasks: 184 total, 1 running, 183 sleeping, 0 stopped, 0 zombie
Cpu(s): 2.2%us, 2.2%sy, 0.0%ni, 0.0%id, 94.5%wa, 0.7%hi, 0.4%si, 0.0%st
Mem: 1020076k total, 755616k used, 264460k free, 8812k buffers
Swap: 1257468k total, 543968k used, 713500k free, 189176k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3878 root 20 0 743m 129m 1020 D 4.3 13.0 0:19.92 t2.sh [/code]
从上述结果可以看出来,实际上t2.sh进程的运行状态已经不正常了(D),一会又是S,一会又是D,其实表明状态异常。
有人说时间长了,会被cgroups干掉,但是我模拟了好长时间都没有出现这个情况,仅仅是进程状态异常。
针对内存的配置里面有很多的配置文件如下:
[code="java"]# ls /cgroup/memory/foo/
cgroup.event_control memory.move_charge_at_immigrate
cgroup.procs memory.oom_control
memory.failcnt memory.soft_limit_in_bytes
memory.force_empty memory.stat
memory.limit_in_bytes memory.swappiness
memory.max_usage_in_bytes memory.usage_in_bytes
memory.memsw.failcnt memory.use_hierarchy
memory.memsw.limit_in_bytes notify_on_release
memory.memsw.max_usage_in_bytes tasks
memory.memsw.usage_in_bytes
#
[/code]
[size=large][b]cgroups管理进程io资源[/b][/size]

模拟一个耗io的脚本
[code="java"]# cat t3.sh
#!/bin/bash

dd if=/dev/sda of=/dev/null

#
[/code]
通过iotop看io占用情况,磁盘速度
[img]http://dl2.iteye.com/upload/attachment/0119/2560/c6dba795-03a4-3867-bc40-dbc6dd36ba10.png[/img]
下面用cgroups控制这个进程的io资源
mkdir -p /cgroup/blkio/foo

echo '8:0 1048576' > /cgroup/blkio/foo/blkio.throttle.read_bps_device
#8:0对应主设备号和副设备号,可以通过ls -l /dev/sda查看
echo 4023 > /cgroup/blkio/foo/tasks

再通过iotop看,确实将读速度降到了1M/s(因为截图不太方便,所以图中的进程号对不上,不过不影响阅读)
[img]http://dl2.iteye.com/upload/attachment/0119/2562/35513fd5-0ef9-352d-90ae-a116fd097fee.png[/img]
跟cpu和memeory一样,io也有很多配置在/cgroup/blkio/foo/[code="java"]# ls /cgroup/blkio/foo/
blkio.io_merged blkio.sectors blkio.time
blkio.io_queued blkio.throttle.io_service_bytes blkio.weight
blkio.io_service_bytes blkio.throttle.io_serviced blkio.weight_device
blkio.io_serviced blkio.throttle.read_bps_device cgroup.event_control
blkio.io_service_time blkio.throttle.read_iops_device cgroup.procs
blkio.io_wait_time blkio.throttle.write_bps_device notify_on_release
blkio.reset_stats blkio.throttle.write_iops_device tasks
#
[/code]

参考:http://www.cnblogs.com/yanghuahui/p/3751826.html
<think>好的,我现在需要向用户介绍Cgroup是什么。首先,用户之前问过关于memory.zram_wm_ratio的问题,现在转而询问Cgroup,可能是想更深入理解之前的回答中的概念。我需要确保解释清晰,结构合理,符合用户之前提到的系统级指令,比如使用中文、正确使用LaTeX格式,并且分点说明。 首先,我应该从Cgroup的基本定义开始,说明它是Linux内核的功能,用于资源管理。然后分点介绍它的核心作用,比如资源限制、优先级分配、资源统计和进程控制。接下来,可能需要解释它的架构,包括层级结构、子系统(资源类型)和控制组,这样用户能理解其组织方式。 用户可能对Cgroup的应用场景感兴趣,比如服务器资源隔离、容器技术(Docker/Kubernetes)、混合工作负载管理,这些都需要具体例子来说明。然后,需要提到常用的子系统,如CPU、内存、IO、设备等,每个子系统的作用简要说明。 版本演变部分也很重要,用户可能不知道Cgroup v1和v2的区别,需要简要对比,避免混淆。操作示例部分可以通过命令展示如何创建和配置Cgroup,增强实用性。最后,结合容器技术的例子,说明Cgroup在实际中的应用,比如Docker如何利用它进行资源限制。 需要注意使用正确的术语,避免技术错误,同时保持口语化,让用户容易理解。需要检查是否所有行内术语如Cgroup、子系统等都用$...$格式,独立公式是否用$$...$$,虽然这次可能公式较少,但要确保LaTeX正确。结构上要分点清晰,逐步深入,帮助用户逐步建立对Cgroup的理解。</think>--- ### **Cgroup(Control Group)** 是 Linux 内核提供的一种机制,用于对进程(或进程组)的**资源分配**进行精细化管理和限制。 它的核心目标是:**隔离、限制、统计系统资源(如 CPU、内存、磁盘 I/O、网络等)的使用**,避免单个进程或用户过度占用资源,从而提升系统的稳定性和公平性。 --- ### **1. 核心功能** #### **1.1 资源限制** - 通过设定阈值,限制进程组对资源的**最大使用量**。 例如: - 限制某容器最多使用 `2 核 CPU` 和 `4GB 内存`。 - 限制后台任务的总磁盘写入速度不超过 `10MB/s`。 #### **1.2 优先级分配** - 为不同进程组分配资源的**使用权重**,确保关键任务优先获得资源。 例如: - 数据库服务权重设为 `500`,批处理脚本权重设为 `100`,保证数据库优先使用 CPU。 #### **1.3 资源统计** - 实时监控进程组的资源消耗(如 CPU 时间、内存占用、网络流量等),为计费或调优提供数据。 #### **1.4 进程控制** - 对进程组执行统一操作,例如:冻结(freeze)、重启(restart)、迁移(migrate)。 --- ### **2. Cgroup 的架构** #### **2.1 层级结构(Hierarchy)** - Cgroup 按树形层级组织,子节点继承父节点的资源限制,并可添加自己的规则。 $$ \text{Root Cgroup} \rightarrow \text{Subgroup A} \rightarrow \text{Subgroup A1} $$ - **特点**: - 每个层级可绑定一类或多类资源(称为 **Subsystem**,如 `cpu`, `memory`)。 - 一个子系统只能附加到一个层级。 #### **2.2 子系统(Subsystem)** - 子系统代表一类可管理的资源类型,常见子系统包括: | 子系统 | 功能 | |--------------|----------------------------------------------------------------------| | `cpu` | 限制 CPU 使用份额和时间片分配 | | `memory` | 控制内存用量(包括物理内存、Swap、内核内存等) | | `io` | 限制块设备的 I/O 带宽 | | `devices` | 控制进程对设备的访问权限(如允许/禁止读写特定设备) | | `cpuset` | 绑定进程到指定 CPU 核或内存节点 | | `pids` | 限制进程组内的进程数量 | #### **2.3 控制组(Control Group)** - 层级中的每个节点称为一个控制组,包含一组进程及其资源限制规则。 例如: - 创建控制组 `/sys/fs/cgroup/cpu/group1`,限制其 CPU 使用率为 `50%`。 --- ### **3. 应用场景** #### **3.1 服务器资源隔离** - 在共享服务器中,为不同用户/服务分配独立的资源配额,防止互相干扰。 **例如**:限制用户 A 的进程最多使用 `30% CPU`,用户 B 的进程最多使用 `1GB 内存`。 #### **3.2 容器技术的基础** - Docker、Kubernetes 等容器平台依赖 Cgroup 实现容器的**资源隔离**。 **例如**:每个 Docker 容器对应一个 Cgroup,限制其 CPU、内存、磁盘 I/O 等。 #### **3.3 混合工作负载管理** - 在同时运行实时任务和批处理任务的系统中,通过优先级分配保障实时任务性能。 --- ### **4. Cgroup 的操作示例** #### **4.1 查看子系统挂载情况** ```bash $ mount | grep cgroup # 输出示例:cgroup on /sys/fs/cgroup/memory type cgroup (rw,memory) ``` #### **4.2 创建控制组并设置限制** ```bash # 创建 CPU 限制组 $ sudo mkdir /sys/fs/cgroup/cpu/group1 # 设置 CPU 配额为 50%(周期 100ms,最多使用 50ms) $ echo 50000 > /sys/fs/cgroup/cpu/group1/cpu.cfs_quota_us $ echo 100000 > /sys/fs/cgroup/cpu/group1/cpu.cfs_period_us # 将进程 PID 1234 加入该控制组 $ echo 1234 > /sys/fs/cgroup/cpu/group1/tasks ``` --- ### **5. Cgroup 的版本演进** #### **5.1 Cgroup v1** - **特点**: - 子系统独立管理,配置分散。 - 功能碎片化,不同子系统行为不一致。 - **问题**: - 复杂场景下易出现规则冲突(如多个层级限制同一资源)。 #### **5.2 Cgroup v2** - **改进**: - 统一层级结构,所有子系统挂载到单一层级。 - 增强资源分配的**一致性**和**可预测性**。 - 支持跨资源类型的联合限制(如“CPU + 内存”联合配额)。 - **现状**: - 主流 Linux 发行版(如 Ubuntu 22.04+、RHEL 9+)已默认启用 Cgroup v2。 --- ### **6. 与容器技术的结合** - **Docker 示例**: 启动容器时通过 `--cpus`、`--memory` 等参数直接设置 Cgroup 限制: ```bash $ docker run -it --cpus=1.5 --memory=2g alpine ``` 此命令会创建一个 Cgroup,限制容器最多使用 `1.5 核 CPU` 和 `2GB 内存`。 --- ### **总结** - **Cgroup 的本质**:Linux 内核级的资源隔离与管理工具。 - **核心价值**:通过细粒度资源控制,提升系统稳定性、公平性和资源利用率。 - **适用领域**:从嵌入式设备到云计算平台,凡是需要多任务资源隔离的场景均依赖 Cgroup
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值