Linux cgroup用于控制进程使用memory,cpu,blk,net等资源,从而达到进程之间资源隔离.
代码实现比较简单,层次结构非常明显,总体框图如下:
cgroup core 实现了一套虚拟文件系统cgroup fs,这样用户直接使用mkdir/rmdir等命令来进行资源管控, 而对某种资源的控制,由对应的subsystem来实现。
group core负责维护每个cgroup和subystem的生命周期,以及实现通用API接口.
1. cgroup子系统介绍
blkio -- 这个子系统为块设备设定输入/输出限制,比如物理设备(磁盘,固态硬盘,USB 等等)。
cpu -- 这个子系统使用调度程序提供对 CPU 的 cgroup 任务访问。
cpuacct -- 这个子系统自动生成 cgroup 中任务所使用的 CPU 报告。
cpuset -- 这个子系统为 cgroup 中的任务分配独立 CPU(在多核系统)和内存节点。
devices -- 这个子系统可允许或者拒绝 cgroup 中的任务访问设备。
freezer -- 这个子系统挂起或者恢复 cgroup 中的任务。
memory -- 这个子系统设定 cgroup 中任务使用的内存限制,并自动生成由那些任务使用的内存资源报告。
net_cls -- 这个子系统使用等级识别符(classid)标记网络数据包,可允许 Linux 流量控制程序(tc)识别从具体 cgroup 中生成的数据包。
1.在 cgroups 中,任务就是系统的一个进程或者线程,cgroup提供线程级的管控.
2.控制族群(control group)。控制族群就是一组按照某种标准划分的进程。Cgroups 中的资源控制都是以控制族群为单位实现。一个进程可以加入到某个控制族群,也从一个进程组迁移到另一个控制族群。一个进程组的进程可以使用 cgroups 以控制族群为单位分配的资源,同时受到 cgroups 以控制族群为单位设定的限制。
3.层级(hierarchy)。控制族群可以组织成 hierarchical 的形式,既一颗控制族群树。控制族群树上的子节点控制族群是父节点控制族群的孩子,继承父控制族群的特定的属性。
- 每次在系统中创建新层级时,该系统中的所有任务都是那个层级的默认 cgroup(我们称之为 root cgroup,此 cgroup 在创建层级时自动创建,后面在该层级中创建的 cgroup 都是此 cgroup 的后代)的初始成员;
- 一个子系统最多只能附加到一个层级;
- 一个层级可以附加多个子系统;
- 一个任务可以是多个 cgroup 的成员,但是这些 cgroup 必须在不同的层级;
- 系统中的进程(任务)创建子进程(任务)时,该子任务自动成为其父进程所在 cgroup 的成员。然后可根据需要将该子任务移动到不同的 cgroup 中,但开始时它总是继承其父任务的 cgroup。
4.子系统(subsytem)。一个子系统就是一个资源控制器,比如 cpu 子系统就是控制 cpu 时间分配的一个控制器。子系统必须附加(attach)到一个层级上才能起作用,一个子系统附加到某个层级以后,这个层级上的所有控制族群都受到这个子系统的控制。
2.数据结构
cgroup设计到的数据结构如下:
css_set: 用来建立task与cgroup之间的多对多关系, 因为一个进程可以被多个不同层级的cgroup来管控,
cg_cgroup_link:用来维护css_set与cgroup 的关系
cgroup:每次mkdir创建一个目录,就会产生一个cgroup
cgroup_subsys: 表示一个资源控制子系统,可以看做cgroup_subsys_state基类
cgroup_subsys_state:可以认为是cgroup_subsys的实例
css_set_table:hash table,用于快速查找css_set
3. 层级关系
