Linux /proc/$pid/smaps的含义

本文详细解读了Linux进程中的smaps文件,特别是libstdc++.so文件的映射信息。通过分析smaps中的Size和Rss字段,深入理解了Shared_Clean、Shared_Dirty、Private_Clean、Private_Dirty的含义及计算方式。同时,介绍了smaps信息在proc文件系统中的存储实现,以及如何通过回调函数和seq_file结构进行高效获取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1) 问题

/proc/pid/smaps反应了运行时的进程的内存影响,系统的运行时库(so),堆,栈信息均可在其中看到。下面是libstdc++.so这个文件在一个进程中的映射信息,其中的Size表示线性地址空间大小,Rss表示时间占用的物理内存大小.

Rss=Shared_Clean+Shared_Dirty+Private_Clean+Private_Dirty

其中的Shared_Clean/Shared_Dirty/Private_Clean/Private_Dirty究竟是什么含义?

baidu和google后都没有对此进行说明,对此也困惑了很近,在最近一次问题定位时又迷惑了,这才下决心看代码来才弄清楚。

(2)追根溯源

smaps的相关信息是在proc文件系统中保存的,在proc的文件系统中查看smaps的实现,发现是通过调用show_smap来打印显示信息的。文件:fs/proc/task_mmu.c

该函数传递的参数有一个seq_file的结构,网上搜索,这个东东实质为了取procfs中的内容来设计的,当procfs的内容中大于一个page时,procfs会较慢并且可能出现异常。而seq_file能解决上述的问题。查看这段代码可以发现smaps的信息实质是保存在mss变量中,而mss变量是在walk_page_range来进行计算并填充。walk_page_range的功能如下,就是遍历页表,并调用回调函数进行处理。

回调函数都是定义在mm_walk中。

现在linux的内存管理的页表分了4级目录:页全局目录,页上级目录,页中间目录,页表目录,上面的函数分别对应了上面各级页表目录处理的的回调函数。而show_smaps函数始终是定义了一个页中间目录处理的回调函数:

那就看smaps_pte_range的实现,实质就是对页中间目录对应的页表一个个的扫描:

再往下看就找到了shared/private是如下计算的,可以看出首先是查看该page的引用数,如果引用>1,则归为shared,如果是1,则归为private,同时也查看该page的flag,是否标记为_PAGE_DIRTY,如果不是,则认为干净的。

至此,这个疑惑终于解开了。

(3)结论

查看该page的引用数,如果引用>1,则归为shared,如果是1,则归为private,同时也查看该page的flag,是否标记为_PAGE_DIRTY,如果不是,则认为干净的。

### Linux `proc` 下 `pid/smaps` 文件详解 #### 一、概述 在Linux操作系统中,通过读取 `/proc/[pid]/smaps` 文件可以获取指定进程的内存映射区域及其详细的资源占用情况。此文件提供了比常规 `/proc/[pid]/maps` 更加详尽的信息,不仅限于地址范围和权限设置,还包括每个VMA(虚拟内存区)的具体属性。 #### 二、如何访问 smaps 数据 为了保存某个特定进程ID为 `{pid}` 的smas信息到名为 `smaps.txt` 的文本文件中,可执行如下Shell命令[^1]: ```bash cat /proc/{pid}/smaps > smaps.txt ``` #### 三、主要字段解释 以下是部分重要条目说明: - **Rss**: 实际分配给该段落物理页框的数量(单位KB),即Resident Set Size的一部分; - **Pss (Proportional Set Size)**: 表示共享页面按比例分摊后的大小;对于完全私有的映像来说,其值等于RSS; - **Size**: 映射区域内总的字节数量; - **KernelPageSize** 和 **MMUPageSize**: 描述内核以及硬件层面所使用的页面尺寸; - **Private_Clean**, **Private_Dirty**, **Shared_Clean**, **Shared_Dirty**: 对应不同类型的干净或脏污状态下的独占/共享页面数; - **Referenced Pages**: 已经被引用过的页面数目; - **Anonymous**: 不关联任何磁盘文件的匿名映射空间大小; - **Heap**, **Stack**: 分别指向程序堆栈所在位置的数据块详情; - **File**: 如果存在,则表示当前VMA是由哪个具体文件创建而来,并给出相应路径名; - **Swap**: 当前已交换出去至swap分区中的数据量。 例如,在`smaps`文件里可能会看到这样的记录片段[^3]: ``` 7f8d9c0e4000-7f8d9c2a5000 rw-p 00000000 00:00 0 [heap] Size: 1966 kB Rss: 983 kB Pss: 983 kB ... ``` 这里展示的是关于进程堆(heap)的部分统计指标。 #### 四、特殊注意事项 值得注意的是,当涉及到多线程应用时,由于各个线程拥有独立的工作环境——包括但不限于各自的调用历史(call stack), 局部变量等,因此针对单一线程而言更精确的方式是从对应的子目录下去查找相关信息,比如 `[stack]` 就位于 `/proc/[pid]/task/[tid]/` 中[^2]. ```python import os def get_thread_stack_info(pid, tid): path = f"/proc/{pid}/task/{tid}/stat" with open(path) as file: content = file.read() return content.split(' ')[22] print(get_thread_stack_info(1234, 5678)) ``` 上述Python脚本展示了怎样提取某一线程(`tid`)所属进程(`pid`)的任务状态字符串里的第23项参数作为近似代表其栈指针的位置。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值