这里我们主要介绍进程的状态,进程的状态可以通过/proc/PID/status来查看,也可以通过/proc/PID/stat来查看。如果说到工具大家用的最多的ps也可以看到进程的信息。这里我们通过/proc/PID/status来分析进程的信息。

    同时针对/proc/PID目录下的文件及内容说明,可以查看帮助文档:/usr/share/doc/kernel-doc-2.6.32/Documentation/filesystems/proc.txt

在2.6.18之后的内核,多了capibilty/cpusets等信息.

查看进程状态信息如下:

[root@jiankong /proc/1/]#more status
Name:   rsyslogd
State:  S (sleeping)
Tgid:   987
Pid:    987
PPid:   1
TracerPid:      0
Uid:    0       0       0       0
Gid:    0       0       0       0
Utrace: 0
FDSize: 32
Groups:
VmPeak:    36528 kB
VmSize:    36528 kB
VmLck:         0 kB
VmHWM:      1432 kB
VmRSS:      1420 kB
VmData:    33980 kB
VmStk:        88 kB
VmExe:       320 kB
VmLib:      2044 kB
VmPTE:        56 kB
VmSwap:        0 kB
Threads:        3
SigQ:   1/7954
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000001001206
SigCgt: 0000000180014c21
CapInh: 0000000000000000
CapPrm: ffffffffffffffff
CapEff: ffffffffffffffff
CapBnd: ffffffffffffffff
Cpus_allowed:   3
Cpus_allowed_list:      0-1
Mems_allowed:   1
Mems_allowed_list:      0
voluntary_ctxt_switches:        1
nonvoluntary_ctxt_switches:     0


1. Name:   rsyslogd
解释:进程名

2. State:  S (sleeping)
解释:进程的状态我们前文已经做了很详细的分析,各进程的状态代表的意义如下:
     R (running)", "S (sleeping)", "D (disk sleep)", "T (stopped)", "T(tracing stop)", "Z (zombie)", or "X (dead)"

3. Tgid:   987
解释:Tgid是线程组的ID,一个线程一定属于一个线程组(进程组).

4. Pid:    987
解释:这个是进程的ID,更准确的说应该是线程的ID.
例如:
UID   PID   PPID  LWP  C NLWP STIME TTY          TIME CMD
root   987     1    987  0    3 00:18 ?        00:00:00 /sbin/rsyslogd -c 4
root   987     1    989  0    3 00:18 ?        00:00:00 /sbin/rsyslogd -c 4
root   987     1    990  0    3 00:18 ?        00:00:00 /sbin/rsyslogd -c 4
注:
/proc/pid/status中的Pid就是ps命令的LWP列输出,PID一列其实是进程组,而LWP是轻量级进程,也就是线程,因为所有的进程必须一个线程,那就是它自己.

5. PPid:   1
解释:当前进程的父进程

6. TracerPid:   0
解释:跟踪当前进程的进程ID,如果是0,表示没有跟踪.
例如:  用strace跟踪top程序    strace top

查看top进程

ps -axjf
PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 2491  2500  2500  2491 pts/2     2500 S+       0   0:00          \_ strace top
 2500  2501  2500  2491 pts/2     2500 S+       0   0:00              \_ top
 
查看top进程的TracerPid位 : cat /proc/2501/status | grep TracerPid

7. Uid:    0       0       0       0
    Gid:    0       0       0       0
解释:
第一列数字(RUID):实际用户ID,指的是进程执行者是谁.
第二列数字(EUID):有效用户ID,指进程执行时对文件的访问权限.
第三列数字(SUID):保存设置用户ID,作为effective user ID的副本,在执行exec调用时后能重新恢复原来的effectiv user ID.
第四列数字(FSUID):目前进程的文件系统的用户识别码.一般情况下,文件系统的用户识别码(fsuid)与有效的用户识别码(euid)是相同的.
这里重点说明RUID和EUID,我们用test用户启动top,如下:

例:
终端1)
su - test
top
查看该进程的EUID和RUID,如下:

终端2)
cat /proc/`pgrep top|grep -v grep`/status

前面略
Uid:    1002    1002    1002    1002
Gid:    1003    1003    1003    1003
后面略
注:这里我们看到进程的RUID和EUID都变成了1002.
 
我们将程序top加上setuid权限,如下: chmod +s /usr/bin/top

重新运行top程序,并查看它的RUID和EUID,如下:
cat /proc/`pgrep top|grep -v grep`/status

前面略
Uid:    1002    0       0       0
Gid:    1003    0       0       0
后面略
:我们看到RUID还是1002,说明程序是由test用户(UID=1002)启动的,而程序设定了setuid,那么在程序运行时是用程序的owner权限来运行程序,而不是启动的用户权限.
由于top的owner是root,那么它的EUID是0.

8. FDSize: 32
解释: FDSize是当前分配的文件描述符,这个值不是当前进程使用文件描述符的上限.
我们看到这里是32,但实际并没有分配32个文件,如下:
ls -l /proc/`pgrep rsyslogd|grep -v grep`/fd  
total 0
lrwx------ 1 root root 64 2011-04-20 20:03 0 -> socket:[5741]
l-wx------ 1 root root 64 2011-04-20 20:03 1 -> /var/log/auth.log
...
我们看到这里只用到了18个文件描述符.而如果超过32个文件描述符,将以32进行递增,如果是64位系统,将以64进行递增.
FDSize这个值不会减少,如果我们程序打开了300个文件,并不会因为关闭文件,而减少FDSize这个值.

9. Groups: 0
解释:
这里的groups表示启动这个进程的用户所在的组.
我们当前的用户test,现在在两个组(1000,2000)里面,如下:
id
uid=1002(test) gid=1002(nagcmd) groups=1000(chenkuo),1002(nagcmd)

用test用户启动top程序,并查看它的groups,如下:
终端1  top
终端2  cat /proc/`pgrep top|grep -v grep`/status
截取信息如下:
Groups: 1000 1002

10. VmPeak:    36528 kB
解释:这里的VmPeak代表当前进程运行过程中占用内存的峰值.

11, VmSize:    36528 kB
解释:VmSize代表进程现在正在占用的内存
这个值与pmap pid的值基本一致,如果略有不同,可能是内存裂缝所造成的.

12, VmLck:         0 kB
解释:VmLck代表进程已经锁住的物理内存的大小.锁住的物理内存不能交换到硬盘.

13. VmHWM:      1432 kB
14. VmRSS:      1420 kB
解释:
VmHWM是程序得到分配到物理内存的峰值.
VmRSS是程序现在使用的物理内存.
我们看到此时VmHWM和VmRSS是一样的,表示占用了460MB左右的物理内存(因为它会用到动态链接库等).

15. VmData:    33980 kB
16. VmStk:        88 kB
17. VmExe:       320 kB
18. VmLib:      2044 kB
解释:
VmData:表示进程数据段的大小.
VmStk:表示进程堆栈段的大小.
VmExe:表示进程代码的大小.
VmLib:表示进程所使用LIB库的大小.

关于代码段,堆栈段,数据段:
代码段可以为机器中运行同一程序的数个进程共享
堆栈段存放的是子程序(函数)的返回地址、子程序的参数及程序的局部变量
数据段则存放程序的全局变量、常数以及动态数据分配的数据空间(比如用malloc函数申请的内存)
与代码段不同,如果系统中同时运行多个相同的程序,它们不能使用同一堆栈段和数据段.

注意:
堆栈段代表的是程序中的堆区(stack),堆区一般是编译器自动分配释放的.
我们用malloc申请的内存,它占用的其实是栈区(heap),栈区一般是程序员自已分配释放的,而栈区在这里属于数据段,所以我们看到上面测试程序通过调用malloc函数后,VmData一值有了很大的变化.

19. VmPTE:        56 kB
解释:  占用的页表的大小.

20. VmSwap:                            0 kB
解释:  进程占用Swap的大小.

21. Threads:        3
解释:  表示当前进程组有3个线程.

22. SigQ:   1/7954
解释:  表示当前待处理信号的个数,我们用下面和程序进行测试,如下:

23. SigPnd: 0000000000000000
24. ShdPnd: 0000000000000000
25. SigBlk: 0000000000000000
26. SigIgn: 0000000001001206
27. SigCgt: 0000000180014c21
解释:
SigPnd:屏蔽位,存储了该线程的待处理信号,等同于线程的PENDING信号.
ShnPnd:屏蔽位,存储了该线程组的待处理信号.等同于进程组的PENDING信号.
SigBlk:存放被阻塞的信号,等同于BLOCKED信号.
SigIgn:存放被忽略的信号,等同于IGNORED信号.
SigCgt:存放捕获的信号,等同于CAUGHT信号.

28. CapInh: 0000000000000000
29. CapPrm: ffffffffffffffff
30. CapEff: ffffffffffffffff
31. CapBnd: ffffffffffffffff
解释:
CapEff:当一个进程要进行某个特权操作时,操作系统会检查cap_effective的对应位是否有效,而不再是检查进程的有效UID是否为0.
CapPrm:表示进程能够使用的能力,在cap_permitted中可以包含cap_effective中没有的能力,这些能力是被进程自己临时放弃的,也可以说cap_effective是cap_permitted的一个子集.
CapInh:表示能够被当前进程执行的程序继承的能力.
CapBnd:是系统的边界能力,我们无法改变它.

32. Cpus_allowed:   3
33. Cpus_allowed_list:      0-1
解释:
Cpus_allowed:3指出该进程可以使用CPU的亲和性掩码,因为我们指定为两块CPU,所以这里就是3,如果该进程指定为4个CPU(如果有话),这里就是F(1111).
Cpus_allowed_list:0-1指出该进程可以使用CPU的列表,这里是0-1.

34. Mems_allowed:   1
35. Mems_allowed_list:      0
解释:
内存同CPU一样,进程rsyslogd只是使用了结点0的内存资源.

我们这里调整该进程到CPU0,如下:
taskset -p 1 987
pid 987's current affinity mask: 3
pid 987's new affinity mask: 1

cat /proc/987/status

Cpus_allowed:   1
Cpus_allowed_list:      0
Mems_allowed:   1
Mems_allowed_list:      0
注:我们看到Cpus_allowed/Cpus_allowed_list较之前有了变化.Cpus_allowed由3变成了1.表明我们只会用CPU0.

36. voluntary_ctxt_switches:        1
37. nonvoluntary_ctxt_switches:     0
解释:
voluntary_ctxt_switches表示进程主动切换的次数.
nonvoluntary_ctxt_switches表示进程被动切换的次数.

首先查看一下当前进程,如下:
echo $$
1544

执行如下命令:
while ((1)); do echo 1; sleep 1; done

查看该进程的主动切换与被动切换,如下:
cat status

voluntary_ctxt_switches:        949
nonvoluntary_ctxt_switches:     55

我们看到主动切换和被动切换有了明显的变化.