(一)信号的基本概念
为了理解信号,先从我们最熟悉的场景说起:
用户输入命令,在Shell下启动一个前台进程。
用户按下Ctrl-C,这个键盘输入产生一个硬件中断。
如果CPU当前正在执行这个进程的代码,则该进程的用户空间代码暂停执行,CPU从用户态切换到内核态处理硬件中断。
终端驱动程序将Ctrl-C解释成一个
SIGINT
信号,记在该进程的PCB中(也可以说发送了一个SIGINT
信号给该进程)。当某个时刻要从内核返回到该进程的用户空间代码继续执行之前,首先处理PCB中记录的信号,发现有一个
SIGINT
信号待处理,而这个信号的默认处理动作是终止进程,所以直接终止进程而不再返回它的用户空间代码执行。
用kill -l
命令可以察看系统定义的信号列表。对于信号来说,它们有默认处理动作:Term
表示终止当前进程,Core
表示终止当前进程并且Core Dump(保存信息到硬盘),Ign
表示忽略该信号,Stop
表示停止当前进程,Cont
表示继续执行先前停止的进程。
2)如果不想按默认动作处理信号,用户程序可以调用sigaction(2)
函数告诉内核如何处理某种信号(sigaction
函数稍后详细介绍),可选的处理动作有以下三种:
忽略此信号。
执行该信号的默认处理动作。
提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。
(二)产生信号
1. 通过终端按键产生信号(如Ctrl-C或Ctrl-\等)。
2. 调用系统函数向进程发送信号(kill函数等)。
3. 由软件条件产生的信号(闹钟超时产生
SIGALRM
信号,向读端已关闭的管道写数据时产生SIGPIPE
信号等)。
(三)阻塞信号
信号在内核中的表示
实际执行信号的处理动作称为信号递达(Delivery),信号从产生到递达之间的状态,称为信号未决(Pending)。进程可以选择阻塞(Block)某个信号。被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。信号在内核中的表示可以看作是这样的:
图 33.1. 信号在内核中的表示示意图
每个信号都有两个标志位分别表示阻塞和未决,还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,
SIGHUP
信号未阻塞也未产生过,当它递达时执行默认处理动作。
SIGINT
信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT
信号未产生过,一旦产生SIGQUIT
信号将被阻塞,它的处理动作是用户自定义函数sighandler
。
如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t
来存储,sigset_t
称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
信号集操作函数
sigset_t
类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t
变量,而不应该对它的内部数据做任何解释,比如用printf
直接打印sigset_t
变量是没有意义的。
#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset(sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
函数sigemptyset
初始化set
所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。函数sigfillset
初始化set
所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。注意,在使用sigset_t
类型的变量之前,一定要调用sigemptyset
或sigfillset
做初始化,使信号集处于确定的状态。初始化sigset_t
变量之后就可以在调用sigaddset
和sigdelset
在该信号集中添加或删除某种有效信号。这四个函数都是成功返回0,出错返回-1。sigismember
是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
sigprocmask
调用函数sigprocmask
可以读取或更改进程的信号屏蔽字。
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
返回值:若成功则为0,若出错则为-1
如果oset
是非空指针,则读取进程的当前信号屏蔽字通过oset
参数传出。如果set
是非空指针,则更改进程的信号屏蔽字,参数how
指示如何更改。如果oset
和set
都是非空指针,则先将原来的信号屏蔽字备份到oset
里,然后根据set
和how
参数更改信号屏蔽字。假设当前的信号屏蔽字为mask
,下表说明了how
参数的可选值。
表 33.1. how参数的含义
SIG_BLOCK | set 包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set |
SIG_UNBLOCK | set 包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask&~set |
SIG_SETMASK | 设置当前信号屏蔽字为set 所指向的值,相当于mask=set |
如果调用sigprocmask
解除了对当前若干个未决信号的阻塞,则在sigprocmask
返回前,至少将其中一个信号递达。
sigpending
#include <signal.h>
int sigpending(sigset_t *set);
sigpending
读取当前进程的未决信号集,通过set
参数传出。调用成功则返回0,出错则返回-1。
(四)捕获信号
内核如何实现信号的捕捉
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下:
用户程序注册了
SIGQUIT
信号的处理函数sighandler
。当前正在执行
main
函数,这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的
main
函数之前检查到有信号SIGQUIT
递达。内核决定返回用户态后不是恢复
main
函数的上下文继续执行,而是执行sighandler
函数,sighandler
和main
函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。
sighandler
函数返回后自动执行特殊的系统调用sigreturn
再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复
main
函数的上下文继续执行了。
sigaction
#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
sigaction
函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回-1。signo
是指定信号的编号。若act
指针非空,则根据act
修改该信号的处理动作。若oact
指针非空,则通过oact
传出该信号原来的处理动作。act
和oact
指向sigaction
结构体:
struct sigaction {
void (*sa_handler)(int); /* addr of signal handler, */
/* or SIG_IGN, or SIG_DFL */
sigset_t sa_mask; /* additional signals to block */
int sa_flags; /* signal options, Figure 10.16 */
/* alternate handler */
void (*sa_sigaction)(int, siginfo_t *, void *);
};
将
sa_handler
赋值为常数SIG_IGN
传给sigaction
表示忽略信号,赋值为常数SIG_DFL
表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void
,可以带一个int
参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main
函数调用,而是被系统所调用。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用
sa_mask
字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。
sa_flags
字段包含一些选项,本章的代码都把sa_flags
设为0,sa_sigaction
是实时信号的处理函数,本章不详细解释这两个字段,有兴趣的读者参考[APUE2e]。
pause
#include <unistd.h>
int pause(void);
pause
函数使调用进程挂起直到有信号递达。如果信号的处理动作是终止进程,则进程终止,pause
函数没有机会返回;如果信号的处理动作是忽略,则进程继续处于挂起状态,pause
不返回;如果信号的处理动作是捕捉,则调用了信号处理函数之后pause
返回-1,errno
设置为EINTR
,所以pause
只有出错的返回值(想想以前还学过什么函数只有出错返回值?)。错误码EINTR
表示“被信号中断”。
可重入函数
当捕捉到信号时,不论进程的主控制流程当前执行到哪儿,都会先跳到信号处理函数中执行,从信号处理函数返回后再继续执行主控制流程。信号处理函数是一个单独的控制流程,因为它和主控制流程是异步的,二者不存在调用和被调用的关系,并且使用不同的堆栈空间。引入了信号处理函数使得一个进程具有多个控制流程,如果这些控制流程访问相同的全局资源(全局变量、硬件资源等),就有可能出现冲突。
如果一个函数符合以下条件之一则是不可重入的:
调用了
malloc
或free
,因为malloc
也是用全局链表来管理堆的。调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。
sig_atomic_t类型与volatile限定符
sig_atomic_t类型提供原子操作类型。Volatile声明的变量,编译器对访问该变量的代码就不再进行优化(不再把变量值放入寄存器中),从而可以提供对特殊地址的稳定访问(直接访问内存)。
sig_atomic_t
类型的变量应该总是加上volatile
限定符,因为要使用sig_atomic_t
类型的理由也正是要加volatile
限定符的理由.
竞态条件与sigsuspend函数
由于异步事件在任何时候都有可能发生(这里的异步事件指出现更高优先级的进程),如果我们写程序时考虑不周密,就可能由于时序问题而导致错误,这叫做竞态条件(Race Condition)。
要是“解除信号屏蔽”和“挂起等待信号”这两步能合并成一个原子操作就好了,这正是
sigsuspend
函数的功能。sigsuspend
包含了pause
的挂起等待功能,同时解决了竞态条件的问题,在对时序要求严格的场合下都应该调用sigsuspend
而不是pause
。
#include <signal.h>
int sigsuspend(const sigset_t *sigmask);
和pause
一样,sigsuspend
没有成功返回值,只有执行了一个信号处理函数之后sigsuspend
才返回,返回值为-1,errno
设置为EINTR
。调用sigsuspend
时,进程的信号屏蔽字由sigmask
参数指定,可以通过指定sigmask
来临时解除对某个信号的屏蔽,然后挂起等待,当sigsuspend
返回时,进程的信号屏蔽字恢复为原来的值,如果原来对该信号是屏蔽的,从sigsuspend
返回后仍然是屏蔽的。
关于SIGCHLD信号
进程一章讲过用
wait
和waitpid
函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。其实,子进程在终止时会给父进程发
SIGCHLD
信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD
信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait
清理子进程即可。