进程控制:
进程创建:
进程创建函数为fork(),无参数
返回值:创建失败返回-1;创建成功后父进程返回子进程的id(大于0),子进程返回0,
我们可以通过返回值的不同对父子进程进行分流。
fork常规用法:
一个父进程希望复制自己,生成子进程,让父子进程执行不同的代码段。例如:父进程等待客户端请求,生成的子进程来处理请求
一个进程要执行不同的程序。例如子进程从fork返回后,调用exec函数。
fork调用失败的原因:
系统中有太多的进程
实际用户的进程数超过了限制
vfork函数:
也是用来创建子进程,但是
vfork用于创建一个子进程,而子进程和父进程共享地址空间,fork的子进程具有独立地址空间
vfork保证子进程先运行,在它调用exec或exit之后父进程才可能被调度到
代码:
// fork创建子进程通过返回值的不同进行代码分流
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pid;
printf("process 0, pid: %d\n", getpid());
pid = fork();
if(pid < 0)
{
perror("fork error:");
}
// 子进程
if(pid == 0)
{
printf("process 1, I am child, pid:%d\n", getpid());
}
// 父进程
else
{
sleep(1);
printf("process 0, I am parent, pid:%d\n", getpid());
}
return 0;
}
分析:
- 通过返回值的不同进行了代码分流
- 子进程运行的代码是从fork创建成功之后的代码开始运行
- getpid()为获取调用进程的id,getppid()为调用进程的父进程的id
- sleep()的作用是等待子进程,避免产生僵尸进程(在进程概念中提到)
- 在使用进程创建时,我们一般不会让子进程执行相同的任务,在进程控制中讲如何让子进程执行不同的代码
// vfork创建子进程
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
pid_t pid;
pid = vfork();
if(pid == -1)
{
perror("vfork error:");
}
// child
else if(pid == 0)
{
sleep(1);
glob = 200;
printf("child glob: %d\n",glob);
exit(1);
}
// parent
else
{ printf("parent glob :%d\n", glob);
sleep(3);
printf("parent glob :%d\n", glob);
}
return 0;
}
分析:
- vfork与fork相同都是用来创建子进程
- vfork创建的子进程共用父进程的程序地址空间,fork创建的子进程有独立的程序地址空间
- vfork保证子进程先运行,只有当子进程return或者exit退出后父进程才有可能被调度
进程终止:
进程退出场景:
代码运行完毕,结果正确
代码运行完毕,结果错误
代码异常终止
进程常见退出方法:
正常终止(可以通过echo $?查看进程退出码)
1. 从main函数中返回
2. 调用exit
3. _exit
异常退出:
ctrl + c 信号终止
_exit函数:
#include <unistd.h>
void _exit(int status);
参数:status 定义了进程的终止状态,父进程通过wait来获取该值
说明:虽然status是int,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回的值为255
exit函数:
#include <unistd.h>
void exit(int status);
exit最后也会调用_exit,但是在调用_exit之前,还做了其他工作:
1. 执行用户通过atexit或on_exit定义的清理函数
2. 关闭所有打开的流,将缓存的数据写入
3. 调用_exit
return退出:
return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数
会将main的返回值当作exit的参数
#include <unistd.h>
#include <stdio.h>
int main()
{
printf("hello");
exit(0);
}
#include <unistd.h>
#include <stdio.h>
int main()
{
printf("hello");
_exit(0);
}
分析:
- _exit会直接退出进程,exit将缓冲区的内容写入后退出
- return相当于exit(n)
- exit退出时调用_exit
进程等待:等待子进程退出:避免产生僵尸进程
wait(int statu) 等待阻塞任意子进程退出
waitpid(pid_t pid, int statu, int opt) 等待指定/任意子进程推出,并且可以将默认的阻塞设置为非阻塞
进程等待的必要性:
子进程退出,如果父进程不管,就可能造成“僵尸进程”的问题,进而造成内存泄漏
进程一旦变成僵尸状态,kill -9也无能为力,因为谁都无法杀死一个已经死亡的进程
父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果是否正确,或者是否正常退出
父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息
进程等待的方法:
wait方法:
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
返回值:
成功返回被等待进程pid,失败返回-1 。
参数:
输出型参数,获取子进程退出状态,不关心可以设置为NULL
waitpid方法:
pid_t waitpid(pid_t pid, int *status, int options);
返回值:
当正常退出的时候waitpid返回收集到的子进程的进程ID;
如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
pid:
pid == -1,等待任意一个子进程。与wait等效。
pid > 0,等待其进程ID与pid相等的子进程。
status:
WIFEXITED(status):若为正常终止子进程返回的状态,则为真。(查看进程是否正常退出)
WEXITSTATUS(status):若WIFEXITED非0,提取子进程退出码。(查看进程退出码)
options:
WNOHANG:若pid指定的子进程没有结束,则waitpid()函数返回0,不予等待,若正常退出,则返回该子进程的ID。
如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用了wait/waitpid,子进程存在且正在运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。
获取子进程status
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
int main()
{
pid_t pid;
if((pid = fork()) == -1)
{
perror("fork error:");
exit(1);
}
if(pid == 0)
{
sleep(20);
exit(10);
}
else
{
int st;
int ret = wait(&st);
if(ret > 0 && (st & 0x7F) == 0)
{
printf("child exit code: %d\n", (st>>8)&0xFF);
}
else if(ret > 0)
{
printf("sig code: %d\n", st&0x7F);
}
}
return 0;
}
程序替换:替换进程所运行的程序(更改虚拟地址空间中代码所映射的内存区域)
为了让子进程不干跟父进程相同的事情
exec函数族:
使用方法:
execl(/bin/ls,ls,-a,-l,-i,NULL);
execlp(ls,-a,NULL);
execle(/bin/ls,ls,-a,NULL,env);
execv(/bin/ls,argv);
execvp(/bin/ls,argv,env);
函数解释:
这些函数如果调用成功则加载新的程序从启动代码开始执行,不在返回。
如果调用出错则返回-1
所以exec函数只有出错返回值,没有成功返回值
命名理解:
l(list):表示参数采用列表
v(vector):参数用数组
p(path):有p自动搜索环境变量PATH
e(env):表示自己维护环境变量
exec调用:
#include <unistd.h>
int main()
{
char *const argv[] = {"ps", "-ef", NULL};
char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps","ps","-ef", NULL);
// 带p的,可以使用环境变量PATH,无需写全路径
execlp("ps", "ps", "-ef", NULL);
// 带e的,需要自己组装环境变量
execle("ps", "ps", "-ef", NULL, envp);
// 带v的,使用argv进行传参
execv("/bin/ps", argv);
execvp("ps", argv);
execve("/bin/ps", argv, envp);
exit(0);
}
事实上只有execve是真正的系统调用,其他5个函数最终都调用execve,所以execve在man手册第二节,其他函数在man手册第3节。
学习完本节知识就可以制作一个简易的shell了
shell的过程:
1. 获取命令行
2. 解析命令行
3. 建立一个子进程(fork)
4. 替换子进程(execvp)
5. 父进程等待子进程退出(wait)
在后面会实现这个shell,并加以解析。