Linux进程控制（上）

最新推荐文章于 2022-11-06 01:33:55 发布

原创最新推荐文章于 2022-11-06 01:33:55 发布 · 867 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#linux #进程创建 #进程等待 #进程退出 #shell

linux 专栏收录该内容

11 篇文章

订阅专栏

1. 进程创建, 等待, 终止. 使用代码实现.
1.1 进程创建
1.1.1 fork
在Linux中fork函数从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。

#include<unistd.h>
pid_t fork(void);
返回值：子进程中返回0，父进程返回子进程id，出错返回-1

进程调用fork，当控制转移到内核中的fork代码后，内核做：

分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝到子进程
添加子进程到系统进程列表中
fork返回，开始调度器调度

当一个进程调用fork之后，就有两个二进制代码相同的进程，而且他们都运行到相同的地方，但每个进程都将可以开始它们自己的旅程，例：
这里写图片描述
运行结果如下：

fork之前父进程独立执行，fork之后，父子进程交替执行。注：fork后，谁先执行完全由调度器决定。如下图：

写时拷贝
通常情况下，父子进程代码共享，父子进程在不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副本。如下图所示：
这里写图片描述
fork常规用法

一个父进程希望复制自己，使父子进程同时执行不同的代码段。如：父进程等待客户端请求，生成子进程来处理请求。
一个进程要执行一个不同的程序。如：子进程从fork返回后，调用exec函数。
fork调用失败的原因
系统中有太多的进程
实际用户的进程数超过了限制

1.1.2 vfork
vfork也是用来创建子程序的，但是

vfork用于创建一个子进程，而子进程和父进程共享地址空间，fork的子进程具有独立地址空间 vfork保证子
进程先运行，在它调用exec或exit之后父进程才可能被调度运行。

例：

运行结果如下：

可见子进程直接改变了父进程的变量值，因为子进程在父进程的地址空间中运行。
fork与vfork的区别见：
https://blog.youkuaiyun.com/qq_15000103/article/details/79708708
1.2 进程等待
进程等待的必要性
- 子进程退出，父进程如果不采取措施就可能造成‘僵尸进程’，进而造成内存泄漏。
- 进程成为僵尸态，kill -9也无能为力。
- 父进程派给子进程的任务完成的如何，需要知道。
- 父进程通过进程等待方式，回收子进程资源，获取子进程退出信息。
进程等待的方法
1）wait方法
wait的功能：
- 阻塞当前程序；
- 回收僵尸子进程，回收僵尸进程

#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int* status);
返回值：
成功返回被等待进程pid，失败返回-1。
参数：
status参数是父进程用来监测子进程退出状态的输出型参数，获取子进程退出状态，不关心则可以设置称为NULL。

调用wait函数时会发生什么？

如果有子进程再运行，那么当前父进程就处于阻塞状态；
如果子进程都已经终止，那么wait可立即获得子进程的终止状态（退出码，退出信息），子进程的终止状态是体现在status参数上的，另外wait还会返![回所终止的子进程的标识符;
如果当前进程没有任何子进程，那么wait会立即出错返回(此时返回值为-1);
如果有一个子进程终止，那么wait便返回;

例：

运行结果：

2）waitpid方法

pid_t waitpid(pid_t pid, int *status, int options)
返回值：
   当正常返回的时候waitpid返回收集到的进程ID；
   如果设置了选项WNOHANG，而调用中waitpid发现没有已退出的子进程可收集，则返回0；
   如果调用中出错，则返回-1，这时errno会被设置成相应的值以指示错误cun存在；
参数：
  pid：
    pid=-1，等待本进程的任一个子进程死亡。与wait等效。
    pid>0,等待pid子进程退出。
    pid=0，本进程所在进程组的任何一个子进程。
    pid<-1,pid绝对值进程组的任何一个子进程。    
status：
  WIFEXTED（status):若为正常终止子进程返回的状态，则为真。（查看子进程是否正常退出）
  WEXTSTATUS（status）：若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）
options：
  WNOHANG：若pid指定的子进程没有结束，则waitpid（）函数返回0，不予以等待。若正常结束，则返回该子进程的ID。指定参数，默认情况下waitpid与wait做的事情都是一样的，为阻塞式监测子进程终止状态；当options=WNOHANG时，此时为非阻塞方式，就是监测时如果子进程没有终止，调用者可以做其他事情，另外还有两个参数分别为WCONTINUED和WUNTRACED，这两个参数是跟作业控制有关的。

如果子进程已经退出，调用wait/waitpid时，wait/waitpid会立即返回，并且释放资源，获得子进程退出信息。
如果在任意时刻调用wait/waitpid，子进程存在且正常运行，则进程可能阻塞。
如果不存在该子进程，则立即出错返回。

这里写图片描述
waitpid与wait函数的不同点

在一个子进程终止前，wait使调用者阻塞，而waitpid有一个选项可以使调用者不发生阻塞；
waitpid并不等待在其调用之后的第一个终止子进程，它有若干选项，并可以控制子进程
waitpid可以等待一个特定的进程，通过pid参数进行设定；

获取子进程status

wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充。
如果传递NULL，表示不关心子进程的退出状态信息。
否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待，可以当作位图来看待

不关心status参数的高16位，在低十六位中，次低8位反应了子进程终止时的退出码，低8位反应了子进程发生异常终止时的返回状态。下图只研究status低16比特位
这里写图片描述

例：
1）子进程正常返回，有结束码
这里写图片描述
运行结果：

2）子进程异常返回情况

运行结果如下：

代码实现：
进程的阻塞等待方式

运行结果：

进程的非阻塞等待方式

运行结果：

1.3 进程终止
1.3.1 进程退出场景

代码运行完毕，结果正确
代码运行完毕，结果不正确
代码异常终止

1.3.2 进程常见退出方法
1）正常终止（可以通过echo $?查看进程退出码）：
- 从main返回
- 调用exit
- _exit
- 进程的最后一个线程在其启动例程中执行return语句
- 进程的最后一个线程调用pthread_exit函数
2）异常退出：
- ctrl+c，信号终止
- 调用absort
- 当进程接收到某些信号时
- 最后一个线程对“取消请求作出响应”
_exit函数

#include<unistd.h>
void _exit(int status);
参数：status定义了进程的终止状态，父进程通过wait来获取该值

注：虽然status是int，但是仅有低8位可以被父进程所用。所以_exit(-1)时，在终端执行$?发现返回值是255
exit函数

#include<unistd.h>
void exit(int status);

exit最后也会调用_exit，但在调用exit之前，还做了其他工作：

执行用户通过atexit或on_exit定义的清理函数。
关闭所有打开的流，所有的缓存数据均被写入
调用_exit

这里写图片描述
例：

return退出
return是一种更常见的退出进程方法。执行return n等同于执行exit（n），因为调用main的运行时函数会将main的返回值当作exit的参数。
2. 编写自主shell
2.1 分析shell典型的互动：

用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为bash的方块代表，它随着时间的流逝从左向右移动。shell从用户读入字符串“ls”。shell建立一个新的进程，然后在那个进程中运行ls程序并等待那个进程结束。
这里写图片描述
然后shell读取新的一行输入，建立一个新的进程，在这个进程中运行程序，并等待这个进程结束。故而，写一个shell，需要循环以下过程：

获取命令行
解析命令行
建立一个子进程（fork）
替换子进程（execvp）
父进程等待子进程退出（wait）

2.2 进程程序替换
2.2.1 替换原理
用fork创建子进程后执行的是和父进程相同的程序（但有可能执行不同的代码分支），子进程往往要调用一种exec函数以执行另一程序。当进程调用一种exec函数时，该进程的用户空间代码和数据完全被新进程替换，从新程序的启动例程开始执行。调用exec并不创建新进程，所以调用exec前后该进程的id并未发生变化。
这里写图片描述
2.2.2 替换函数
有6种以exec开头的函数，统称exec函数：

#include<unistd.h>
int execl(const char*path,const char*arg,...);
int execlp(const char*file,const char*arg,...);
int execle(const char*path,const char*arg,..., char *const envp[]);
int execv(const char*path,const char*arg[]);
int execvp(const char*file,const char*arg[]);
int execve(const char*path,const char*arg[], char *const envp[]);

这些函数如果调用成功则加载新的程序从启动代码开始执行，不再返回。
如果调用出错则返回-1
故exec函数只有出错的返回值而没有成功的返回值。

函数命名规律

l（list）：表示参数采用列表
v（vector）：参数用数组
p（path）：有p自动搜索环境变量PATH
e（env）：表示自己维护环境变量

函数名	参数格式	是否带路径	是否使用当前环境变量
execl	列表	不是	是
execlp	列表	是	是
execle	列表	不是	不是，需自己组装环境变量
execv	数组	不是	是
execvp	数组	是	是
execve	数组	不是	不是，需自己组装环境变量