进程间通信
因为进程的独立性,所以导致进程间进行数据通信将变得特别麻烦。操作系统不得不提供方法来使进程间能够通信。
为什么要进程通信:进程间协作(通知/共享,数据传输,进程控制)
想办法能够让两个进程通信:提供一个介质能够让多个进程都能访问。
因为通信的公共介质有所不同,所以操作系统为我们提供进程间通信的方式不止一种。
进程间通信方式(2个标准):
System V标准的进程间通信: 共享内存,消息队列,信号量
Posix : 共享内存,消息队列,信号量,互斥量,条件变量,读写锁
一、管道:(半双工,单向通信)
传输资源(数据资源)
1.原理:操作系统为进程提供一个双方都能访问的缓冲区(内核内),操作系统提供的管道操作接口就是io接口。
2.匿名管道(必须在创建子进程之前创建该管道,否则子进程将无法复制)
仅仅适用于具有亲缘关系的进程间通信,因为匿名管道没有名字,其他进程根本找不着,因此也就没有办法通信,所以只能通过子进程复制父进程的方法,让子进程能够访问到相同的管道,来实现通信。(管道的操作:io操作——文件描述符)
管道是一个半双工通信方式(单向通信),所以一个管道使用的时候就必须确定数据流向,但是又不能一创建就确定,因为操作系统不确定谁读谁写。因此,它就提供两个描述符来使用,一个读一个写。将对应的一段关闭,就可以确定方向了,这样操作系统就把方向的控制权交给用户了。
接口:pipe (int fd[2] ) fd[0]: 读 fd[1]:写
操作:
创建:pipe
读写:read,write
读写特性:
管道的读写操作默认是阻塞操作
如果管道没有数据,那么read则一直等待,直到有数据(阻塞)。
如果管道数据满了,那么write则一直等待,直到有数据被读出(阻塞)。
如果所有写入端关闭了,read读完所有数据后则返回0。
如果所有读取端关闭了,write产生信号SIGPIPE,触发异常,进而导致write进程退出。
当写入的数据量不大于PIPE_BUF时,linux将保证写入的原子性(读写操作不可被打乱,造成数据混乱问题)。
当写入的数据量大于PIPE_BUF时,不保证写入的原子性。
管道自带同步与互斥特性,所以可以保证原子性。
同步:保证操作访问的时序性(一个操作完才能操作另一个)
互斥:(类比取款)保证操作的同一时间唯一访问
管道特点:
管道提供流式服务。数据的流式服务,体现的是数据的发送和接受的灵活性。但是数据没有边界,容易粘包。(多条数据粘接到一起了,接受方无法分辨数据界限)。管道的生命周期随进程
3.命名管道:
半双工
流式服务
读写特性
mkfifo 不仅具备匿名管道的读写特性,并且还有自己的打开特性
匿名管道是直接已经打开了,pipe接口直接返回文件描述符,而命名管道创建后,并不会直接打开,需要用户自己open打开,后续操作:
如果没有以写的方式打开,以读方式打开的时候就会阻塞。
如果没有以读的方式打开,以写方式打开的时候就会阻塞。
如果以读写打开,将不阻塞
有名字:
体现在文件系统可见性,因为其他进程都能看到这个管道文件,所以可以用于本机任意间通信。
4.命名管道和匿名管道的区别:
匿名管道只能用于具有亲缘关系的进程间通信,命名管道可以用于本机上任意进程间通信
二、共享内存:
这是进程间通信最快的一种。
其他的进程间通信方式,都会涉及到将用户空间的数据拷贝到内核空间(因为公共的缓冲区都在内核空间),这是两步操作(拷入/拷出)
而共享内存的原理是多个进程将同一块物理内存映射到自己的虚拟地址空间,以这种方式实现数据共享,操作这个虚拟地址就是操作这个物理内存。相较于其他的通信方式,少了两步用户空间和内核空间的拷贝过程,因此速度最快。
共享内存的操作步骤:
创建/打开一块共享内存
将这块共享内存映射到自己的虚拟地址空间
各种内存的操作
解除映射关系
删除共享内存 ipcs -m(查看) ipcrm -m shmid(删除)
共享内存的生命周期随内核
(1)shmget函数:
功能:⽤用来创建共享内存
原型:int shmget(key_t key, size_t size, int shmflg);
参数:
key:共享内存在系统中的标识符(这个共享内存段名字)
ftok这个接口可以通过一个文件计算出一个key的值
size:共享内存大小
shmflg:IPC_LEY 创建|权限,由九个权限标志构成(它们的⽤用法和创建⽂文件时使⽤用的mode模式标志是⼀一样的 )
返回值:共享内存的操作句柄。成功返回⼀一个非负整数(该共享内存段的标识码),失败返回-1。
创建这个共享内存无法直接操作,因为我们只能操作虚拟地址空间中的地址,因此第二步就是将共享内存映射到虚拟地址空间,让我们能通过虚拟地址来访问这块内存。
(2)shmat函数
功能:将共享内存段连接到进程地址空间
原型:void *shmat(int shmid, const void *shmaddr, int shmflg);
参数:
shmid: 共享内存标识(句柄)
shmaddr:指定连接的地址(映射首地址),通常置空
shmflg:它的两个可能取值是SHM_RND(可读可写)和SHM_RDONLY(只读)
返回值:成功返回虚拟地址空间的首地址;失败返回(void*)-1
shmaddr为NULL,核⼼心⾃自动选择⼀一个地址
shmaddr不为NULL且shmflg⽆无SHM_RND标记,则以shmaddr为连接地址。
shmaddr不为NULL且shmflg设置了SHM_RND标记,则连接的地址会⾃自动向下调整为SHMLBA的整数倍。
公式:shmaddr - (shmaddr % SHMLBA) shmflg=SHM_RDONLY,表示连接操作用来只读共享内存
(3)shmdt函数
功能:将共享内存段与当前进程脱离(解除在虚拟地址空间的映射关系)
原型:int shmdt(const void *shmaddr);
参数:shmaddr: 由shmat所返回的指针 (映射的首地址)
返回值:成功返回0;失败返回-1
注意:将共享内存段与当前进程脱离不等于删除共享内存段
(4)shmctl
功能:删除共享内存(并不会立即删除,会判断映射连接数是否为0)
原型:int shmctl(int shmid, int cmd, struct shmid_ds *buf);
参数:
shmid:由shmget返回的共享内存标识码
cmd:将要采取的动作(有三个可取值)
IPC_RMID:删除共享内存
buf:指向一个保存着共享内存的模式状态和访问权限的数据结构
返回值:成功返回0;失败返回-1
三、消息队列(全双工通信):传输的是有类型的数据块
msgtype:
1. 确定数据是谁的
2. 0---获取首节点,不关心类型
在内核中创建一个消息队列,其他的所有进程都可以通过相同的IPC_KEY打开消息队列。这时候既可以向队列中放数据,也可以从队列中取数据。但是这样数据可能会拿错(拿到自己的数据),因此消息队列中能够放的数据是有类型的数据块,并且读写的时候只能按消息块来发送、接收。
四、信号量:
信号量并不是用来数据传输的,用来控制(进程间的同步与互斥)进程的。
信号量是一个具有等待队列的计数器。.获取资源就是计数器-1,释放资源就是对计数器+1。有没有资源就是判断计数器是否大于0。当计数器不大于0,意味着没有资源,想要获取信号量资源就需要等待。
同步:如果没有资源,等待别人释放资源,别人释放后通知等待的人。
互斥:一元信号量实现互斥(计数不是0就是1)
由于各进程要求共享资源,而且有些资源需要互斥使用,因此各进程间竞争使用这些资源,进程的这种关系为进程的互斥。
系统中某些资源一次只允许一个进程使用,称这样的资源为临界资源或互斥资源。 在进程中涉及到互斥资源的程序段叫临界区。