进程间的四种高级通信方式
进程通信是指进程之间的信息交换。由于进程的互斥与同步,需要在进程间交换一定的信息,故称进程通信。但通过进程交换信息是一种低级进程通信,以信号量机制为例,原因如下:
- 效率低。生产者每次只能向缓冲池投放一个产品(消息) ,消费者每次只能从缓冲池中得到一个消息。
- 通信对用户不透明。OS为进程间通信提供了共享存储器。而关于进程间通信所需之共享数据结构的设置、数据的传送、进程的互斥与同步,都必须由程序员去实现。
1 共享存储器系统
在贡献存储器系统中,相互通信的进程共享某些数据结构或贡献存储区,进程间通过这些空间进行通信。据此,又可以把他们分为一下两种类型。
1.1 基于共享数据结构的通信方式
在这种通信方式中,要求诸进程公用某些数据结构,借以实现诸进程间的信息交换,如生产者-消费者中的有界缓存区。OS仅提供共享存储器,由程序员负责对公用数据结构的设置及对进程间同步的处理。这种通信方式仅适用于传递相对少量的数据,通信效率低下,属于低级通信。
1.2 基于共享存储区的通信方式
为了传输大量数据,在内存中划出了一块共享存储区域,诸进程可通过对该共享区的读或写交换信息,实现通信,数据形式和位置甚至访问控制都是由进程负责,而不是OS。这种通信方式属于高级通信。需要通信的进程在进程通信前,先向系统申请获得共享存储区中的一个分区,并将其附加到自己的自己的地址空间中,便可对其中的数据进行正常读写,读写完或者不在需要时,将其归还给共享存储区,完成数据通信。
2 管道(pipe)通信系统
所谓“管道”,是指用于连接一个读进程和一个写进程以实现他们之间通信的一个文件,又名pipe文件。向管道(共享文件)提供输入的发送进程(即写进程)以字符流形式将大量数据送入管道,而接受管道输出的接受进程(即读进程)则从管道中接受数据。由于发送进程和接受进程都是利用管道通信的,故又称管道通信。
为了协调双方的通信,管道机制必须提供一下三方面的协调能力。
- 互斥。即当一个进程正在对pipe进行读/写操作时,其他进程必须等待
- 同步。跟生产者-消费者模式类似。当写进程把一定数量的数据写入pipe,便去睡眠等待,当直到读进程取走数据后再把他唤醒。当读进程读一个空pipe时,也应睡眠等待,直至写进程将数据写入管道后才将之唤醒。
- 确定对方是否存在。只有确定对方已存在才行通信。
3 消息传递系统
在该机制中,进程不必借助任何共享存储区或者数据结构,而是以格式化的消息(message)为单位,将通信的数据封装在消息中,并利用操作系统提供的一组通信命令(原语),在进程间进行消息传递,完成进程间的数据交换。
该方式隐藏了通信实现细节,使通信过程对用户透明化,降低了通信程序设计的复杂性和错误率。
基于消息传递系统的通信方式属于高级通信方式,因实现方式的不同,可分为两类。
- 直接通信方式。是指发送进程利用OS所提供的发送原语,直接把消息发送给目标进程
- 间接通信方式。是指发送和接受进程,都通过共享中间实体(称为邮箱)的方式进行消息的发送和接收,完成进程间的通信。
4 客户机-服务器系统
其主要实现方法分为三类:套接字,远程过程调用和远程方法调用
4.1 套接字
一个套接字就是一个通信标识类型的数据结构,包含了通信目的地址、通信使用端口号、通信网络的传输层协议、进程所在的网络地址、以及针对客户或服务器程序提供的不同系统调用,是进程通信和网络通信的基本构件。套接字包括两类
- 基于文件型。通信进程都位于同一台机器中的环境中,套接字是基于本地文件系统支持的,一个套接字关联到一个特殊的文件,通信双方通过对这个特殊文件的读写实现通信,其原理类似管道。
- 基于网络型。该类型通常采用的是非对称方式通信,即发送者需要提供接收者命名。通信双方的进程运行在不同主机的网络环境下,被分配了一堆套接字,一个属于接受进程(或服务器),一个属于发送进程(或客户端)。一般的,发送进程发出连接请求时,随机申请一个套接字,主机位置分之一个端口,与该套接字绑定,不再分配给其他进程。接受进程(或服务端)拥有全局公认的套接字和指定的端口,并通过监听端口等待客户请求。
套接字的优势在于,它不仅适用于同一台计算机内部的进程通信,也适用于网络环境中不同计算机的进程通信。
4.2 远程过程调用和远程方法调用
远程过程(函数)调用RPC(Remote Produce Call),是一个通信协议,用于通过网络连接的系统。该协议允许运行于一台主机(本地)系统上的进程调用另一台主机(远程)系统上的进程
负责处理远程过程调用的进程有两个,一个是本地客户进程,另一个是远程服务进程,这两个进程通常也被称为网络守护进程,主要负责在网络间的消息传递,一般情况下,这两个进程都是处于阻塞状态,等待消息。
为了使远程过程调用看上去和本地过程调用一样,即希望实现RPC的透明性,使得调用者感受不到此次调用的过程是在其他主机(远程)上执行的,RPC引入了一个存根的概念:在本地客户端,每个能够独立运行的远程调用过程都拥有一个客户存根,本地进程远程调用远程过程实际是调用该过程关联的存根;与此类似,在每个远程进程所在服务器端,其所对应的实际可执行进程也存在一个服务器存根与其关联。本地客户存根与对应的远程服务器的存根一般也是处于等待状态,等待消息。