Linux 系统应用网络编程五(I/O模型)

Linux 系统应用网络编程五(I/O模型)

一、概述

在Unix系统中,存在五种主要的I/O模型,它们分别是阻塞I/O、非阻塞I/O、I/O复用(select和poll)、信号驱动I/O(SIGIO)以及异步I/O(POSIX的aio_系列函数)。

  1. 阻塞I/O

    • 是最常用的I/O模型。
    • 在默认情况下,所有文件操作都是阻塞的。
    • 当进程空间中调用recvfrom(或其他类似的I/O操作函数)时,该系统调用会一直阻塞,直到数据包到达并被复制到应用进程的缓冲区中,或者发生错误为止。
    • 在这个过程中,进程会一直等待,因此被称为阻塞I/O模型。
  2. 非阻塞I/O

    • 当调用recvfrom时,如果缓冲区没有数据,它会立即返回一个EWOULDBLOCK错误,而不是阻塞等待。
    • 应用程序通常会通过轮询(polling)不断检查这个状态,以查看内核是否有数据到达。
    • 这种方式会大量占用CPU时间,因为应用进程需要持续不断地查询内核以查看某个操作是否就绪。
  3. I/O复用(select和poll)

    • 利用select或poll系统调用来监控多个文件描述符(或套接字)。
    • 进程将一个或多个文件描述符传递给select或poll,并阻塞在这些操作上。
    • 当任何一个文件描述符就绪时(例如,有数据可读或可写),select或poll会返回。
    • 这种方式允许单个进程同时监控多个I/O事件,从而提高了系统的并发处理能力。
    • 需要注意的是,select和poll在使用时可能会受到文件描述符数量限制的影响,并且需要两次系统调用(一次是调用select或poll,另一次是调用实际的I/O操作函数)。
  4. 信号驱动I/O(SIGIO)

    • 进程通过接收到的信号来确认数据准备就绪。
    • 首先,需要开启套接字的信号驱动I/O功能,并通过sigaction系统调用安装一个信号处理程序。
    • 当数据报准备好被读时,内核会为该进程生成一个SIGIO信号。
    • 进程在接收到SIGIO信号后,可以在信号处理程序中调用recvfrom来读取数据报。
    • 这种方式的优势在于等待数据报到达期间,进程不会被阻塞,可以继续执行其他任务。
  5. 异步I/O(POSIX的aio_系列函数)

    • 是POSIX规范定义的异步I/O操作。
    • 通过调用aio_read等异步I/O函数,可以告知内核启动某个I/O操作,并让内核在整个操作(包括将数据从内核拷贝到用户缓冲区)完成后通知应用程序。
    • 在这个过程中,应用程序不会被阻塞,可以继续执行其他任务。
    • 当I/O操作完成时,内核会通过信号或其他方式通知应用程序。

 二、I/O模型解析

一个输入操作通常包括两个不同的阶段:

1)等待数据准备好;

2)从内核向进程复制数据;

对于一个套接字的输入操作,第一步通常涉及等待数据从网络中到达。当所等待分组到达时,它被复制到内核中某个缓冲区。第二步就是把数据从内核缓冲区复制到应用进程缓冲区。

2.1、阻塞I/O

最流行的I/O模型是阻塞式I/O(blocking I/O) 模型,默认情况下,所有的套接字都是阻塞的。 阻塞调用是指调用结果返回之前,当前线程会被挂起(线程进入非可执行状态,在这个状态下,cpu不会给线程分配时间片,即线程暂停运行)。函数只有在得到结果之后才会返回

以数据包套接字为例,如图:

        进程调用recvfrom,其 系统调用直到数据报到达且被 拷贝到应用进程的缓冲区或者发生错误才返回。最常见的错误是系统调用被信号中断。我们说进程从调用recvfrom开始到它返回的整段时间内是被阻塞的,recvfrom成功返回后,进程开始处理数据报。

2.2、非阻塞I/O

       非阻塞和阻塞的概念相对应,指在不能立刻得到结果之前,该函数不会阻塞当前线程,而会立刻返回。

进程把一个套接口设置成非阻塞是在通知内核:当所请求的I/O操作非得把本进程投入睡眠才能完成时,不要把本进程投入睡眠,而是返回一个错误。

        前三次调用recvfrom 时没有数据可返回,因此内核转而立即返回一个EWOULDBLOCK 错误。第四次调用 recvfrom 时已有一个数据报准备好,它被复制到应用程序缓冲区,于是recvfrom 成功返回。我们接着处理数据。

        当一个应用进程像这样对一个非阻塞描述符循环调用 recvfrom 时,我们称之为轮询(polling)。应用程序持续轮询内核,以查看某个操作是否就绪。这样做往往耗费大量CPU 时间。

2.3、I/O复用

        主要可以调用 select和epoll;对一个IO端口,两次调用,两次返回, 比阻塞IO并没有什么优越性;关键是能实现同时对多个IO端口进行监听,可以等待多个描述符就绪;

        I/O复用模型会用到select、poll、epoll函数,这几个函数 也会使进程阻塞,但是和阻塞I/O所不同的的, 这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作,多个写操作的I/O函数进行检测,直到有数据可读或可写时,才真正调用I/O操作函数。

2.4、信号驱动I/O模型

       也可以用信号,让内核在描述字就绪时发送SIGIO信号通知我们。称这种模型为 信号驱动I/O(signal-driven I/O)。
      首先开启套接口的信号驱动I/O功能,并通过sigaction系统调用安装一个信号处理函数。该系统调用立即发回,我们的进程继续工作,也就是说它没有被阻塞。当数据报准备好时,内核就为该进程产生一个SIGIO信号。我们随后既可以在信号处理函数中调用recvfrom读取数据报,并通知主循环数据已经准备好待处理,也可以立即通知主循环,让它读取数据报。
       无论如何处理SIGIO信号,这种模型的优势在于等待数据报到达期间,进程不被阻塞。主循环可以继续执行,只要不时等待来自信号处理函数的通知:既可以是数据已经准备好被处理,也可以是数据报已准备好被读取。

2.5、异步I/O模型

        异步I/O(asynchronous I/O)有POSIX规范定义。后来演变成当前POSIX规范的各种早期标准定义的实时函数中存在的差异已经取得一致。一般地说,这些函数的工作机制是:告知内核启动某个操作,并让内核在整个操作(包括将数据从内核拷贝到我们自己的缓冲区)完成后通知我们。这种模型与前与前面介绍的信号驱动模型的主要区别在于: 信号驱动I/O是由内核通知我们何时可以启动一个I/O操作,而异步I/O模型是由内核通知我们I/O操作何时完成。

2.6、各种模型的比较 

I/O模型描述第一阶段(获取I/O就绪事件)第二阶段(将I/O数据从内核区复制到用户区)是否阻塞是否同步
阻塞I/O最基本的I/O模型进程被挂起,直到内核通知进程可读或可写进程被阻塞,直到数据复制完成
非阻塞I/O改进版,避免进程被长时间挂起如果不可读或写,立即返回一个错误码当数据可读时,进程仍需被阻塞以复制数据否(第一阶段)
I/O复用(select/poll/epoll)允许内核监听多个socket描述符,通知进程I/O事件就绪进程阻塞在select或poll调用上,等待一个或多个I/O事件就绪当I/O事件就绪后,进程被唤醒并阻塞在数据复制上是(等待I/O事件就绪时)
信号驱动I/O内核在socket描述符准备就绪时发送SIGIO信号通知进程进程不被阻塞,等待SIGIO信号收到信号后,进程需阻塞在数据复制上否(等待信号时)
异步I/O最理想的模型,内核完成整个I/O操作后通知进程进程立即返回,不阻塞

可以看出,前4种模型的主要区别在于第一阶段,因为它们的第二阶段是一样的:在数据从内核复制到调用者的缓冲区起见,进程阻塞与recvfrom 调用,相反。异步I/O模型在这两个阶段都需要处理,从而不同于其他四种模型。

同步I/O与异步I/O对比
POSIX把这两个术语定义如下:
·同步I/O操作(synchronous I/O operation)导致请求进程阻塞,直到I/O操作完成。
·异步I/O(asynchronous I/O operation)不导致请求进程阻塞。

       根据上述定义,我们前4种模型----阻塞I/O模型、非阻塞I/O模型、I/O复用模型和信号去驱动I/O模型都是同步I/O模型因为其中真正的I/O操作(recvfrom)将阻塞进程。只有异步I/O模型与POSIX定义的异步I/O相匹配。

select 函数

        该函数允许进程指示内核等待多个事件中的任何一个发生,并只在有一个或多个事件发生或经历一段指定的时间后才唤醒它。

作为一个例子,我们可以调用select,告知内核仅在下列情况发生时才返回:

1)集合{ 1, 4, 5 } 中任何描述符准备好读;

2)集合{ 2, 7 } 中任何描述符准备好写;

3)集合{ 1, 4 } 中任何描述符有异常条件待处理;

也就是说,我们调用 select 告知内核对哪些描述符(就读、写或异常条件)感兴趣以及等待多长时间。我们感兴趣的描述符不局限于套接字,任何描述符都可以用select 来测试。函数描述如下:

#include <sys/select.h>
#include <sys/time.h>
 
int select(int maxfdp1, fd_set *readset, fd_set *writeset, fd_set *exceptset, 
             const struct timeval *timeout);

从最后一个参数timeout 开始介绍,它告知内核等待所指定描述符中任何一个就绪可花多长时间。其timeval结构用于指定这段时间的秒数和微妙数。

struct timeval
{
	long tv_sec; //seconds
	long tv_usec; //mircoseconds
}

这个参数有以下三种可能:

1)永远的等待下去:仅在有一个描述符准备好I/O时才返回。为此,我们把这个参数设置为空指针;

2)等待一段固定时间:在有一个描述符准备好I/O时返回,但是不超过由该参数所指向的timeval 结构中指定的秒数和微秒数;

3)根本不等待:检查描述符后立即反悔,这称为轮询(polling)。为此,该参数必须指向一个timeval结构,而且其中的定时器值(由该结构指定的秒数和微秒数)必须为0;

中间的三个参数 readset 、writeset 和 exceptset 指定我们要让内核测试读、写和异常条件的描述符。

select 使用描述符集,通常是同一个整数数组,其中每个整数中的每一位对于一个描述符。举例来说,假设使用32位整数,那么该数组的每一个元素对应于描述符0~31,第二位元素对应于描述符32~63,依次类推, 它们隐藏 为 fd_set 的数据类型和以下四个宏中:

void FD_ZERO(fd_set *fdset); //从fdset中清除所有的文件描述符
void FD_SET(int fd, fd_set *fdset); //将fd加入到fdset
void FD_CLR(int fd, fd_set *fdset); //将fd从fdset里面清除
int FD_ISSET(int fd, fd_set *fdset); //判断fd是否在fdset集合中

举个例子,以下代码用于定义一个fd_set 类型的变量,然后打开描述符 1、4 和 5 的对应位;

fd_set rset;
 
FD_ZERO(&rset);
FD_SET(1, &rset);
FD_SET(4 &rset);
FD_SET(5, &rset);

描述符集的初始化非常重要,因为作为自动变量分配的一个描述符集如果没有初始化,那么可能发生不可预期的后果。

      select 函数修改由指针 readset 、writeset 和 exceptset 所指向的描述符集,因而这三个参数都是值-结果参数。调用该函数时,我们指定所关心的描述符的值,该函数返回时,结果将指示哪些描述符就绪。该函数返回后,我们使用FD_ISSET宏测试 fd_set 数据类型中的描述符。描述符集内任何与未就绪描述符对应的位返回时均清0。为此, 每次重新调用select函数时,我们都得再次把所以描述符集内所关心的为均置一。

      数的返回值表示跨所有描述符集的已就绪的总位数。如果任何描述符就绪之前定时器到时,那么返回0.返回-1表示出错。

描述符就绪条件:

对于可读文件描述符集以下四种情况会导致置位:
1、socket接收缓冲区中的数据量大于或等于当前缓冲区的低水位线.此时对于read操作不会被阻塞并且返回一个正值(读取的字节数).低水位线可以通过SO_RCVLOWAT选项设定,对于Tcp和Udp来说其默认值为1.
2、socket连接的读端被关闭,如shutdown(socket, SHUT_RD)或者close(socket).对应底层此时会接到一个FIN包,read不会被阻塞但会返回0.代表读到socket末端.
3、socket是一个监听socket并且有新连接等待.此时accept操作不会被阻塞.
4、发生socket错误.此时read操作会返回SOCKET_ERROR(-1).可以通过errno来获取具体错误信息.

对于可写文件描述符集以下四种情况会导致置位:
1、socket发送缓冲区中的可用缓冲大小大于或等于发送缓冲区中的低水位线并且满足以下条件之一
    (1)、socket已连接
    (2)、socket本身不要求连接,典型如Udp
   
    低水位线可以通过SO_SNDLOWAT选项设置.对于Tcp和Udp来说一般为2048.
2、socket连接的写端被关闭,如shutdown(socket, SHUT_WR)或者close(socket).在一个已经被关闭写端的句柄上写数据会得到SIGPIPE的信号(errno).
3、一个非阻塞的connect操作连接成功 或者 connect操作失败.
4、发生socket错误.此时write操作会返回SOCKET_ERROR(-1).可以通过errno来获取具体错误信息.

对于异常文件描述符集只有一种情况(针对带外数据):
当收到带外数据(out-of-band)时或者socket的带外数据标志未被清除.

三、举例应用

server

 #include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/select.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#define PORT 8888
#define MAXSIZE 128
 
int main()
{
	int i,nbyte;
	int listenfd, confd, maxfd;
	char buffer[MAXSIZE];
	fd_set global_rdfs, current_rdfs;
	struct sockaddr_in addr,clientaddr;
	int addrlen = sizeof(struct sockaddr_in);
	int caddrlen = sizeof(struct sockaddr_in);
 
	if((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
	{
		perror("socket error");
		exit(-1);
	}
	else
	{
		printf("socket successfully!\n");
		printf("listenfd : %d\n",listenfd);
	}
 
	memset(&addr, 0 ,addrlen);
	addr.sin_family = AF_INET;
	addr.sin_port = htons(PORT);
	addr.sin_addr.s_addr = htonl(INADDR_ANY);
	if(bind(listenfd,(struct sockaddr *)&addr,addrlen) == -1)
	{
		perror("bind error");
		exit(-1);
	}
	else
	{
		printf("bind successfully!\n");
		printf("listen port:%d\n",PORT);
	}
 
	if(listen(listenfd,5) == -1)
	{
		perror("listen error");
		exit(-1);
	}
	else
	{
		printf("listening...\n");
	}
 
	maxfd = listenfd;
	FD_ZERO(&global_rdfs);
	FD_SET(listenfd,&global_rdfs);
 
	while(1)
	{
		current_rdfs = global_rdfs;
		if(select(maxfd + 1,¤t_rdfs, NULL, NULL,0) < 0)
		{
			perror("select error");
			exit(-1);
		}
		
		for(i = 0; i <= listenfd + 1; i++)
		{
			if(FD_ISSET(i, ¤t_rdfs))
			{
				if(i == listenfd)
				{
					if((confd = accept(listenfd,(struct sockaddr *)&clientaddr,&caddrlen)) == -1)
					{
						perror("accept error");
						exit(-1);
					}
					else
					{
						printf("Connect from [IP:%s PORT:%d]\n",
								inet_ntoa(clientaddr.sin_addr),clientaddr.sin_port);
						FD_SET(confd,&global_rdfs);
						maxfd = (maxfd > confd ? maxfd : confd);
					}
				}
				else
				{
					if((nbyte = recv(i, buffer, sizeof(buffer),0)) < 0)
					{
						perror("recv error");
						exit(-1);
					}
					else if(nbyte == 0)
					{
						close(i);
						FD_CLR(i,&global_rdfs);
					}
					else
					{
						printf("recv:%s\n",buffer);
						send(i, buffer, sizeof(buffer),0);
					}
				}
			}
		}
	}
 
	return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值