Linux I/O复用-select函数和epoll函数

本文介绍I/O多路复用技术的基本概念及其在Linux系统中的实现方式,包括select、poll和epoll函数的工作原理及应用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

       应用程序往往需要在多于一个文件描述符上阻塞:例如相应键盘输入、进程间通信以及同时操作多个文件。基于事件驱动机制的图形用户界面(GUI)应用的主循环中可能包含上百个等待响应的文件。

       在不使用线程,尤其是独立处理每一个文件的情况下,进程无法在多个文件描述符上同时阻塞。如果文件都处于准备好被读写的状态,同时操作多个文件描述符是没有问题的。但一旦在该过程中出现一个未准备好的文件描述符(比如说一个read()被调用, )但没有读入数据,则这个进程将会阻塞,不能再操作其他文件。可能阻塞有几秒钟,但是应用无响应也会造成不好的用户体验。然而,如果该文件描述符始终没有任何可用数据,就可能一直阻塞下去。文件描述符的I/O总是相关的(例如管道),很可能一个文件描述符依赖另外一个文件描述符,直到后者可以被使用前,前者一直处于不可用状态。尤其是对网络应用程序而言,同时打开的多个套接字,会诱发潜在的问题。

       试想一下如下情景:当标准输入设备挂起,无数据输出,应用在一个进程间通信相关的文件描述符上阻塞。应用只有在阻塞的IPC文件描述符返回数据后,才能确知键盘输入已经挂起。如果被阻塞的操作没有返回,情况又会怎么样呢?

       非阻塞I/O可以作为这个问题的一个解决方案。使用非阻塞I/O,应用可以发起I/O请求并返回一个特别地错误,从而避免阻塞。从两个方面来讲,这种方法效率较差。首先,进程需要以某种不确定的方式不断发起I/O操作,直到某个打开的文件描述符准备好进行I/O。其次,如果程序可以睡眠的话将更加有效,可以让处理器进行其他工作,直到一个或更多文件描述符可以进行I/O时再唤醒。

进入I/O多路复用

       I/O多路复用允许应用在多个文件描述符上同时阻塞,并在其中某个可以读写时收到通知。这时I/O多路复用就成了应用的关键所在,一般来讲I/O多路复用的设计遵循以下原则:

    1、I/O多路复用:当任何文件描述符准备好I/O时告诉我。

    2、在一个或多个文件描述符就绪前始终处于睡眠状态。

    3、唤醒:哪个准备好了?

    4、在不阻塞的情况下处理所有I/O就绪的文件描述符。

    5、返回第一步,重新开始

Linux提供了三种I/O多路复用方案:select,poll,epoll。

复用即为了提高物理设备的效率,用最少的物理要素传递最多数据时的技术。


select函数
使用select函数时可以将多个文件描述符集中到一起统一监视,项目如下
    1、是否存在套接字接收数据
    2、无需阻塞传输数据的套接字有哪些
    3、哪些套接字发生了异常

select函数的调用方法和顺序:
    步骤一:设置文件描述符、指定监视范围、设置超时
    步骤二:调用select函数
    步骤三:查看调用结果

一、设置文件描述符
      利用select函数可以同时监视多个文件描述符。因此可以视为监视套接字。首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述4中分成3类。
使用fd_set数组变量执行此项操作,该数组存有0和1的位数组。
数组中最左端的位表示文件描述符0,如果该位设置为1,则表示该文件描述符是监视对象。

在fd_set变量中注册或更改值的操作都由下列宏完成:

FD_ZERO(fd_set *fdset)---将fd_set变量的所有位初始化为0
FD_SET(int fd,fd_set *fdset)---在参数fdset指向的变量中注册文件描述符fd的信息
FD_CLR(int fd,fd_set *fdset)---从参数fdset指向的变量中清除文件描述符fd的信息
FD_ISSET(int fd,fd_set *fdset)---若参数fdset指向的变量中包含文件描述符fd的信息,则返回“真”
上述函数中,FD_ISSET用于验证select函数的调用结果。

二、设置监视范围及超时
下面是select函数:

#include<sys/select.h>
#include<sys/time.h>
int select(int maxfd,fd_set *readset,fd_set *writeset,fd_set *execptset,const struct timeval *timeout);
//成功时返回大于0的值,失败时返回-1
//maxfd---监视对象文件描述符数量
//readset---将所有关注"是否存在待读取数据"的文件描述符注册到fd_set型变量,并传递其地址值
//writeset---将所有关注"是否可传输无阻塞数据"的文件描述符注册到fd_set型变量,并传递其地址值
//execptset---将所有关注"是否发生异常"的文件描述符注册到fd_set型变量,并传递其地址值
//timeout---调用select函数后,为防止陷入无限阻塞状态,传递超时信息

1、文件描述符的监视范围与select函数的第一个参数有关。select函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在fd_set变量中的文件描述符数。但每次新建文件描述符时,其值都会增1,故只需将最大的文件描述符值加1再传递到select函数即可。加1是因为文件描述符的值从0开始。
2、select函数的超时时间与select函数的最后一个参数有关,其timeval结构体定义如下。

struct timeval
{
   long tv_sec; //seconds
   long tv_usec;//microseseconds
}

select函数只有在监视的文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况发生。
3、调用select函数后查看结果
如果select函数的返回值是大于0的整数,说明相应数量的文件描述符发生变化。

select调用示例:

#include<unistd.h>
#include<sys/time.h>
#include<sys/select.h>
#define BUF_SIZE 30

int main()
{
    fd_set reads,temps;
    int result,str_len;
    char buf[BUF_SIZE];
    struct timeval timeout;
    FD_ZERO(&reads);  //初始化fd_set变量
    FD_SET(0,&reads); //将文件描述符0对应的位设置为1,即需要监视标准输入的变化
    
    while(1){
       temps=reads;   //将准备好的fd_set变量reads的内容复制到temps变量,因为调用select函数后,除发生变化的文件描述符对应位外,剩下的所有位将初始化为0
       timeout.tv_sec=5;
       timeout.tv_usec=0;
       result=select(1,&temps,0,0,&timeout);//有输入数据,则返回大于0的整数;否则引发超时,返回0
       if(result==-1){
	       puts("select() error!");
	       break;
       }
       else if(result==0){
	       puts("Time-out");
       }
       else{
	   if(FD_ISSET(0,&temps)) //验证发生变化的文件描述符是否为标准输入
	   {
		    str_len=read(0,buf,BUF_SIZE);
		    buf[str_len]=0;
		    printf("message from console:%s",buf);
	   }
	   
       }
   return 0;
}


epoll函数
select函数不太合理的设计如下:
    1、调用select函数后常见的针对所有文件描述符的循环语句。
    2、每次调用select函数时都需要向该函数传递监视对象信息。

epoll函数的优点如下:
    1、无需编写以监视状态变化为目的的针对所有文件描述符的语句。
    2、调用对应于select函数的epoll_wait函数时无需每次传递监视对象信息。

下面是epoll服务端实现中需要的三个函数:

  • epoll_create---创建保存epoll文件描述符的空间
  • epoll_ctl---向空间注册并注销文件描述符
  • epoll_wait---与select函数类似,等待文件描述符发生变化

      select方式中为了保存监视对象文件描述符,直接声明了fd_set变量。但epoll方式下由操作系统负责保存监视对象文件描述符,因此需要向操作系统请求创建保存文件描述符的空间,此时使用的函数就是epoll_create。
      为了添加和删除监视对象文件描述符,select方式中需要FD_SET、FD_CLR函数。但在epoll方式中,通过epoll_ctl函数请求操作系统完成。最后select函数下调用select函数等待文件描述符的变化,而epoll中调用epoll_wait函数。
      select方式中通过fd_set变量查看监视对象的状态变化,而epoll方式中通过如下结构体epoll_event将发生变化的文件描述符单独集中到一起。

struct epoll_event
{
   __uint32 events;
   epoll_data_t data;
}

typedef union epoll_data
{
   void *ptr;
   int fd;
   __uint32_t u32;
   __uint64_t u64;
}epoll_data_t;

      声明足够大的epoll_event结构体数组后,传递给epoll_wait函数时,发生变化的文件描述符信息被填入该数组。因此,无需像select函数那样针对所有文件描述符进行循环。

epoll_create函数

#include<sys/epoll.h>
int epoll_create(int size);
//成功时返回epoll文件描述符,失败时返回-1
//size---epoll实例的大小

      调用epoll_create函数时创建的文件描述符保存空间称为“epoll例程”,但有些情况下名称不同。通过参数size传递的值决定epoll例程的大小,但该值只是向操作系统提的建议。
      epoll_create函数创建的资源与套接字相同,也由操作系统管理。因此,该函数和创建套接字的情况相同,也会返回文件描述符。需要终止时,与其他文件描述符相同,也需要close函数。

epoll_ctl函数
生成epoll例程后,应在其内部注册监视对象文件描述符,此时使用epoll_ctl函数。

#include<sys/epoll.h>
int epoll_ctl(int epfd,int op,int fd,struct epoll_event *event);
//成功时返回0,失败时返回-1
//epfd---用于注册监视对象的epoll例程的文件描述符
//op---用于指定监视对象的添加、删除或更改操作
//fd---需要注册的监视对象文件描述符
//event---监视对象的事件类型

此函数有些复杂,看下面:
epoll_ctl(A,EPOLL_CTL_ADD,B,C);
第二个参数EPOLL_CTL_ADD意味着“添加”,因此上述语句的含义是:
epoll例程A中注册文件描述符B,主要目的是监视参数C中的事件

epoll_ctl(A,EPOLL_CTL_DEL,B,NULL);
从epoll例程A中删除文件描述符B
epoll_ctl第二个参数传递的常量及含义:
EPOLL_CTL_ADD---将文件描述符注册到epoll例程
EPOLL_CTL_DEL---从epoll例程中删除文件描述符
EPOLL_CTL_MOD---更改注册的文件描述符的关注事件发生情况

下面介绍epoll_ctl函数的第四个参数,其类型是epoll_event结构体的指针。epoll_event结构体用于保存发生事件的文件描述符集合。但也可以在epoll例程中注册文件描述符时,用于注册关注的事件下面是该结构体在epoll_ctl函数中的应用:

struct epoll_event event;
......
event.events=EPOLLIN;//发生需要读取数据的情况时
event.data.fd=sockfd;
epoll_ctl(epfd,EPOLL_CTL_ADD,sockfd,&event);
......

上述代码将sockfd注册到epoll例程epfd中,并在需要读取数据的情况下产生相应事件。接下来给出epoll_event的成员events中可以保存的常量及所指的事件类型。

  • EPOLLIN---需要读取数据的情况
  • EPOLLOUT---输出缓冲为空,可以立即发送数据的情况
  • EPOLLPRI---收到OOB数据的情况
  • EPOLLRDHUP---断开连接或半关闭的情况,这在边缘触发方式下非常有用
  • EPOLLERR---发生错误的情况
  • EPOLLET---以边缘触发的方式得到事件通知
  • EPOLLONESHOT---发生一次事件后,相应文件描述符不再收到事件通知。因此需要向epoll_ctl函数的第二个参数传递EPOLL_CTL_MOD,再次设置事件


epoll_wait函数

#include<sys/epoll.h>
int epoll_wait(int epfd,struct epoll_event* events,int maxevents,int timeout);
//成功时返回发生事件的文件描述符数,失败时返回-1
//epfd---表示事件发生监视范围的epoll例程的文件描述符
//events---保存发生事件的文件描述符集合的结构体地址值
//maxevents---第二个参数中可以保存的最大事件数
//timeout---以1/1000秒为单位的等待时间,传递-1时,一直等待直到发生事件

该函数的调用方式如下,需要注意第二个参数所指缓冲需要动态分配,

int event_cnt;
struct epoll_event *ep_events;
......
ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE); //EPOLL_SIZE是宏常量
......
event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);

       调用函数后,返回发生事件的文件描述符数,同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合。因此,无需像select那样插入针对所有文件描述符的循环。

下面是基于epoll的回声服务器端:

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<arpa/inet.h>
#include<sys/socket.h>
#include<sys/epoll.h>
#define BUF_SIZE 100
#define EPOLL_SIZE 50
void error_handling(char *message);

int main()
{
	int serv_sock,clnt_sock;
	struct sockaddr_in serv_adr,clnt_adr;
	socklen_t adr_sz;
	int str_len,i;
	char buf[BUF_SIZE];

	struct epoll_event *ep_events;
	struct epoll_event event;
	int epfd,event_cnt;
	if(argc!=2){
			printf("Usage:%s<port>\n",argv[0]);
				exit(1);
	}
	serv_sock=socket(PF_INET,SOCK_STREAM,0);
	memset(&serv_adr,0,sizeof(serv_adr));
	serv_adr.sin_family=AF_INET;
	serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
	serv_adr.sin_port=htons(atoi(argv[1]));

	if(bind(serv_sock,(struct sockaddr*)&serv_adr,sizeof(serv_adr))==-1)
		error_handling("bind error");
	if(listen(serv_sock,5)==-1)
		error_handling("listen error");

	epfd=epoll_create(EROLL_SIZE);
	ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE);

	event.events=EPOLLIN;
	event.data.fd=serv_sock;
	epoll_ctl(epfd,EPOLL_CTL_ADD,serv_sock,&event);

	while(1)
	{
		event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);
		if(event_cnt==-1){
			puts("epoll_wait error");
			break;
		}
		for(i=0;i<event_cnt;i++)
		{
			if(ep_events[i].data.fd==serv_sock)
			{
				adr_sz=sizeof(clnt_adr);
				clnt_sock=accept(serv_sock,(struct sockaddr*)&clnt_adr,&adr_sz);
				event.events=EPOLLIN;
				event.data.fd=clnt_sock;
				epoll_ctl(epfd,EPOLL_CTL_ADD,clnt_Sock,&event);
				printf("connected client:%d \n",clnt_sock);
			}
			else{
				str_len=read(ep_events[i].data.fd,buf,BUF_SIZE);
				if(str_len==0) //close request
				{
					epoll_ctl(epfd,EPOLL_CTL_DEL,ep_events[i].data.fd,NULL);
					close(ep_events[i].data.fd);
					printf("closed client:%d \n",ep_events[i].data.fd);
				}
				else{
					write(ep_events[i].data.fd,buf,str_len);
				}
			}
		}
	}
	close(serv_sock);
	close(epfd);
	return 0;
}
void error_handling(char *buf)
{
	fputs(buf,stderr);
	fputc('\n',stderr);
	exit(1);
}

 

   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值