Linux I/O复用-select函数和epoll函数

最新推荐文章于 2025-04-19 12:37:05 发布

原创最新推荐文章于 2025-04-19 12:37:05 发布 · 1.3k 阅读

0 ·

CC 4.0 BY-SA版权

Unix/Linux编程专栏收录该内容

12 篇文章

订阅专栏

本文介绍I/O多路复用技术的基本概念及其在Linux系统中的实现方式，包括select、poll和epoll函数的工作原理及应用示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

应用程序往往需要在多于一个文件描述符上阻塞：例如相应键盘输入、进程间通信以及同时操作多个文件。基于事件驱动机制的图形用户界面（GUI）应用的主循环中可能包含上百个等待响应的文件。

在不使用线程，尤其是独立处理每一个文件的情况下，进程无法在多个文件描述符上同时阻塞。如果文件都处于准备好被读写的状态，同时操作多个文件描述符是没有问题的。但一旦在该过程中出现一个未准备好的文件描述符（比如说一个read()被调用，）但没有读入数据，则这个进程将会阻塞，不能再操作其他文件。可能阻塞有几秒钟，但是应用无响应也会造成不好的用户体验。然而，如果该文件描述符始终没有任何可用数据，就可能一直阻塞下去。文件描述符的I/O总是相关的(例如管道)，很可能一个文件描述符依赖另外一个文件描述符，直到后者可以被使用前，前者一直处于不可用状态。尤其是对网络应用程序而言，同时打开的多个套接字，会诱发潜在的问题。

试想一下如下情景：当标准输入设备挂起，无数据输出，应用在一个进程间通信相关的文件描述符上阻塞。应用只有在阻塞的IPC文件描述符返回数据后，才能确知键盘输入已经挂起。如果被阻塞的操作没有返回，情况又会怎么样呢？

非阻塞I/O可以作为这个问题的一个解决方案。使用非阻塞I/O，应用可以发起I/O请求并返回一个特别地错误，从而避免阻塞。从两个方面来讲，这种方法效率较差。首先，进程需要以某种不确定的方式不断发起I/O操作，直到某个打开的文件描述符准备好进行I/O。其次，如果程序可以睡眠的话将更加有效，可以让处理器进行其他工作，直到一个或更多文件描述符可以进行I/O时再唤醒。

进入I/O多路复用

I/O多路复用允许应用在多个文件描述符上同时阻塞，并在其中某个可以读写时收到通知。这时I/O多路复用就成了应用的关键所在，一般来讲I/O多路复用的设计遵循以下原则：

1、I/O多路复用：当任何文件描述符准备好I/O时告诉我。

2、在一个或多个文件描述符就绪前始终处于睡眠状态。

3、唤醒：哪个准备好了？

4、在不阻塞的情况下处理所有I/O就绪的文件描述符。

5、返回第一步，重新开始

Linux提供了三种I/O多路复用方案：select，poll，epoll。

复用即为了提高物理设备的效率，用最少的物理要素传递最多数据时的技术。

select函数
使用select函数时可以将多个文件描述符集中到一起统一监视，项目如下
    1、是否存在套接字接收数据
    2、无需阻塞传输数据的套接字有哪些
    3、哪些套接字发生了异常

select函数的调用方法和顺序：
    步骤一：设置文件描述符、指定监视范围、设置超时
    步骤二：调用select函数
    步骤三：查看调用结果

一、设置文件描述符
      利用select函数可以同时监视多个文件描述符。因此可以视为监视套接字。首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项（接收、传输、异常）进行区分，即按照上述4中分成3类。
使用fd_set数组变量执行此项操作，该数组存有0和1的位数组。
数组中最左端的位表示文件描述符0，如果该位设置为1，则表示该文件描述符是监视对象。

在fd_set变量中注册或更改值的操作都由下列宏完成：

FD_ZERO(fd_set *fdset)---将fd_set变量的所有位初始化为0
FD_SET(int fd,fd_set *fdset)---在参数fdset指向的变量中注册文件描述符fd的信息
FD_CLR(int fd,fd_set *fdset)---从参数fdset指向的变量中清除文件描述符fd的信息
FD_ISSET(int fd,fd_set *fdset)---若参数fdset指向的变量中包含文件描述符fd的信息,则返回“真”
上述函数中，FD_ISSET用于验证select函数的调用结果。

二、设置监视范围及超时
下面是select函数：

#include<sys/select.h>
#include<sys/time.h>
int select(int maxfd,fd_set *readset,fd_set *writeset，fd_set *execptset,const struct timeval *timeout);
//成功时返回大于0的值，失败时返回-1
//maxfd---监视对象文件描述符数量
//readset---将所有关注"是否存在待读取数据"的文件描述符注册到fd_set型变量，并传递其地址值
//writeset---将所有关注"是否可传输无阻塞数据"的文件描述符注册到fd_set型变量，并传递其地址值
//execptset---将所有关注"是否发生异常"的文件描述符注册到fd_set型变量，并传递其地址值
//timeout---调用select函数后，为防止陷入无限阻塞状态，传递超时信息

1、文件描述符的监视范围与select函数的第一个参数有关。select函数要求通过第一个参数传递监视对象文件描述符的数量。因此，需要得到注册在fd_set变量中的文件描述符数。但每次新建文件描述符时，其值都会增1，故只需将最大的文件描述符值加1再传递到select函数即可。加1是因为文件描述符的值从0开始。
2、select函数的超时时间与select函数的最后一个参数有关，其timeval结构体定义如下。

struct timeval
{
   long tv_sec; //seconds
   long tv_usec;//microseseconds
}

select函数只有在监视的文件描述符发生变化时才返回。如果未发生变化，就会进入阻塞状态。指定超时时间就是为了防止这种情况发生。
3、调用select函数后查看结果
如果select函数的返回值是大于0的整数，说明相应数量的文件描述符发生变化。

select调用示例：

#include<unistd.h>
#include<sys/time.h>
#include<sys/select.h>
#define BUF_SIZE 30

int main()
{
    fd_set reads,temps;
    int result,str_len;
    char buf[BUF_SIZE];
    struct timeval timeout;
    FD_ZERO(&reads);  //初始化fd_set变量
    FD_SET(0,&reads); //将文件描述符0对应的位设置为1，即需要监视标准输入的变化
    
    while(1){
       temps=reads;   //将准备好的fd_set变量reads的内容复制到temps变量，因为调用select函数后，除发生变化的文件描述符对应位外，剩下的所有位将初始化为0
       timeout.tv_sec=5;
       timeout.tv_usec=0;
       result=select(1,&temps,0,0,&timeout);//有输入数据，则返回大于0的整数；否则引发超时，返回0
       if(result==-1){
	       puts("select() error!");
	       break;
       }
       else if(result==0){
	       puts("Time-out");
       }
       else{
	   if(FD_ISSET(0,&temps)) //验证发生变化的文件描述符是否为标准输入
	   {
		    str_len=read(0,buf,BUF_SIZE);
		    buf[str_len]=0;
		    printf("message from console:%s",buf);
	   }
	   
       }
   return 0;
}

epoll函数
select函数不太合理的设计如下：
    1、调用select函数后常见的针对所有文件描述符的循环语句。
    2、每次调用select函数时都需要向该函数传递监视对象信息。

epoll函数的优点如下：
    1、无需编写以监视状态变化为目的的针对所有文件描述符的语句。
    2、调用对应于select函数的epoll_wait函数时无需每次传递监视对象信息。

下面是epoll服务端实现中需要的三个函数：

epoll_create---创建保存epoll文件描述符的空间
epoll_ctl---向空间注册并注销文件描述符
epoll_wait---与select函数类似，等待文件描述符发生变化

      select方式中为了保存监视对象文件描述符，直接声明了fd_set变量。但epoll方式下由操作系统负责保存监视对象文件描述符，因此需要向操作系统请求创建保存文件描述符的空间，此时使用的函数就是epoll_create。
      为了添加和删除监视对象文件描述符，select方式中需要FD_SET、FD_CLR函数。但在epoll方式中，通过epoll_ctl函数请求操作系统完成。最后select函数下调用select函数等待文件描述符的变化，而epoll中调用epoll_wait函数。
      select方式中通过fd_set变量查看监视对象的状态变化，而epoll方式中通过如下结构体epoll_event将发生变化的文件描述符单独集中到一起。

struct epoll_event
{
   __uint32 events;
   epoll_data_t data;
}

typedef union epoll_data
{
   void *ptr;
   int fd;
   __uint32_t u32;
   __uint64_t u64;
}epoll_data_t;

声明足够大的epoll_event结构体数组后，传递给epoll_wait函数时，发生变化的文件描述符信息被填入该数组。因此，无需像select函数那样针对所有文件描述符进行循环。

epoll_create函数

#include<sys/epoll.h>
int epoll_create(int size);
//成功时返回epoll文件描述符，失败时返回-1
//size---epoll实例的大小

调用epoll_create函数时创建的文件描述符保存空间称为“epoll例程”，但有些情况下名称不同。通过参数size传递的值决定epoll例程的大小，但该值只是向操作系统提的建议。
epoll_create函数创建的资源与套接字相同，也由操作系统管理。因此，该函数和创建套接字的情况相同，也会返回文件描述符。需要终止时，与其他文件描述符相同，也需要close函数。

epoll_ctl函数
生成epoll例程后，应在其内部注册监视对象文件描述符，此时使用epoll_ctl函数。

#include<sys/epoll.h>
int epoll_ctl(int epfd,int op,int fd,struct epoll_event *event);
//成功时返回0，失败时返回-1
//epfd---用于注册监视对象的epoll例程的文件描述符
//op---用于指定监视对象的添加、删除或更改操作
//fd---需要注册的监视对象文件描述符
//event---监视对象的事件类型

此函数有些复杂，看下面：
epoll_ctl(A,EPOLL_CTL_ADD,B,C);
第二个参数EPOLL_CTL_ADD意味着“添加”，因此上述语句的含义是：
epoll例程A中注册文件描述符B，主要目的是监视参数C中的事件

epoll_ctl(A，EPOLL_CTL_DEL，B，NULL);
从epoll例程A中删除文件描述符B
epoll_ctl第二个参数传递的常量及含义：
EPOLL_CTL_ADD---将文件描述符注册到epoll例程
EPOLL_CTL_DEL---从epoll例程中删除文件描述符
EPOLL_CTL_MOD---更改注册的文件描述符的关注事件发生情况

下面介绍epoll_ctl函数的第四个参数，其类型是epoll_event结构体的指针。epoll_event结构体用于保存发生事件的文件描述符集合。但也可以在epoll例程中注册文件描述符时，用于注册关注的事件下面是该结构体在epoll_ctl函数中的应用：

struct epoll_event event;
......
event.events=EPOLLIN;//发生需要读取数据的情况时
event.data.fd=sockfd;
epoll_ctl(epfd,EPOLL_CTL_ADD,sockfd,&event);
......

上述代码将sockfd注册到epoll例程epfd中，并在需要读取数据的情况下产生相应事件。接下来给出epoll_event的成员events中可以保存的常量及所指的事件类型。

EPOLLIN---需要读取数据的情况
EPOLLOUT---输出缓冲为空，可以立即发送数据的情况
EPOLLPRI---收到OOB数据的情况
EPOLLRDHUP---断开连接或半关闭的情况，这在边缘触发方式下非常有用
EPOLLERR---发生错误的情况
EPOLLET---以边缘触发的方式得到事件通知
EPOLLONESHOT---发生一次事件后，相应文件描述符不再收到事件通知。因此需要向epoll_ctl函数的第二个参数传递EPOLL_CTL_MOD，再次设置事件

epoll_wait函数

#include<sys/epoll.h>
int epoll_wait(int epfd,struct epoll_event* events,int maxevents,int timeout);
//成功时返回发生事件的文件描述符数，失败时返回-1
//epfd---表示事件发生监视范围的epoll例程的文件描述符
//events---保存发生事件的文件描述符集合的结构体地址值
//maxevents---第二个参数中可以保存的最大事件数
//timeout---以1/1000秒为单位的等待时间，传递-1时，一直等待直到发生事件

该函数的调用方式如下，需要注意第二个参数所指缓冲需要动态分配，

int event_cnt;
struct epoll_event *ep_events;
......
ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE); //EPOLL_SIZE是宏常量
......
event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);

调用函数后，返回发生事件的文件描述符数，同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合。因此，无需像select那样插入针对所有文件描述符的循环。

下面是基于epoll的回声服务器端：

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<arpa/inet.h>
#include<sys/socket.h>
#include<sys/epoll.h>
#define BUF_SIZE 100
#define EPOLL_SIZE 50
void error_handling(char *message);

int main()
{
	int serv_sock,clnt_sock;
	struct sockaddr_in serv_adr,clnt_adr;
	socklen_t adr_sz;
	int str_len,i;
	char buf[BUF_SIZE];

	struct epoll_event *ep_events;
	struct epoll_event event;
	int epfd,event_cnt;
	if(argc!=2){
			printf("Usage:%s<port>\n",argv[0]);
				exit(1);
	}
	serv_sock=socket(PF_INET,SOCK_STREAM,0);
	memset(&serv_adr,0,sizeof(serv_adr));
	serv_adr.sin_family=AF_INET;
	serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
	serv_adr.sin_port=htons(atoi(argv[1]));

	if(bind(serv_sock,(struct sockaddr*)&serv_adr,sizeof(serv_adr))==-1)
		error_handling("bind error");
	if(listen(serv_sock,5)==-1)
		error_handling("listen error");

	epfd=epoll_create(EROLL_SIZE);
	ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE);

	event.events=EPOLLIN;
	event.data.fd=serv_sock;
	epoll_ctl(epfd,EPOLL_CTL_ADD,serv_sock,&event);

	while(1)
	{
		event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);
		if(event_cnt==-1){
			puts("epoll_wait error");
			break;
		}
		for(i=0;i<event_cnt;i++)
		{
			if(ep_events[i].data.fd==serv_sock)
			{
				adr_sz=sizeof(clnt_adr);
				clnt_sock=accept(serv_sock,(struct sockaddr*)&clnt_adr,&adr_sz);
				event.events=EPOLLIN;
				event.data.fd=clnt_sock;
				epoll_ctl(epfd,EPOLL_CTL_ADD,clnt_Sock,&event);
				printf("connected client:%d \n",clnt_sock);
			}
			else{
				str_len=read(ep_events[i].data.fd,buf,BUF_SIZE);
				if(str_len==0) //close request
				{
					epoll_ctl(epfd,EPOLL_CTL_DEL,ep_events[i].data.fd,NULL);
					close(ep_events[i].data.fd);
					printf("closed client:%d \n",ep_events[i].data.fd);
				}
				else{
					write(ep_events[i].data.fd,buf,str_len);
				}
			}
		}
	}
	close(serv_sock);
	close(epfd);
	return 0;
}
void error_handling(char *buf)
{
	fputs(buf,stderr);
	fputc('\n',stderr);
	exit(1);
}