应用程序往往需要在多于一个文件描述符上阻塞:例如相应键盘输入、进程间通信以及同时操作多个文件。基于事件驱动机制的图形用户界面(GUI)应用的主循环中可能包含上百个等待响应的文件。
在不使用线程,尤其是独立处理每一个文件的情况下,进程无法在多个文件描述符上同时阻塞。如果文件都处于准备好被读写的状态,同时操作多个文件描述符是没有问题的。但一旦在该过程中出现一个未准备好的文件描述符(比如说一个read()被调用, )但没有读入数据,则这个进程将会阻塞,不能再操作其他文件。可能阻塞有几秒钟,但是应用无响应也会造成不好的用户体验。然而,如果该文件描述符始终没有任何可用数据,就可能一直阻塞下去。文件描述符的I/O总是相关的(例如管道),很可能一个文件描述符依赖另外一个文件描述符,直到后者可以被使用前,前者一直处于不可用状态。尤其是对网络应用程序而言,同时打开的多个套接字,会诱发潜在的问题。
试想一下如下情景:当标准输入设备挂起,无数据输出,应用在一个进程间通信相关的文件描述符上阻塞。应用只有在阻塞的IPC文件描述符返回数据后,才能确知键盘输入已经挂起。如果被阻塞的操作没有返回,情况又会怎么样呢?
非阻塞I/O可以作为这个问题的一个解决方案。使用非阻塞I/O,应用可以发起I/O请求并返回一个特别地错误,从而避免阻塞。从两个方面来讲,这种方法效率较差。首先,进程需要以某种不确定的方式不断发起I/O操作,直到某个打开的文件描述符准备好进行I/O。其次,如果程序可以睡眠的话将更加有效,可以让处理器进行其他工作,直到一个或更多文件描述符可以进行I/O时再唤醒。
进入I/O多路复用
I/O多路复用允许应用在多个文件描述符上同时阻塞,并在其中某个可以读写时收到通知。这时I/O多路复用就成了应用的关键所在,一般来讲I/O多路复用的设计遵循以下原则:
1、I/O多路复用:当任何文件描述符准备好I/O时告诉我。
2、在一个或多个文件描述符就绪前始终处于睡眠状态。
3、唤醒:哪个准备好了?
4、在不阻塞的情况下处理所有I/O就绪的文件描述符。
5、返回第一步,重新开始
Linux提供了三种I/O多路复用方案:select,poll,epoll。
复用即为了提高物理设备的效率,用最少的物理要素传递最多数据时的技术。
select函数
使用select函数时可以将多个文件描述符集中到一起统一监视,项目如下
1、是否存在套接字接收数据
2、无需阻塞传输数据的套接字有哪些
3、哪些套接字发生了异常
select函数的调用方法和顺序:
步骤一:设置文件描述符、指定监视范围、设置超时
步骤二:调用select函数
步骤三:查看调用结果
一、设置文件描述符
利用select函数可以同时监视多个文件描述符。因此可以视为监视套接字。首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述4中分成3类。
使用fd_set数组变量执行此项操作,该数组存有0和1的位数组。
数组中最左端的位表示文件描述符0,如果该位设置为1,则表示该文件描述符是监视对象。
在fd_set变量中注册或更改值的操作都由下列宏完成:
FD_ZERO(fd_set *fdset)---将fd_set变量的所有位初始化为0
FD_SET(int fd,fd_set *fdset)---在参数fdset指向的变量中注册文件描述符fd的信息
FD_CLR(int fd,fd_set *fdset)---从参数fdset指向的变量中清除文件描述符fd的信息
FD_ISSET(int fd,fd_set *fdset)---若参数fdset指向的变量中包含文件描述符fd的信息,则返回“真”
上述函数中,FD_ISSET用于验证select函数的调用结果。
二、设置监视范围及超时
下面是select函数:
#include<sys/select.h>
#include<sys/time.h>
int select(int maxfd,fd_set *readset,fd_set *writeset,fd_set *execptset,const struct timeval *timeout);
//成功时返回大于0的值,失败时返回-1
//maxfd---监视对象文件描述符数量
//readset---将所有关注"是否存在待读取数据"的文件描述符注册到fd_set型变量,并传递其地址值
//writeset---将所有关注"是否可传输无阻塞数据"的文件描述符注册到fd_set型变量,并传递其地址值
//execptset---将所有关注"是否发生异常"的文件描述符注册到fd_set型变量,并传递其地址值
//timeout---调用select函数后,为防止陷入无限阻塞状态,传递超时信息
1、文件描述符的监视范围与select函数的第一个参数有关。select函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在fd_set变量中的文件描述符数。但每次新建文件描述符时,其值都会增1,故只需将最大的文件描述符值加1再传递到select函数即可。加1是因为文件描述符的值从0开始。
2、select函数的超时时间与select函数的最后一个参数有关,其timeval结构体定义如下。
struct timeval
{
long tv_sec; //seconds
long tv_usec;//microseseconds
}
select函数只有在监视的文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况发生。
3、调用select函数后查看结果
如果select函数的返回值是大于0的整数,说明相应数量的文件描述符发生变化。
select调用示例:
#include<unistd.h>
#include<sys/time.h>
#include<sys/select.h>
#define BUF_SIZE 30
int main()
{
fd_set reads,temps;
int result,str_len;
char buf[BUF_SIZE];
struct timeval timeout;
FD_ZERO(&reads); //初始化fd_set变量
FD_SET(0,&reads); //将文件描述符0对应的位设置为1,即需要监视标准输入的变化
while(1){
temps=reads; //将准备好的fd_set变量reads的内容复制到temps变量,因为调用select函数后,除发生变化的文件描述符对应位外,剩下的所有位将初始化为0
timeout.tv_sec=5;
timeout.tv_usec=0;
result=select(1,&temps,0,0,&timeout);//有输入数据,则返回大于0的整数;否则引发超时,返回0
if(result==-1){
puts("select() error!");
break;
}
else if(result==0){
puts("Time-out");
}
else{
if(FD_ISSET(0,&temps)) //验证发生变化的文件描述符是否为标准输入
{
str_len=read(0,buf,BUF_SIZE);
buf[str_len]=0;
printf("message from console:%s",buf);
}
}
return 0;
}
epoll函数
select函数不太合理的设计如下:
1、调用select函数后常见的针对所有文件描述符的循环语句。
2、每次调用select函数时都需要向该函数传递监视对象信息。
epoll函数的优点如下:
1、无需编写以监视状态变化为目的的针对所有文件描述符的语句。
2、调用对应于select函数的epoll_wait函数时无需每次传递监视对象信息。
下面是epoll服务端实现中需要的三个函数:
- epoll_create---创建保存epoll文件描述符的空间
- epoll_ctl---向空间注册并注销文件描述符
- epoll_wait---与select函数类似,等待文件描述符发生变化
select方式中为了保存监视对象文件描述符,直接声明了fd_set变量。但epoll方式下由操作系统负责保存监视对象文件描述符,因此需要向操作系统请求创建保存文件描述符的空间,此时使用的函数就是epoll_create。
为了添加和删除监视对象文件描述符,select方式中需要FD_SET、FD_CLR函数。但在epoll方式中,通过epoll_ctl函数请求操作系统完成。最后select函数下调用select函数等待文件描述符的变化,而epoll中调用epoll_wait函数。
select方式中通过fd_set变量查看监视对象的状态变化,而epoll方式中通过如下结构体epoll_event将发生变化的文件描述符单独集中到一起。
struct epoll_event
{
__uint32 events;
epoll_data_t data;
}
typedef union epoll_data
{
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
}epoll_data_t;
声明足够大的epoll_event结构体数组后,传递给epoll_wait函数时,发生变化的文件描述符信息被填入该数组。因此,无需像select函数那样针对所有文件描述符进行循环。
epoll_create函数
#include<sys/epoll.h>
int epoll_create(int size);
//成功时返回epoll文件描述符,失败时返回-1
//size---epoll实例的大小
调用epoll_create函数时创建的文件描述符保存空间称为“epoll例程”,但有些情况下名称不同。通过参数size传递的值决定epoll例程的大小,但该值只是向操作系统提的建议。
epoll_create函数创建的资源与套接字相同,也由操作系统管理。因此,该函数和创建套接字的情况相同,也会返回文件描述符。需要终止时,与其他文件描述符相同,也需要close函数。
epoll_ctl函数
生成epoll例程后,应在其内部注册监视对象文件描述符,此时使用epoll_ctl函数。
#include<sys/epoll.h>
int epoll_ctl(int epfd,int op,int fd,struct epoll_event *event);
//成功时返回0,失败时返回-1
//epfd---用于注册监视对象的epoll例程的文件描述符
//op---用于指定监视对象的添加、删除或更改操作
//fd---需要注册的监视对象文件描述符
//event---监视对象的事件类型
此函数有些复杂,看下面:
epoll_ctl(A,EPOLL_CTL_ADD,B,C);
第二个参数EPOLL_CTL_ADD意味着“添加”,因此上述语句的含义是:
epoll例程A中注册文件描述符B,主要目的是监视参数C中的事件
epoll_ctl(A,EPOLL_CTL_DEL,B,NULL);
从epoll例程A中删除文件描述符B
epoll_ctl第二个参数传递的常量及含义:
EPOLL_CTL_ADD---将文件描述符注册到epoll例程
EPOLL_CTL_DEL---从epoll例程中删除文件描述符
EPOLL_CTL_MOD---更改注册的文件描述符的关注事件发生情况
下面介绍epoll_ctl函数的第四个参数,其类型是epoll_event结构体的指针。epoll_event结构体用于保存发生事件的文件描述符集合。但也可以在epoll例程中注册文件描述符时,用于注册关注的事件下面是该结构体在epoll_ctl函数中的应用:
struct epoll_event event;
......
event.events=EPOLLIN;//发生需要读取数据的情况时
event.data.fd=sockfd;
epoll_ctl(epfd,EPOLL_CTL_ADD,sockfd,&event);
......
上述代码将sockfd注册到epoll例程epfd中,并在需要读取数据的情况下产生相应事件。接下来给出epoll_event的成员events中可以保存的常量及所指的事件类型。
- EPOLLIN---需要读取数据的情况
- EPOLLOUT---输出缓冲为空,可以立即发送数据的情况
- EPOLLPRI---收到OOB数据的情况
- EPOLLRDHUP---断开连接或半关闭的情况,这在边缘触发方式下非常有用
- EPOLLERR---发生错误的情况
- EPOLLET---以边缘触发的方式得到事件通知
- EPOLLONESHOT---发生一次事件后,相应文件描述符不再收到事件通知。因此需要向epoll_ctl函数的第二个参数传递EPOLL_CTL_MOD,再次设置事件
epoll_wait函数
#include<sys/epoll.h>
int epoll_wait(int epfd,struct epoll_event* events,int maxevents,int timeout);
//成功时返回发生事件的文件描述符数,失败时返回-1
//epfd---表示事件发生监视范围的epoll例程的文件描述符
//events---保存发生事件的文件描述符集合的结构体地址值
//maxevents---第二个参数中可以保存的最大事件数
//timeout---以1/1000秒为单位的等待时间,传递-1时,一直等待直到发生事件
该函数的调用方式如下,需要注意第二个参数所指缓冲需要动态分配,
int event_cnt;
struct epoll_event *ep_events;
......
ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE); //EPOLL_SIZE是宏常量
......
event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);
调用函数后,返回发生事件的文件描述符数,同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合。因此,无需像select那样插入针对所有文件描述符的循环。
下面是基于epoll的回声服务器端:
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<arpa/inet.h>
#include<sys/socket.h>
#include<sys/epoll.h>
#define BUF_SIZE 100
#define EPOLL_SIZE 50
void error_handling(char *message);
int main()
{
int serv_sock,clnt_sock;
struct sockaddr_in serv_adr,clnt_adr;
socklen_t adr_sz;
int str_len,i;
char buf[BUF_SIZE];
struct epoll_event *ep_events;
struct epoll_event event;
int epfd,event_cnt;
if(argc!=2){
printf("Usage:%s<port>\n",argv[0]);
exit(1);
}
serv_sock=socket(PF_INET,SOCK_STREAM,0);
memset(&serv_adr,0,sizeof(serv_adr));
serv_adr.sin_family=AF_INET;
serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
serv_adr.sin_port=htons(atoi(argv[1]));
if(bind(serv_sock,(struct sockaddr*)&serv_adr,sizeof(serv_adr))==-1)
error_handling("bind error");
if(listen(serv_sock,5)==-1)
error_handling("listen error");
epfd=epoll_create(EROLL_SIZE);
ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE);
event.events=EPOLLIN;
event.data.fd=serv_sock;
epoll_ctl(epfd,EPOLL_CTL_ADD,serv_sock,&event);
while(1)
{
event_cnt=epoll_wait(epfd,ep_events,EPOLL_SIZE,-1);
if(event_cnt==-1){
puts("epoll_wait error");
break;
}
for(i=0;i<event_cnt;i++)
{
if(ep_events[i].data.fd==serv_sock)
{
adr_sz=sizeof(clnt_adr);
clnt_sock=accept(serv_sock,(struct sockaddr*)&clnt_adr,&adr_sz);
event.events=EPOLLIN;
event.data.fd=clnt_sock;
epoll_ctl(epfd,EPOLL_CTL_ADD,clnt_Sock,&event);
printf("connected client:%d \n",clnt_sock);
}
else{
str_len=read(ep_events[i].data.fd,buf,BUF_SIZE);
if(str_len==0) //close request
{
epoll_ctl(epfd,EPOLL_CTL_DEL,ep_events[i].data.fd,NULL);
close(ep_events[i].data.fd);
printf("closed client:%d \n",ep_events[i].data.fd);
}
else{
write(ep_events[i].data.fd,buf,str_len);
}
}
}
}
close(serv_sock);
close(epfd);
return 0;
}
void error_handling(char *buf)
{
fputs(buf,stderr);
fputc('\n',stderr);
exit(1);
}