Linux 2.6内核完全支持epoll.
epoll的IO效率不随FD数目增加而线性下降
传统的select/poll每次调用都会线性扫描全部的集合,导致效率呈现线性下降。
内核实现中epoll是根据每个fd上面的callback函数实现的。只有"活跃"的socket才会主
动的去调用 callback函数,其他idle状态socket则不会。
如果所有的socket基本上都是活跃的---比如一个高速LAN环境,过多使用epoll,效率
相比还有稍微的下降。
但是一旦使用idle connections模拟WAN环境,epoll的效率就远在select/poll之上了。
poll的执行分三部分:
1.将用户传入的pollfd数组拷贝到内核空间,因为拷贝操作和数组长度相关,时间
上这是一个O(n)操作
2.
查询每个文件描述符对应设备的状态,如果该设备尚未就绪,则在该设备的等
待队列中加入一项并继续查询下一设备的状态。
查询完所有设备后如果没有一个设备就绪,这时则需要挂起当前进程等待,直
到设备就绪或者超时。
设备就绪后进程被通知继续运行,这时再次遍历所有设备,以查找就绪设备。
这一步因为两次遍历所有设备,时间复杂度也是O(n),这里面不包括等待时
间。。
3.
将获得的数据传送到用户空间并执行释放内存和剥离等待队列等善后工作,向
用户空间拷贝数据与剥离等待队列等操作的的时间复杂度同样是O(n)。
epoll用到的所有函数都是在头文件sys/epoll.h中声明的,下面简要说明所用到的数
据结构和函数:
所用到的数据结构
typedef union epoll_data {
结构体epoll_event 被用于注册所感兴趣的事件和回传所发生待处理的事件.
其中epoll_data 联合体用来保存触发事件的某个文件描述符相关的数据.
例如一个client连接到服务器,服务器通过调用accept函数可以得到于这个client对
应的socket文件描述符,可以把这文件描述符赋给epoll_data的fd字段以便后面的读
写操作在这个文件描述符上进行。epoll_event 结构体的events字段是表示感兴趣的
事件和被触发的事件可能的取值为:
EPOLLIN :表示对应的文件描述符可以读;
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET:表示对应的文件描述符有事件发生;
所用到的函数:
1、int epoll_create(int size)
范围
2、
用于控制某个文件描述符上的事件,可以注册事件,修改事件,删除事件。
如果调用成功返回0,不成功返回-1
int epoll_ctl(
EPOLL_CTL_MOD 修改、EPOLL_CTL_DEL 删除
3、
用于轮询I/O事件的发生
返回发生事件数
int epoll_wait(
保证一些效率
。