epoll基础（转载）

最新推荐文章于 2022-06-07 18:05:52 发布

原创最新推荐文章于 2022-06-07 18:05:52 发布 · 185 阅读

0 ·

CC 4.0 BY-SA版权

编程专栏收录该内容

121 篇文章

订阅专栏

原文地址： http://zsp.iteye.com/blog/146850

注:内容皆是摘录

Linux 2.6内核完全支持epoll.

epoll的IO效率不随FD数目增加而线性下降

传统的select/poll每次调用都会线性扫描全部的集合，导致效率呈现线性下降。

内核实现中epoll是根据每个fd上面的callback函数实现的。只有"活跃"的socket才会主

动的去调用 callback函数，其他idle状态socket则不会。

如果所有的socket基本上都是活跃的---比如一个高速LAN环境，过多使用epoll,效率

相比还有稍微的下降。

但是一旦使用idle connections模拟WAN环境,epoll的效率就远在select/poll之上了。

poll的执行分三部分：
1.将用户传入的pollfd数组拷贝到内核空间，因为拷贝操作和数组长度相关，时间

上这是一个O（n）操作

2.
查询每个文件描述符对应设备的状态，如果该设备尚未就绪，则在该设备的等

待队列中加入一项并继续查询下一设备的状态。
查询完所有设备后如果没有一个设备就绪，这时则需要挂起当前进程等待，直

到设备就绪或者超时。
设备就绪后进程被通知继续运行，这时再次遍历所有设备，以查找就绪设备。
这一步因为两次遍历所有设备，时间复杂度也是O（n），这里面不包括等待时

间。。

3.
将获得的数据传送到用户空间并执行释放内存和剥离等待队列等善后工作，向

用户空间拷贝数据与剥离等待队列等操作的的时间复杂度同样是O（n）。

epoll用到的所有函数都是在头文件sys/epoll.h中声明的，下面简要说明所用到的数

据结构和函数：
所用到的数据结构
typedef union epoll_data {
                void *ptr;
                int fd;
                __uint32_t u32;
                __uint64_t u64;
        } epoll_data_t;

        struct epoll_event {
                __uint32_t events;
                epoll_data_t data;
        };
结构体epoll_event 被用于注册所感兴趣的事件和回传所发生待处理的事件.

其中epoll_data 联合体用来保存触发事件的某个文件描述符相关的数据.

例如一个client连接到服务器，服务器通过调用accept函数可以得到于这个client对

应的socket文件描述符，可以把这文件描述符赋给epoll_data的fd字段以便后面的读

写操作在这个文件描述符上进行。epoll_event 结构体的events字段是表示感兴趣的

事件和被触发的事件可能的取值为：
EPOLLIN ：表示对应的文件描述符可以读；
EPOLLOUT：表示对应的文件描述符可以写；
EPOLLPRI：表示对应的文件描述符有紧急的数据可读
EPOLLERR：表示对应的文件描述符发生错误；
EPOLLHUP：表示对应的文件描述符被挂断；
EPOLLET：表示对应的文件描述符有事件发生；

所用到的函数：
1、int epoll_create(int size)
   该函数生成一个epoll专用的文件描述符，其中的参数是指定生成描述符的最大

范围

2、
用于控制某个文件描述符上的事件，可以注册事件，修改事件，删除事件。
如果调用成功返回0,不成功返回-1
int epoll_ctl(
    int epfd,//由 epoll_create 生成的epoll专用的文件描述符
    int op,//要进行的操作例如注册事件，可能的取值EPOLL_CTL_ADD 注册、

EPOLL_CTL_MOD 修改、EPOLL_CTL_DEL 删除
    int fd,//关联的文件描述符
    struct epoll_event *event//指向epoll_event的指针
    )

3、
用于轮询I/O事件的发生
返回发生事件数
int epoll_wait(
    int epfd,//由epoll_create 生成的epoll专用的文件描述符
    struct epoll_event * events,//用于回传代处理事件的数组
    int maxevents,//每次能处理的事件数
    int timeout//等待I/O事件发生的超时值
               //为0的时候表示马上返回，为-1的时候表示一直等下去，直到有事件
               //为任意正整数的时候表示等这么长的时间，如果一直没有事件
               //一般如果网络主循环是单独的线程的话，可以用-1来等，这样可以

保证一些效率
               //如果是和主逻辑在同一个线程的话，则可以用0来保证主循环的效率

。
    )