epoll本质原理

最新推荐文章于 2025-02-13 23:33:35 发布

原创最新推荐文章于 2025-02-13 23:33:35 发布 · 置顶 · 653 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#epoll #io多路复用 #百万句柄处理

LINUX系统专栏收录该内容

5 篇文章

订阅专栏

epoll本质原理

second60 20180622

1. epoll简介

epoll是Linux内核为处理大批量文件描述符而作了改进的poll，是Linux下多路复用IO接口select/poll的增强版本，它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率。

2. epoll优点

1. 支持一个进程打开大数目的socket描述符

(1) 查最大支持描述符: cat /proc/sys/fd/file-max

2. IO效率不随FD数目增加而线性下降

(1) 只对活跃的描述符进行操作(select/poll 全部描述符遍历)

3. 使用mmap加速内核与用户空间的消息传递

(1) 共享内存的方式，避免用户空间和内核空间拷贝的消耗

3 ET和LT模式

LT（level triggered）是缺省的工作方式，并且同时支持block和no-block socket.在这种做法中，内核告诉你一个文件描述符是否就绪了，然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作，内核还是会继续通知你的，所以，这种模式编程出错误可能性要小一点。传统的select/poll都是这种模型的代表。

ET （edge-triggered）是高速工作方式，只支持non-block socket。在这种模式下，当描述符从未就绪变为就绪时，内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪，并且不会再为那个文件描述符发送更多的就绪通知，直到你做了某些操作导致那个文件描述符不再为就绪状态了（比如，你在发送，接收或者接收请求，或者发送接收的数据少于一定量时导致了一个EWOULDBLOCK 错误）。但是请注意，如果一直不对这个fd作IO操作（从而导致它再次变成未就绪），内核不会发送更多的通知（only once），不过在TCP协议中，ET模式的加速效用仍需要更多的benchmark确认。

4. ET和LT的优缺点

1. ET只触发一次，如果数据一次未读完，需程序循环读取数据，效率好，出错的可能性大

2. LT 只要有数据就一直触发，直到数据处理完成，效率比ET差，出错的可性性小

总结：如果系统

5. 头文件代码

//头文件路径:/usr/include/sys/epoll.h
#include <sys/epoll.h>
enum EPOLL_EVENTS
{
    EPOLLIN = 0x001,
    EPOLLPRI = 0x002,
    EPOLLOUT = 0X004,
    EPOLLRDNORM = 0x040,
    EPOLLRDBAND = 0x080,
    EPOLLWRNORM = 0x100,
    EPOLLWRBAND = 0x200,
    EPOLLMSG = 0x400,
    EPOLLERR = 0x008,
    EPOLLHUP = 0x010,
    EPOLLRDHUP = 0x2000,
    EPOLLWAKEUP = 1u << 29,
    EPOLLONESHOT = 1u << 30,
    EPOLLET = 1u << 31,
};
#define EPOLL_CTL_ADD 1
#define EPOLL_CTL_DEL 2
#define EPOLL_CTL_MOD 3

typedef union epoll_data
{
    void *ptr;
    int fd;
    uint32_t u32;
    uint64_t u64;
} epoll_data_t;

struct epoll_event
{
    uint32_t events;
    epoll_data_t data;
} __EPOLL_PACKED;

// 创建一个epoll文件描述符
// size是内核保证能够正确处理的最大句柄数，多于这个数内核不保证效果。
int epoll_create(int __size);
int epoll_create1(int __flags);

// 添加/修改/删除需要侦听的文件描述符及其事件
// 每次添加/修改/删除被侦听的文件描述符都需调epoll_ctl,
// 所以尽量少调epoll_ctl,防止其所引来的开销
// 如应用中大量短连接（web服务器),频繁调用，可以成为系统瓶颈
int epoll_ctl(int __epfd, int __op, int __fd,struct epoll_event *_event);

// 接收发生在被侦听的描述符上的用户感兴趣的IO事件
int epoll_wait(int __epfd, struct epoll_event *events,int __maxevents, int __timeout);
int epoll_pwait(int __epfd, struct epoll_event *events,int __maxevents, int __timeout);