如何理解select、poll、epoll?

学编程的荔枝壳

已于 2025-01-12 21:15:37 修改

阅读量972

点赞数 7

分类专栏：操作系统文章标签：开发语言

于 2025-01-12 21:09:04 首次发布

本文链接：https://blog.youkuaiyun.com/qq_44062110/article/details/145099512

版权

操作系统专栏收录该内容

4 篇文章

订阅专栏

select、poll 和 epoll 都是操作系统提供的 I/O 多路复用机制，主要用于解决单个线程处理多个 I/O 操作的问题。它们的主要作用是帮助应用程序同时监听多个文件描述符（例如网络 socket、文件等）是否可读、可写或发生异常，从而避免每个文件描述符都需要一个线程来处理，极大提高了程序的并发性和资源利用效率。

1. select

select 是最早期的 I/O 多路复用机制，广泛用于网络编程中。它允许一个程序同时监控多个文件描述符，等待其中的一个或多个准备好进行 I/O 操作。select 的工作原理是，程序提供一个文件描述符集合，并指定每个文件描述符的监控事件（读、写、异常）。然后，select 系统调用会阻塞，直到文件描述符集合中的至少一个描述符满足条件。

特点：

阻塞方式：调用 select 后，程序会阻塞，直到文件描述符上有事件发生（例如数据可读、可写等）。
轮询机制：select 会遍历所有文件描述符并检查它们的状态。这使得它的性能在处理大量文件描述符时较差，尤其是当文件描述符数量很大时。
文件描述符数量有限制：select 的实现一般会限制可监控的文件描述符数量（通常为 1024），虽然可以通过编译时调整这个限制，但不如其他方法灵活。

适用场景：

适用于文件描述符数量较小或者中等规模的场景，不适用于大量并发连接的高性能网络服务。

示例代码：

fd_set readfds;
FD_ZERO(&readfds);
FD_SET(sock_fd, &readfds);

struct timeval timeout;
timeout.tv_sec = 5;
timeout.tv_usec = 0;

int ret = select(sock_fd + 1, &readfds, NULL, NULL, &timeout);
if (ret > 0) {
    if (FD_ISSET(sock_fd, &readfds)) {
        // Socket ready for reading
    }
} else if (ret == 0) {
    // Timeout occurred
} else {
    // Error occurred
}

2. poll

poll 是 select 的增强版，解决了 select 的一些缺陷，尤其是在文件描述符数量上限的问题。poll 不再使用固定的文件描述符集合大小限制，而是通过一个数组来描述待监控的文件描述符列表，支持动态增删文件描述符。

特点：

没有文件描述符数量限制：poll 通过数组实现，可以动态扩展，因此可以监控更多的文件描述符。
性能改进：虽然 poll 不再有 select 的文件描述符数量限制，但它仍然采用轮询的方式检查文件描述符的状态，这意味着它的性能在文件描述符非常多时，仍然会遇到瓶颈。
返回文件描述符的事件：poll 会返回哪些文件描述符发生了事件，而不是直接修改文件描述符集，应用程序可以根据返回的事件列表进行处理。

适用场景：

poll 适用于文件描述符数量中等的应用，它解决了 select 的一些局限性，但在大量文件描述符的情况下，性能仍然较差。

示例代码：

struct pollfd fds[1];
fds[0].fd = sock_fd;
fds[0].events = POLLIN;

int ret = poll(fds, 1, 5000); // Timeout of 5 seconds
if (ret > 0) {
    if (fds[0].revents & POLLIN) {
        // Socket ready for reading
    }
} else if (ret == 0) {
    // Timeout occurred
} else {
    // Error occurred
}

3. epoll

epoll 是 Linux 系统中的一种 I/O 多路复用机制，相比 select 和 poll，epoll 具有更高的性能，尤其是在处理大量文件描述符时。epoll 的设计采用了事件驱动机制，解决了 select 和 poll 在文件描述符数量多时性能瓶颈的问题。

特点：

事件驱动：epoll 使用事件驱动的方式，当文件描述符准备好进行 I/O 操作时，内核会通知用户空间，而不是通过轮询的方式检查每个文件描述符的状态。
高性能：epoll 使用的是基于内核的事件通知机制，因此其性能在处理大量并发连接时非常高。epoll 只会通知哪些文件描述符发生了事件，而不是检查所有文件描述符。
内存效率：epoll 采用基于回调机制的事件通知方式，减少了内存的使用，避免了频繁地传递大量数据。
支持边缘触发（Edge-Triggered）和水平触发（Level-Triggered）：epoll 提供了两种触发模式：
- 水平触发（LT）：默认模式，类似于 select 和 poll，即只要文件描述符没有被处理完，就会反复通知。
- 边缘触发（ET）：当文件描述符状态改变时，只会通知一次，之后如果文件描述符仍有数据可读或可写，必须通过非阻塞 I/O 方式主动查询。

适用场景：

epoll 适用于高并发、大规模 I/O 操作的应用，如高性能的网络服务器、数据库等。

示例代码：

// 创建 epoll 实例
int epoll_fd = epoll_create1(0);
struct epoll_event event;
event.events = EPOLLIN; // 监听读事件
event.data.fd = sock_fd;
epoll_ctl(epoll_fd, EPOLL_CTL_ADD, sock_fd, &event);

// 等待事件发生
struct epoll_event events[10];
int nfds = epoll_wait(epoll_fd, events, 10, 5000); // Timeout of 5 seconds
for (int i = 0; i < nfds; i++) {
    if (events[i].events & EPOLLIN) {
        // Socket ready for reading
    }
}

总结对比：

特性	`select`	`poll`	`epoll`
事件通知机制	轮询方式	轮询方式	事件驱动方式
文件描述符限制	有限制（通常为 1024）	没有固定限制	没有固定限制
性能	文件描述符数量较小时较好	适中，但仍有性能瓶颈	高效，适合大量并发连接
适用场景	文件描述符较少的简单应用	中等规模的应用	高并发网络服务、大规模 I/O
触发方式	无法控制	无法控制	支持边缘触发和水平触发
内存使用	高（需要复制文件描述符集）	高（需要复制文件描述符集）	低（只需传递事件信息）