c++的IO复用select/poll/epoll
文章目录
前言
在网络服务器中,有着高并发的应用场景。面对数十万乃至上百万的socket连接需求,使用多线程模式如Per-connection-Per-thread,每个线程会开(Linux)8M的栈空间,再TCP长连接的情况下,2000/分钟的请求,假定有20000个连接,则需要20000*8M=160G的内存空间,在这样的场景下,IO多路 复用 select/poll/epoll就能较好的解决问题。 select/poll/epoll是可以先批量 关注socket 描述符,阻塞等待,等有内核中有相应的 数据到来,再通知应用服务器 去对相应的socket进行读写操作。
与多过程和多线程技术相比,I/O多路复用技术的最大优势是开销小,不用创建线程,也不用保护这些线程,从而大大减小了的开销。
I/O多路复用就是通过一种机制,一个过程能够监督多个描述符,一旦任意一个描述符就绪,可能告诉程序进行相应的读写操作。但select,pselect,poll,epoll实质上都是同步I/O,因为他们都须要在读写事件就绪后本人负责进行读写,也就是说这个读写过程是阻塞的
一、多种IO模式
对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。所以说,当一个read操作发生时,它会经历两个阶段:1. 等待数据准备 (Waiting for the data to be ready)2. 将数据从内核拷贝到进程中 (Copying the data from the kernel to the process)
linux五种网络模式
- 阻塞 I/O(blocking IO) -------read、write、默认socket
- 非阻塞 I/O(nonblocking IO) --------设置socket
- I/O 多路复用( IO multiplexing)--------- select、poll、epoll
- 信号驱动 I/O( signal driven IO)
- 异步 I/O(asynchronous IO)
二、I/O 多路复用之select、poll、epoll详解
2.1 select
int select(int nfds,fd_set *readfds,fd_set *writefds,fd_set *exceptfds,struct timeval *timeout);
select 函数监视的文件描述符指针分3类,分别是*writefds、readfds、和exceptfds,指向的都是描述符集(位图)。调用后select函数会阻塞,直到有描述符就绪(有数据 可读、可写、或者有except),或者超时(timeout指定等待时间,如果立即返回设为null即可),函数返回。当select函数返回后,可以 通过遍历fdset,来找到就绪的描述符。
对socket进行扫描时是线性扫描,即采纳轮询的办法,效率较低。
每次调用select前都要重新初始化描述符集(位图),将fd_set从用户态拷贝到内核态,每次调用select后,都需要将fd_set从内核态拷贝到用户态;
select其良好跨平台支持也是它的一个优点。select的一 个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,fd_set是位图,在Linux上64位一般为