select 和 epoll的区别总结

目前的网络模型大都是epoll的,因为epoll模型会比select模型性能高很多, 尤其在大连接数的情况下,作为后台开发人员需要理解其中的原因。 
select/epoll的特点
select的特点: select 选择句柄的时候,是遍历所有句柄,也就是说句柄有事件响应时,select需要遍历所有句柄才能获取到哪些句柄有事件通知,因此效率是非常低。但是如果连接很少的情况下, select和epoll相比, 性能上差别不大。 
这里要多说一句,select支持的句柄数是有限制的, 同时只支持1024个,这个是句柄集合限制的,如果超过这个限制,很可能导致溢出,而且非常不容易发现问题, 当然可以通过修改linux的socket内核调整这个参数。 
epoll的特点: epoll对于句柄事件的选择不是遍历的,是内核事件响应的,就是句柄上事件来就马上选择出来,不需要遍历整个句柄链表,因此效率非常高,内核将句柄用红黑树保存的。
对于epoll而言还有ET和LT的区别,LT表示水平触发,ET表示边缘触发,两者在性能以及代码实现上也是有差别的。 
epoll的LT和ET的区别
LT:水平触发, 效率会低于ET触发,尤其在大并发,大流量的情况下。但是LT对代码编写要求比较低,不容易出现问题。LT模式服务编写上的表现是:只有数据没有被获取,内核就不断通知你,因此不用担心事件丢失的情况。 
ET:边缘触发, 效率非常高,在并发,大流量的情况下,会比LT少很多epoll的系统调用,因此效率高。但是对编程要求高,需要细致的处理每个请求,否则容易发生丢失事件的情况。 
下面举一个列子来说明LT和ET的区别(都是非阻塞模式,阻塞就不说了,效率太低): 
采用LT模式下, 如果accept调用有返回就可以马上建立当前这个连接了,再epoll_wait等待下次通知,和select一样。 
但是对于ET而言,如果accpet调用有返回,除了建立当前这个连接外,不能马上就epoll_wait还需要继续循环accpet,直到返回-1,且errno==EAGAIN,示例代码: 
      if(ev.events & EPOLLIN) 
      { 
          do 
          { 
               struct sockaddr_in stSockAddr; 
               socklen_t iSockAddrSize = sizeof(sockaddr_in); 
                MySocket cs; 
                cs.setOwner(false); 
                //接收连接 
                MySocket s; 
                s.init(fd, false, AF_INET); 
                int iRetCode = s.accept(cs, (struct sockaddr *) &stSockAddr, iSockAddrSize); 
                if (iRetCode > 0) 
                { 
                        ...建立连接 
                } 
                else 
                {     
                    //直到发生EAGAIN才不继续accept 
                    if(errno == EAGAIN) 
                    { 
                            break; 
                    } 
                } 
             }while(true); 
       } 

同样,recv/send等函数, 都需要到errno==EAGAIN 


从本质上讲:与LT相比,ET模型是通过减少系统调用来达到提高并行效率的。

epoll ET详解
ET模型的逻辑:内核的读buffer有内核态主动变化时,内核会通知你, 无需再去mod。写事件是给用户使用的,最开始add之后,内核都不会通知你了,你可以强制写数据(直到EAGAIN或者实际字节数小于 需要写的字节数),当然你可以主动mod OUT,此时如果句柄可以写了(send buffer有空间),内核就通知你。 
这里内核态主动的意思是:内核从网络接收了数据放入了读buffer(会通知用户IN事件,即用户可以recv数据) 
并且这种通知只会通知一次,如果这次处理(recv)没有到刚才说的两种情况(EAGIN或者实际字节数小于 需要读写的字节数),则该事件会被丢弃,直到下次buffer发生变化。 
与LT的差别就在这里体现,LT在这种情况下,事件不会丢弃,而是只要读buffer里面有数据可以让用户读,则不断的通知你。  

另外对于ET而言,当然也不一定非send/recv到前面所述的结束条件才结束,用户可以自己随时控制,即用户可以在自己认为合适的时候去设置IN和OUT事件: 
1 如果用户主动epoll_mod OUT事件,此时只要该句柄可以发送数据(发送buffer不满),则epoll 
_wait就会响应(有时候采用该机制通知epoll_wai醒过来)。 
2 如果用户主动epoll_mod IN事件,只要该句柄还有数据可以读,则epoll_wait会响应。 
这种逻辑在普通的服务里面都不需要,可能在某些特殊的情况需要。  但是请注意,如果每次调用的时候都去epoll mod将显著降低效率,已经吃过几次亏了!

因此采用et写服务框架的时候,最简单的处理就是: 
建立连接的时候epoll_add IN和OUT事件, 后面就不需要管了 
每次read/write的时候,到两种情况下结束: 
1 发生EAGAIN 
2 read/write的实际字节数小于 需要读写的字节数 
对于第二点需要注意两点: 
A:如果是UDP服务,处理就不完全是这样,必须要recv到发生EAGAIN为止,否则就丢失事件了 
因为UDP和TCP不同,是有边界的,每次接收一定是一个完整的UDP包,当然recv的buffer需要至少大于一个UDP包的大小 
随便再说一下,一个UDP包到底应该多大? 
对于internet,由于MTU的限制,UDP包的大小不要超过576个字节,否则容易被分包,对于比较好IDC内网环境,建议也不要超过1472,否则也比较容易分包。 

B 如果发送方发送完数据以后,就close连接,这个时候如果recv到数据是实际字节数小于读写字节数,根据开始所述就认为到EAGIN了从而直接返回,等待下一次事件,这样是有问题的,close事件丢失了! 
因此如果依赖这种关闭逻辑的服务,必须接收数据到EAGIN为止。
### 回答1: select、pollepoll都是用来处理多路复用IO的方法。 - select: 是最早出现的多路复用IO方泏,它能同时处理多个文件描述符,但是它存在最大文件描述符数量每次调用时间复杂度的限制。 - poll: 与select相比,它能同时处理更多的文件描述符,并且每次调用的时间复杂度也更低。 - epoll: 是Linux下特有的多路复用IO方法,它的性能比selectpoll更优,能同时处理更多的文件描述符。 总结来说,epoll相比selectpoll性能更优,能处理更多的文件描述符。 ### 回答2: select、pollepoll都是Linux中用来实现I/O多路复用的函数。I/O多路复用的主要作用是实现在一个进程中同时监听多个文件描述符的可读、可写异常事件,以减少进程的系统调用数量,提高程序的并发性能。 select是最早出现的I/O多路复用函数,其调用方式比较简单,只需要用一个fd_set集合存储要监听的文件描述符,然后调用select函数。但是select有一些缺点,因为它使用位图来存储文件描述符,当监听的文件描述符数量增加时,位图的大小也会增加,导致性能下降。 poll是一种改进的I/O多路复用函数,它使用一个pollfd结构来存储文件描述事件,并在同一个结构体数组中存储所有需要监听的文件描述符,这样的话,无论监听的文件描述符数量增加,只需要重新分配一个更大的数组即可,可以提高性能。 epoll是Linux中最新、最高效的I/O多路复用函数,它使用事件驱动模型实现,可以处理大量的文件描述符。epoll用一个epoll_create函数创建一个epoll文件描述符,然后使用epoll_ctl函数向内核注册需要监听的文件描述事件类型,最后使用epoll_wait函数等待文件描述符上的事件。epoll最大的优点是可以支持水平触发边缘触发两种模式,水平触发模式只要有数据可读或可写就会返回一个事件,而边缘触发模式只有当描述符上数据有变化时才会返回一个事件。 综上所述,select、pollepoll都是Linux中用来实现I/O多路复用的函数,它们的主要区别在于使用的数据结构不同,以及性能方面的优化不同。epoll是最高效的I/O多路复用函数,性能比selectpoll要高,并且支持水平触发边缘触发两种模式。 ### 回答3: select、poll、epoll均是Linux下常见的网络编程I/O多路复用技术。这些技术的核心是将多个I/O操作以非阻塞的方式同时处理,从而提高程序的性能。虽然三者都实现了I/O多路复用,但是实现方式却有所区别select是最古老的I/O多路复用技术,在大多数操作系统上都有实现。它的操作过程是:将要监视的文件描述符(包括输入输出)分别存入一个数组中,并调用select函数开始监听,在有文件描述符就绪(有数据可读或者数据可写)的时候,返回一个事件的集合,可以通过遍历fd_set来得到哪些文件可以读/写。缺点是select函数的时间复杂度是O(n),随着监视的文件描述符数量增加,时间复杂度会越来越高,同时select也有FD_SETSIZE的限制(默认是1024)。 poll是在select的基础上进行了改进,可以监视的文件描述符数目不受限制。与select相同的是,都需要调用轮询函数来等待事件,当某个文件描述符就绪时,内核会将就绪的文件存在一个链表中并返回给应用程序。每次都需要遍历整个被监视的描述符集合,找到哪些描述符有数据可读,效率也不是非常理想。 而epoll是为了解决selectpoll的效率低下、不易扩展的问题而设计的,它利用了操作系统内核的支持,并支持边缘触发水平触发两种工作模式。epoll会将每个文件描述符对应的文件表项都放在一个红黑树中,然后在树中搜索已经就绪的文件来获取就绪的文件列表。与selectpoll的轮询方式不同,epoll是基于事件驱动方式的,当注册的文件描述符已经准备好时,内核会通过事件通知方式来通知应用程序。相比之前的两种方法,epoll的效率更高,也更容易扩展。但是它的实现比较复杂,需要大量调用系统API函数。 总之,select、poll、epoll这三种I/O多路复用方式各有优点缺点,不同场景选择不同的方式来处理I/O更加合适。在所监视的文件描述符数量较少时,select、poll比较合适;而对于应用程序并发性能要求较高的,epoll方式可以获得更好的性能表现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值