linux下epoll模型accept并发问题 ---ET下

最新推荐文章于 2024-10-12 22:54:45 发布

yand789

最新推荐文章于 2024-10-12 22:54:45 发布

阅读量574

点赞数

分类专栏： epoll

epoll 专栏收录该内容

1 篇文章

订阅专栏

文章详细介绍了在使用epoll网络模型处理多用户并发通信时遇到的异常问题，以及如何通过调整epoll工作模式和循环处理接受连接的方法来解决此问题，确保客户端和服务端能够正常通信。

沧龙

最近用c++实现了贝叶斯分类算法，做了个自动识别垃圾信息的小工具。工具中有个功能，通过绑定指定端口，和客户端通信。服务端使用的是epoll网络模型。在测试的时候发现，单用户的情况下客户端和服务器通信正常。但是在多用户并发的情况下，客户端和服务端通信不正常。此时，客户端能正常的链接，发送数据，但是一直卡在接收数据部分。如下图：

出现这种问题，是因为不正确的使用了epoll中的ET（edge-trigger）模式。代码如下：

`01`	`/**************************************************`

`02`	`函数名：acceptConn`

`03`	`功能：接受客户端的链接`

`04`	`参数：srvfd：监听SOCKET`

`05`	`***************************************************/`

`06`	`void` `acceptConn(int` `srvfd)`

07 {

`08`	`struct` `sockaddr_in` `sin;`

`09`	`socklen_t len =` `sizeof(struct` `sockaddr_in);`

`10`	`bzero(&sin, len);`

11

`12`	`int` `confd = accept(srvfd, (struct` `sockaddr*)&sin, &len);`

13

`14`	`if` `(confd < 0)`

15 {

`16`	`printf("%s: bad accept\n");`

17 return;

18 }else

19 {

`20`	`printf("Accept Connection: %d", confd);`

21 }

22

`23`	`setNonblocking(confd);`

24

`25`	`//将新建立的连接添加到EPOLL的监听中`

`26`	`struct` `epoll_event event;`

`27`	`event.data.fd = confd;`

`28`	`event.events =�0�2 EPOLLIN\|EPOLLET;`

`29`	`epoll_ctl(epollfd, EPOLL_CTL_ADD, confd, &event);`

30 }

注意倒数第二行：event.events = EPOLLIN|EPOLLET; 采用的是ET模式。下面我们来具体说下，问题出在那里。

在epoll中有两种模式：level-trigger模式，简称LT模式，和edge-trigger模式，简称ET模式。其中，LT是默认的工作模式。

这两种模式的工作方式有些不同。在level-trigger模式下只要某个socket处于readable/writable状态，无论什么时候进行epoll_wait都会返回该socket；而edge-trigger模式下只有某个socket从unreadable变为readable或从unwritable变为writable时，epoll_wait才会返回该socket。

在ET模式socket非阻塞的情况下（上面代码中就是这种情况），多个连接同时到达，服务器的TCP就绪队列瞬间积累多个就绪连接，由于是边缘触发模式，epoll只会通知一次，accept只处理一个连接，导致TCP就绪队列中剩下的连接都得不到处理。因此，就出现了上面所提及的问题。

解决办法是用while循环抱住accept调用，处理完TCP就绪队列中的所有连接后再退出循环。如何知道是否处理完就绪队列中的所有连接呢？accept返回-1并且errno设置为EAGAIN就表示所有连接都处理完。

修改后的代码如下：

`01`	`/**************************************************`

`02`	`函数名：acceptConn`

`03`	`功能：接受客户端的链接`

`04`	`参数：srvfd：监听SOCKET`

`05`	`***************************************************/`

`06`	`void` `acceptConn(int` `srvfd)`

07 {

`08`	`struct` `sockaddr_in` `sin;`

`09`	`socklen_t len =` `sizeof(struct` `sockaddr_in);`

`10`	`bzero(&sin, len);`

`11`	`int` `confd = 0;`

`12`	`while((confd = accept(srvfd, (struct` `sockaddr*)&sin, &len)) > 0) {`

13

`14`	`printf("Accept Connection: %d", confd);`

15

`16`	`setNonblocking(confd);`

17

`18`	`//将新建立的连接添加到EPOLL的监听中`

`19`	`struct` `epoll_event event;`

`20`	`event.data.fd = confd;`

`21`	`event.events =�0�2 EPOLLIN\|EPOLLET;`

`22`	`epoll_ctl(epollfd, EPOLL_CTL_ADD, confd, &event);`

23 }

`24`	`if` `(confd == -1) {`

`25`	`if` `(errno` `!= EAGAIN &&` `errno` `!= ECONNABORTED &&` `errno` `!= EPROTO &&` `errno` `!= EINTR){`

`26`	`printf("%s: bad accept\n");`

27 return;

28 }

29 }

30 }

同理，接收数据和发送数据时如果是ET模式，且非阻塞，也得用循环。

读：只要可读，就一直读，直到返回0，或者 errno = EAGAIN

写:只要可写，就一直写，直到数据发送完，或者 errno = EAGAIN

正确的读：

1 n = 0;

`2`	`while` `((nread = read(fd, buf + n, BUFSIZ-1)) > 0) {`

`3`	`n += nread;`

4 }

`5`	`if` `(nread == -1 &&` `errno` `!= EAGAIN) {`

`6`	`perror("read error");`

7 }

正确的写：

`01`	`int` `nwrite, data_size =` `strlen(buf);`

`02`	`n = data_size;`

`03`	`while` `(n > 0) {`

`04`	`nwrite = write(fd, buf + data_size - n, n);`

`05`	`if` `(nwrite < n) {`

`06`	`if` `(nwrite == -1 &&` `errno` `!= EAGAIN) {`

`07`	`perror("write error");`

08 }

09 break;

10 }

`11`	`n -= nwrite;`

12