文章目录
应用场景
- 客户端需要处理多个socket,比如非阻塞connect
- 客户端需要同时处理用户输入和网络连接,比如聊天室
- 服务器需要同时监听socket和连接socket
- 服务器需要同时处理tcp和udp请求
- 服务器需要同时监听多个端口或者处理多种服务,如xinetd服务器
Note:IO复用虽然可以监听多个fd(文件描述符),但是他是阻塞的。并且当多个fd同时就绪时,不采取额外措施下,程序只能按次依次处理每个fd,使得程序看起来是串行工作。只能通过多线程多进程编程实现并发。
三种api的对比
对比三种api,最好看了下面三段再看这里
#include<sys/select.h>
int select(int nfds, fd_set* readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout);
int poll(struct pollfd* fds, nfds_t nfds, int timeout);
int epoll_create(int size);
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
从事件集、最大支持文件描述符数、工作模式和具体实现来比较。
事件集
select的fd_set
没有将文件描述符与事件绑定,仅仅是文件描述符的集合,通过宏FD_SET
将fd与fd_set绑定,因此select需要三个参数来分别传入和输出可读、可写和异常事件。因此其能处理的事件类型有限,此外,由于内核对fd_set集合会进行修改,因此再次调用select时需要重置fd_set。索引就绪文件描述符的时间复杂度是O(n)
,因为需要遍历整个事件集来确认就绪事件。
poll将文件描述符和事件都定义在类型为pollfd
的参数fds中,
通过设置fds的events成员来注册监听事件,内核修改revents成员来返回就绪情况。因此下次调用时无需重置事件集参数。与select相同,索引就绪文件描述符的时间复杂度是O(n)
。
epoll通过维护一个事件表,并且通过epoll_cntl()
来添加、删除、修改事件。而epoll_wait
将从内核中直接获得所有就绪事件,使得应用程序索引就绪文件的时间复杂度为O(1)
。
支持的最大文件描述符
select的最大文件描述符数量是宏定义#define __FD_SETSIZE 1024
,贸然修改可能有未知后果
poll和epoll分别用nfds和maxevents参数指定最多监听的文件描述符和事件, 这两个可以达到系统允许的最大打开文件描述符数量
2
16
=
65535
2^{16} = 65535
216=65535个(cat/proc/sys/fs/filemax
)。
工作模式
select和poll只能工作在LT模式,epoll支持ET模式,并且支持EPOLLONESHOT事件。
实现原理
select和poll都是基于轮询的,内核修改文件描述符集合后返回,每次调用都会扫描所有的文件描述符集合,并处理就绪事件。epoll则采取回调模式,回调函数将文件描述符上的事件插入到内核的就绪事件队列。内核在适当的时机将队列的内容拷贝到用户空间,所以epoll_wait无需轮询整个文件描述符集合。
但是当活动连接比较多时,epoll_wait
的效率未必高于其他两种类型,因为回调函数会频繁触发,所以epoll
适用于连接次数多,且活动连接少的情况。
select
select API
#include<sys/select.h>
int select(int nfds, fd_set* readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout);
nfds指定被监听的文件描述符的总数,它通常被设为fd中的最大值加1,因为fd是从0开始计数的。
fd_set的结构体
fd_set的结构体仅包含一个整型数组,该数组的每一位标记一个文件描述符,其能标记的最大文件描述符数量由FD_SETSIZE指定。
参数timeout可以指定阻塞行为。指向NULL会一直阻塞。可以指向timeval的结构体。如果timeval的两个域都是0,则不会阻塞,会轮询文件描述符集合,有可用的会立刻返回。否则会设置一个等待时间上限。
struct timeval{
long tv_sec; // 秒数
long tv_usec; // 微秒
}
timeout传递一个结构指针,内核通过修改指针返回值来告知应用程序select等待了多久。但是这个返回值不一定完全可信,调用失败时值是不确定的。
文件描述符就绪条件
例子,接受普通和带外数据
const int BUF_SIZE = 1024;
int main() {
const char* ip = "";
int port = 19981;
struct sockaddr_in address;
bzero(&address, sizeof(address));
address.sin_family = AF_INET;
address.sin_port = htons(port);
address.sin_addr.s_addr = htonl(INADDR_ANY);
int sock = socket(AF_INET, SOCK_STREAM, 0);
assert(sock > 0);
int ret = bind(sock, (sockaddr*)(&address), sizeof(address));
perror("bind");
assert(ret != -1);
ret = listen(sock, 5);
perror("bind");
assert(ret != -1);
sockaddr_in client;
socklen_t client_len = sizeof(client);
printf("Start accept\n");
int connfd = accept(sock, (sockaddr*)(&client), &client_len);
printf("Accepted\n");
if (connfd < 0) {
std::cout << "error " << errno << std::endl;
}
char buf[BUF_SIZE];
fd_set read_fds;
fd_set except_fds;
FD_ZERO(&read_fds);
FD_ZERO(&except_fds);
while (true) {
memset(&buf, '\0', sizeof(buf));
FD_SET(connfd, &read_fds);
FD_SET(connfd, &except_fds);
printf("do select\n");
ret = select(connfd + 1, &read_fds, NULL, &except_fds, NULL);
if (ret < 0) {
printf("select failure\n");
break;
}
if (FD_ISSET(connfd, &read_fds)) {
ret = recv(connfd, buf, sizeof(buf) - 1, MSG_OOB);
if (ret <= 0) break;
printf("get %d bytes of obb data: %s\n", ret, buf);
}
}
close(connfd);
close(sock);
getchar();
return 0;
}
poll
poll在指定时间内轮询一定数量的文件描述符,以测试是否有就绪的文件描述符。
#include<poll.h>
int poll(struct pollfd* fds, nfds_t nfds, int timeout);
struct pollfd{
int fd;
short events; // 注册的事件
short revents; // 实际发生的事件,由内核填充
};
poll支持的事件类型
nfds指定被监听的事件集合fds的大小
typedef unsigned long int nfds_t;
timeout指定超时值,单位是毫秒。设置为-1表示poll将阻塞至事件发生,为0则立即返回。
epoll
内核事件表,创建和控制
epoll将关心的文件描述符上的事件注册到内核的事件表中,从而避免了select调用的频繁内核拷贝,但是epoll需要额外的文件描述符来标识内核中的事件表,使用epoll_create来创建。
#include<sys/epoll.h>
int epoll_create(int size);
size参数提示内核其需要的事件表需要多大,但并不起作用。该函数返回一个文件描述符,指定内核事件表。
#include<sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
struct epoll_event{
_uint32_t events;
epoll_data_t data;
};
typedef union epoll_data{
void *ptr;
int fd;
uint32_t u32;
uint64_t u64;
} epoll_data_t;
epfd指定事件表。
fd参数是要操作的文件描述符,op参数指定操作类型:
- EPOLL_CTL_ADD 往事件表注册fd上的事件
- EPOLL_CTL_MOD 修改fd上的注册事件
- EPOLL_CTL_DEL 删除fd上的注册事件
event 参数指定事件类型,事件类型与poll相似,在poll对应的宏前加E。
epoll_data_t是一个联合体,fd指定事件从属的目标文件描述符,ptr成员指定与fd相关的用户数。
epoll_ctl()
成功返回0,失败-1。
epoll_wait
它在一段超时时间内等待一组文件描述符上的事件,函数签名如下:
#include<sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
该函数成功则返回就绪的文件描述符个数,失败-1;
timeout参数与poll相同。
maxevents指定最多监听多少个事件,必须大于0;
epoll_wait如果监测到实际按,就将所有就绪事件从内核事件表中复制到events指向的数组中,这个数组只用于输出epoll_wait检测到的就绪事件,而非像前两个一样既传入用户注册事件又输出检测到的就绪事件。
example, poll和epoll索引就绪文件描述符
// poll
// 在返回后,会修改fds(type : pollfd)上的revents位,遍历fds检测revents位上的事件是否发生
int ret = poll(fds, MAX_EVENTS_NUMBER, -1);
for(int i = 0; i < MAX_EVENTS_NUMBER; i++{
if(fds[i].revents & POLLIN){
int sockfd = fds[i].fd;
// 处理
}
}
// epoll
// epoll_wait会返回就绪事件长度,并将事件放入events(type:epoll_event)数组中,遍历events数组即可获取事件
int re = epoll_wait(epfd, events, MAX_EVENTS_NUMBER, -1);
for(int i = 0; i < re; i++){
int sockfd = events[i].data.fd;
// 处理
}
LT和ET模式
LT(Level Trigger) 水平出发(默认)
ET(Edge Trigger) 边缘触发
对于LT模式,epoll_wait检测到事件后,程序可以不立即处理。此后每次调用epoll_wait都会再次通告此事件(置入epoll_event数组中),直到该事件被处理。
ET模式,当epoll_wait检测到该事件后,程序必须立即处理该事件,因为后续的epoll_wait调用将不再通告该事件,因此ET模式减少了同一事件被重复触发的次数,提高了效率。
example,如何创建一个ET模式的epoll
int main(){
// ...
int listenfd = socket(AF_INET, SOCK_STREAM, 0);
// ...
epoll_event events[MAX_EVENT_NUMBER];
int epollfd = epoll_create(5);
addfd(epollfd, listenfd, true);
}
void addfd(int epollfd, int listenfd, bool et_mode){
epoll_event event;
event.data.fd = listenfd;
event.events = EPOLLIN;
// 默认是LT,如果是ET,则并上
if(er_mode){
event.events = event.events | EPOLLET;
}
// 修改内核事件表,添加该事件
epoll_ctl(epollfd, EPOLL_CTL_ADD, listenfd, &event);
setnonblocking(listenfd);
}
int setnonblocking(int fd){
int old_opt = fcntl(fd, F_GETFL);
int new_opt = old_opt | O_NONBLOCK;
fcntl(fd, F_SETFL, new_opt);
return old_opt;
}
使用ET模式的文件描述符应该是非阻塞的,如果是阻塞的,那么读写操作会因为没有后续事件而一直阻塞(饥饿状态)。