I/O多路转接之epoll

本文介绍epoll的工作原理及其三种核心系统调用:epoll_create、epoll_ctl与epoll_wait。epoll是一种高效的I/O多路复用技术,能够显著提高处理大量文件描述符的能力。文章还提供了一个简单的epoll服务器实现示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

所谓epoll 就是为处理大批量句柄⽽而作了改进的poll。

epoll只有epoll_create,epoll_ctl,epoll_wait 3个系统调用。
1、int epoll_create(int size);
创建⼀一个epoll的句柄。当创建好epoll句柄后,它就是会占用一个fd值,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
2、int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。
第一个参数是epoll_create()的返回值。
第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD:注册新的fd到epfd中;
EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:从epfd中删除一个fd;
第三个参数是需要监听的fd。
第四个参数是告诉内核需要监听什么事,struct epoll_event结构如下:
这里写图片描述

events可以是以下几个宏的集合:
EPOLLIN :表示对应的⽂文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(LevelTriggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列⾥

3、int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
收集在epoll监控的事件中已经发送的事件。参数events是分配好的epoll_event结构体数组,epoll将会把发生的事件赋值到events数组中(events不可以是空指针,内核只负责把数据复制到这个events数组中,不会去帮助我们在用户态中分配内存)。maxevents告之内核这个
events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会⽴立即返回,-1将不确定,也有说法说是永久阻塞)。如果函数调用成功,返回对应I/O上已准备好的文件描述符数⽬目,如返回0表示已超时。

epoll工作原理
epoll同样只告知那些就绪的文件描述符,而且当我们调用epoll_wait()获得就绪文件描述符时,返回的不是实际的描述符,而是一个代表就绪描述符数量的值,你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可,这里也使用了内存映射(mmap)技术,这样便彻底省掉了这些文件描述符在系统调用时复制的开销。

Epoll的2种工作方式-水平触发(LT)和边缘触发(ET)

epoll在底层实现了自己的高速缓存区,并且建立了一个红黑树用于存放socket,另外维护了一个链表用来存放准备就绪的事件。

epoll的优点:
1、支持一个进程打开大数目的socket描述符(FD)
2、IO效率不随FD数目增加而线性下降
3、使用mmap加速内核与用户空间的消息传递

epoll编写服务器
源代码:

#include<stdio.h>
#include<sys/epoll.h>
#include<sys/socket.h>
#include<sys/types.h>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<string.h>
#include<stdlib.h>
static void use(char* proc)
{
    printf("use:%s [local_ip][local_port]",proc);
}
typedef struct fd_buf
{
    int fd;
    char buf[10240];
}fd_buf_t,*fd_buf_p;
static void* alloc_fd_buf(int fd)
{
    fd_buf_p tmp = (fd_buf_p)malloc(sizeof(fd_buf_t));
    if(!tmp)
    {
        perror("mlloc");
        return NULL;
    }
    tmp->fd = fd;
    return tmp;
}
int startup(const char* ip,int port)
{
    int sock = socket(AF_INET,SOCK_STREAM,0);
    if(sock<0)
    {
        perror("socket");
        return 2;
    }
    int opt = 1;
    setsockopt(sock,SOL_SOCKET,SO_REUSEADDR,&opt,sizeof(opt));
    struct sockaddr_in local;
    local.sin_family = AF_INET;
    local.sin_port = htons(port);
    local.sin_addr.s_addr = inet_addr(ip);
    if(bind(sock,(struct sockaddr*)&local,sizeof(local))<0)
    {
        perror("bind");
        return 3;
    }
    if(listen(sock,10)<0)
    {
        perror("listen");
        return 4;
    }
    return sock;
}
int main(int argc,char* argv[])
{
    if(argc!=3)
    {
        use(argv[0]);
        return 1;
    }
    int listen_sock = startup(argv[1],atoi(argv[2]));
    int epollfd = epoll_create(256);
    if(epollfd<0)
    {
        perror("epoll_create");
        close(listen_sock);
        return 5;
    }
    struct epoll_event ev;
    ev.events = EPOLLIN;
    ev.data.ptr = alloc_fd_buf(listen_sock);
    epoll_ctl(epollfd,EPOLL_CTL_ADD,listen_sock,&ev);
    int nums = 0;
    struct epoll_event evs[64];
    int timeout = 5;
    while(1)
    {
        switch((nums=epoll_wait(epollfd,evs,64,timeout)))
        {
            case -1:
                perror("epoll_wait");
                break;
            case 0:
                printf("timeout...\n");
                break;
            default:
                {
                    int i = 0;
                    for(;i<nums;i++)
                    {
                        fd_buf_p fp = (fd_buf_p)evs[i].data.ptr;
                        if(fp->fd==listen_sock&&\
                                (evs[i].events&EPOLLIN))
                        {
                            struct sockaddr_in client;
                            socklen_t len = sizeof(client);
                            int new_sock = accept(listen_sock,\
                                    (struct sockaddr*)&client,&len);
                            if(new_sock<0)
                            {
                                perror("accept");
                                continue;
                            }
                            printf("get a new client!\n");
                            ev.events = EPOLLIN;
                            ev.data.ptr = alloc_fd_buf(new_sock);
                            epoll_ctl(epollfd,EPOLL_CTL_ADD,new_sock,&ev);
                        }//if
                        else if(fp->fd!=listen_sock)
                        {
                            if(evs[i].events&EPOLLIN)
                            {
                                ssize_t s = read(fp->fd,fp->buf,\
                                        sizeof(fp->buf));
                                if(s>0)
                                {
                                    fp->buf[s]=0;
                                    printf("client say#%s:",fp->buf);
                                    ev.events = EPOLLOUT;
                                    ev.data.ptr = fp;
                                    epoll_ctl(epollfd,EPOLL_CTL_MOD,\
                                            fp->fd,NULL);
                                    free(fp);
                                }
                                else{}
                            }
                            else if(evs[i].events&EPOLLOUT)
                            {
                                const char* msg = "HTTP/1.0 200 0k\r\n\r\n<html><h1>hello word</h1></html>";
                                write(fp->fd,msg,strlen(msg));
                                close(fp->fd);
                            epoll_ctl(epollfd,EPOLL_CTL_DEL,fp->fd,NULL);
                            free(fp);
                            }
                            else{}
                        }
                        else{}
                    }//for
                }
                break;
        }
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值