高级IO

阿赭ochre

已于 2025-03-02 11:00:01 修改

阅读量1k

点赞数 24

分类专栏：网络文章标签：服务器网络运维

于 2025-03-02 10:57:59 首次发布

本文链接：https://blog.youkuaiyun.com/2301_78731445/article/details/145907496

版权

网络专栏收录该内容

6 篇文章

订阅专栏

3.6select使用示例: 检测标准输入输出

4.5poll示例: 使用poll监控标准输入

5.4epoll的优点（和select对应）

5.5epoll的工作方式

5.5.1水平触发Level Triggered 工作模式

5.5.2边缘触发Edge Triggered工作模式

5.6对比LT和ET

5.7理解ET模式和非阻塞文件描述符

5.8epoll示例: epoll服务器(LT模式)

5.9epoll示例: epoll服务器(ET模式)

一、五种IO模型

阻塞IO: 在内核将数据准备好之前，系统调用会一直等待，所有的套接字，默认都是阻塞方式
非阻塞IO: 如果内核还未将数据准备好，系统调用仍然会直接返回，并且返回EWOULDBLOCK错误码，需要轮询，对CPU的消耗比较大
信号驱动IO: 内核将数据准备好的时候，使用SIGIO信号通知应用程序进行IO操作
IO多路转接: 虽然从流程图上看起来和阻塞IO类似，实际上最核心在于IO多路转接能够同时等待多个文件描述符的就绪状态
异步IO: 由内核在数据拷贝完成时，通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据）
任何IO过程中，都包含两个步骤，第一是等待，第二是拷贝，而且在实际的应用场景中，等待消耗的时间往往都远远高于拷贝的时间，让IO更高效，最核心的办法就是让等待的时间尽量少

二、高级IO的重要概念

2.1同步通信＆异步通信

同步通信：发出一个调用时，没有得到结果就一直等待不返回，只有得到结果了调用才会有返回，才有返回值，也就是说是调用者主动等待的一个结果
异步通信：调用在发出之后，这个调用就直接返回了，所以没有返回结果，换句话说，当一个异步过程调用发出后，调用者不会立刻得到结果，而是在调用发出后，被调用者通过状态、通知来通知调用者，或通过回调函数处理这个调用
同步与互斥：同步是指在多线程或者多进程的场景下，各个进程或者线程按照一定的工作次序等待某种资源的就绪，比如访问临界资源
要注意区分同步通信和同步互斥之间的关系

2.2阻塞&非阻塞

阻塞调用：一个线程在调用返回之前，线程会被挂起，只有调用返回了线程才会返回
非阻塞调用：在调用结果未返回之前，不会将调用线程阻塞挂起

2.3非阻塞IO

一个文件描述符，默认都是阻塞IO

#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );

传入的cmd的值不同，后面追加的参数也不相同
fcntl函数有5种功能:

复制一个现有的描述符（cmd=F_DUPFD）
获得/设置文件描述符标记(cmd=F_GETFD或F_SETFD)
获得/设置文件状态标记(cmd=F_GETFL或F_SETFL)
获得/设置异步I/O所有权(cmd=F_GETOWN或F_SETOWN)
获得/设置记录锁(cmd=F_GETLK,F_SETLK或F_SETLKW)

轮询方式读取标准输入代码：复习非阻塞接口 · 680c3a1 · 阿赭/复习 - Gitee.com

三、IO多路转接之select

3.1初识select

select系统调用是用来让我们的程序监视多个文件描述符的状态变化的，程序会停在select这里等待，直到被监视的文件描述符有一个或多个发生了状态改变

3.2select函数原型

select的函数原型如下: #include <sys/select.h>

int select(int nfds, fd_set *readfds, fd_set *writtefds, fd_set *exceptfds, struct timeval *timeout);

参数解释:

参数nfds是需要监视的最大的文件描述符值+1
rdset,wrset,exset分别对应于需要检测的可读文件描述符的集合，可写文件描述符的集合及异常文件描述符的集合
参数timeout为结构timeval，用来设置select()的等待时间

参数timeout取值：

NULL：则表示select（）没有timeout，select将一直被阻塞，直到某个文件描述符上发生了事件
0：仅检测描述符集合的状态，然后立即返回，并不等待外部事件的发生
特定的时间值：如果在指定的时间段里没有事件发生，select将超时返回

关于fd_set的结构：

其实这个结构就是一个整数数组，更严格的说, 是一个 "位图"，使用位图中对应的位来表示要监视的文件描述符，提供了一组操作fd_set的接口，来比较方便的操作位图

void FD_CLR(int fd, fd_set *set);      // 用来清除描述词组set中相关fd 的位
int  FD_ISSET(int fd, fd_set *set);    // 用来测试描述词组set中相关fd 的位是否为真
void FD_SET(int fd, fd_set *set);      // 用来设置描述词组set中相关fd的位
void FD_ZERO(fd_set *set);             // 用来清除描述词组set的全部位

关于timevalt结构：

timeval结构用于描述一段时间长度，如果在这个时间内，需要监视的描述符没有事件发生则函数返回，返回值为 0

函数返回值：

执行成功则返回文件描述词状态已改变的个数
如果返回0代表在描述词状态改变前已超过timeout时间，没有返回
当有错误发生时则返回-1，错误原因存于errno，此时参数readfds，writefds, exceptfds和timeout的值变成不可预测
错误值可能为： EBADF：文件描述词为无效的或该文件已关闭，EINTR：此调用被信号所中断，EINVAL：参数n 为负值，ENOMEM：核心内存不足

常见的程序片段：

fs_set readset；
FD_SET(fd,&readset);
select(fd+1,&readset,NULL,NULL,NULL);
if(FD_ISSET(fd,readset)){……}

3.3理解select的执行过程

执行fd_set set
FD_ZERO(&set)，则set用位表示是0000,0000
若fd＝5，执行FD_SET(fd,&set)，后set变为0001,0000(第5位置为1)
若再加入fd＝2，fd=1，则set变为0001,0011
执行 select(6,&set,0,0,0)阻塞等待
若fd=1，fd=2上都发生可读事件，则select返回，此时set变为 0000,0011
注意：没有事件发生的fd=5被清空

3.4 socket就绪条件

读就绪：

socket内核中，接收缓冲区中的字节数，大于等于低水位标记SO_RCVLOWAT，此时可以无阻塞的读该文件描述符，并且返回值大于0
socket TCP通信中，对端关闭连接，此时对该socket读则返回0
监听的socket上有新的连接请求
socket上有未处理的错误

写就绪：

socket内核中，发送缓冲区中的可用字节数(发送缓冲区的空闲位置大小)，大于等于低水位标记 SO_SNDLOWAT，此时可以无阻塞的写，并且返回值大于0
socket的写操作被关闭(close或者shutdown)，对一个写操作被关闭的socket进行写操作，会触发SIGPIPE 信号
socket使用非阻塞connect连接成功或失败之后
socket上有未读取的错误

异常就绪：

socket上收到带外数据，关于带外数据，和TCP紧急模式相关(回忆TCP协议头中, 有一个紧急指针的字段)

3.4select的特点

可监控的文件描述符个数取决与sizeof(fd_set)的值，这边服务器上sizeof(fd_set)＝512，每bit表示一个文件描述符，则我服务器上支持的最大文件描述符是512*8=4096
将fd加入select监控集的同时，还要再使用一个数据结构array保存放到select监控集中的fd
一是用于再select 返回后，array作为源数据和fd_set进行FD_ISSET判断
二是select返回后会把以前加入的但并无事件发生的fd清空，则每次开始select前都要重新从array取得fd逐一加入(FD_ZERO最先)，扫描array的同时取得fd最大值maxfd，用于select的第一个参数

3.5select的缺点

支持的文件描述符取决于fd_set的大小，有上限
每次都要手动设置fd_set，接口使用不方便
需要额外的一个数组来维护等待监控的fd
每次调用select的时候，需要把fd集合从用户态拷贝到内核态，需要一定的开销
每次调用select都需要在内核遍历所有的fd，用户也需要遍历额外的数组来找到最大的fd，这也都需要一定的开销

3.6select使用示例: 检测标准输入输出

复习select函数的使用 · 9c13ecc · 阿赭/复习 - Gitee.com

3.7使用 select 实现字典服务器

select实现服务器 · f22d860 · 阿赭/复习 - Gitee.com

四、IO多路转接之poll

4.1poll函数接口

#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
// pollfd结构
struct pollfd 
{
   int   fd;         /* file descriptor */
   short events;     /* requested events */
   short revents;    /* returned events */
 };

fds是一个poll函数监听的结构列表
每一个元素中，包含了三部分内容：文件描述符，监听的事件集合，返回的事件集合
nfds表示fds数组的长度
timeout表示poll函数的超时时间，单位是毫秒(ms)
events和revents的取值

返回结果：返回值小于0，表示出错；返回值等于0，表示poll函数等待超时；返回值大于0，表示poll由于监听的文件描述符就绪而返回

4.2socket就绪条件

同select

4.3poll的优点

使用一个pollfd的指针实现，不同与select使用三个位图来表示三个集合
pollfd结构包含了要监视的event和发生的event，不再使用select“参数-值”传递的方式，接口使用比 select更方便
poll并没有最大数量限制 (但是数量过大后性能也是会下降)

4.4poll的缺点

poll中监听的文件描述符数目增多时和select函数一样，poll返回后，需要轮询pollfd来获取就绪的描述符
每次调用poll都需要把大量的pollfd结构从用户态拷贝到内核中
同时连接的大量客户端在一时刻可能只有很少的处于就绪状态，因此随着监视的描述符数量的增长, 其效率也会线性下降

4.5poll示例: 使用poll监控标准输入

复习poll函数 · bb9f1bd · 阿赭/复习 - Gitee.com

五、I/O多路转接之epoll

5.1epoll初识

按照man手册的说法: 是为处理大批量句柄而作了改进的poll，它是在2.5.44内核中被引进的，它几乎具备了之前所说的一切优点，被公认为下性能最好的多路I/O就绪通知方法

5.2epoll的相关系统调用

epoll_create

int epoll_create(int size);
创建一个epoll的句柄，自从linux2.6.8之后，size参数是被忽略的，用完之后，必须调用close()关闭

epoll_ctl

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数，它不同于select()是在监听事件时告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型
第一个参数是epoll_create()的返回值(epoll的句柄)
第二个参数表示动作，用三个宏来表示
第三个参数是需要监听的fd
第四个参数是告诉内核需要监听什么事
第二个参数的取值:

EPOLL_CTL_ADD ：注册新的fd到epfd中
EPOLL_CTL_MOD ：修改已经注册的fd的监听事件
EPOLL_CTL_DEL ：从epfd中删除一个fd

struct epoll_event结构如下：
events可以是以下几个宏的集合：

EPOLLIN : 表示对应的文件描述符可以读 (包括对端SOCKET正常关闭)

EPOLLOUT : 表示对应的文件描述符可以写

EPOLLPRI : 表示对应的文件描述符有紧急的数据可读 (这里应该表示有带外数据到来); EPOLLERR : 表示对应的文件描述符发生错误

EPOLLHUP : 表示对应的文件描述符被挂断

EPOLLET : 将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的

EPOLLONESHOT：只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里.

epoll_wait

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
收集在epoll监控的事件中已经发送的事件
参数events是分配好的epoll_event结构体数组
epoll将会把发生的事件赋值到events数组中 (events不可以是空指针，内核只负责把数据复制到这个events数组中，不会去帮助我们在用户态中分配内存)
maxevents告之内核这个events有多大，这个 maxevents的值不能大于创建epoll_create()时的size
参数timeout是超时时间 (毫秒，0会立即返回，-1是永久阻塞)，如果函数调用成功，返回对应I/O上已准备好的文件描述符数目，如返回0表示已超时，返回小于0表示函数失败