Linux OS中,有几种常见的IO模型:
- 阻塞式IO
- 非阻塞式IO
- IO复用
- 异步IO
程序进行IO读/写操作通常包括几个阶段:
- 数据准备
- 数据更新
阻塞式IO:
程序发起Read IO请求,内核接受到系统调用并开始对磁盘进行读取数据到内核缓冲区,这一过程程序所在的线程是阻塞状态的。数据准备好,内核需要将数据复制到用户进程空间,复制过程也是阻塞状态。拷贝完毕后kernel返回结果,进程/线程切换到运行状态。
程序发起Write IO请求,内核接收到系统调用并开始从用户进程空间复制数据到内核缓冲区,这一过程线程是阻塞状态。数据准备好,内核需要将数据写入到磁盘中,写入过程也是阻塞状态。
非阻塞IO:
程序发起Read IO请求,数据若没有准备好,内核会立即返回-1,并开始读取磁盘数据,而线程不会阻塞,可以继续发送read请求,直到数据准备好。数据准备好,内核需要将数据复制到用户进程空间,复制过程是阻塞状态。拷贝完毕后kernel返回结果,进程/线程切换到运行状态。
程序发起Write IO请求,内核接收到系统调用并开始从用户进程空间复制数据到内核缓冲区,并立即返回-1,这一过程线程不会阻塞,可以继续发送write请求直到数据准备好。数据准备好,内核需要将数据写入到磁盘中,写入过程也是阻塞状态。
IO复用:
select/poll/epoll都是IO多路复用机制,可以同时监控多个描述符,当某个描述符就绪(读或写就绪),则立刻通知相应程序进行读或写操作。
当用户进程调用了select,整个进程就会被阻塞。同时内核会轮询查看所有select负责的文件描述符,当任何一个文件描述符中的数据准备好了,select就会返回。这个时候用户进程再发起IO请求,将数据从kernel拷贝到用户进程空间。
异步IO:
用户进程发起IO请求之后,线程继续往下执行。从内核的角度,当它收到一个aio_read之后,它会立刻返回,所以不会对用户进程产生阻塞。内核会等待数据准备完成,然后将数据拷贝到用户内存,拷贝完成后,kernel会给用户进程发送一个signal,告诉它read操作完成了。或者将数据复制到内核缓冲区,并写入到磁盘中。
以上,阻塞IO、非阻塞IO、IO复用是同步IO。