IO的本质
IO = 等待 + 拷贝
- 要进行拷贝,必须先判断条件成立,等待就是等待数据就绪和条件成立
- 拷贝就是用户在进行读写操作时本质是把数据进行拷贝
高效的IO是在单位时间内,等待的比重越小,效率就越高。几乎所有的提高IO效率的策略,本质就是这个
五种IO模型
1.阻塞IO
阻塞IO是最常见的IO模型.
2.非阻塞IO
非阻塞IO: 如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回EWOULDBLOCK错误码
非阻塞IO往往需要程序员循环的方式反复尝试读写文件描述符, 这个过程称为轮询. 这对CPU来说是较大的浪费, 一般只有特定场景下才使用.
3.信号驱动IO
信号驱动IO: 内核将数据准备好的时候, 使用SIGIO信号通知应用程序进行IO操作
4.多路转接IO
多路转接(多路复用)是一种IO模型,它允许单个进程或线程同时监听多个文件描述符(如套接字、管道等)的状态变化,从而能够处理多个IO事件。
5.异步IO
异步IO: 由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据);也是一种允许程序在等待I/O操作完成的同时继续执行其他任务的编程技术。它的核心在于非阻塞I/O操作,即I/O请求不会阻塞程序的执行。
- 程序发起一个异步I/O请求,告诉操作系统需要执行某个I/O操作(如读取文件、发送网络请求等)。
- 请求发起后,程序不会等待操作完成,而是继续执行其他任务。操作系统将I/O请求放入队列,并开始处理该请求。
- 当I/O操作完成后,操作系统会通知程序,并可能通过回调函数或其他机制将结果返回给程序。
总结:
- 1~4种模型都是同步IO,第5种是异步IO
- 任何IO过程中, 都包含两个步骤. 第一是等待, 第二是拷贝. 而且在实际的应用场景中, 等待消耗的时间往往都远远高于拷贝的时间. 让IO更高效, 最核心的办法就是让等待的时间尽量少
同步通信 vs 异步通信
同步和异步关注的是消息通信机制.
- 所谓同步,就是在发出一个调用时,在没有得到结果之前,该调用就不返回. 但是一旦调用返回,就得到返回值了; 换句话说,就是由调用者主动等待这个调用的结果;
- 异步则是相反,调用在发出之后,这个调用就直接返回了,所以没有返回结果; 换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果; 而是在调用发出后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用.
总的来说,所谓同步异步就看有没有参与,参与了就是同步,没参与只是发起者就是异步
另外, 我们回忆在讲多进程多线程的时候, 也提到同步和互斥. 这里的同步通信和线程同步是完全不想干的概念
进程/线程同步也是进程/线程之间直接的制约关系,是为完成某种任务而建立的两个或多个线程,这个线程需要在某些位置上协调他们的工作次序而等待、传递信息所产生的制约关系. 尤其是在访问临界资源的时候
以后在看到 "同步" 这个词, 一定要先搞清楚大背景是什么. 这个同步, 是同步通信异步通信的同步, 还是同步与互斥的同步
阻塞 vs 非阻塞
阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.
- 阻塞调用是指调用结果返回之前,当前线程会被挂起. 调用线程只有在得到结果之后才会返回.
- 非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程.