一、前言
-
I/O(Input/Output):即输入/输出,描述了计算机系统与外部设备之间通信的过程。
-
阻塞(Blocking):在阻塞I/O操作中,调用者请求I/O操作并等待操作完成。在操作完成之前,调用者被挂起,无法执行其他操作。
-
非阻塞(Non-blocking):非阻塞I/O操作允许调用者发起I/O请求后立即继续执行,不需要等待I/O操作完成。
-
同步(Synchronous):同步I/O操作要求程序在I/O操作完成之前保持等待状态。同步操作可以是阻塞的,也可以是非阻塞的(通过轮询实现)。
-
异步(Asynchronous):异步I/O允许程序在发起I/O操作后继续执行,不需要等待I/O操作的完成。异步操作通常是非阻塞的,I/O操作在后台进行,一旦完成,程序会收到通知。
二、I/O
1、何为 I/O?
I/O(Input/Output) 即输入/输出 。
我们先从计算机结构的角度来解读一下 I/O。
根据冯.诺依曼结构,计算机结构分为 5 大部分:运算器、控制器、存储器、输入设备、输出设备。
输入设备(比如键盘)和输出设备(比如显示器)都属于外部设备。网卡、硬盘这种既可以属于输入设备,也可以属于输出设备。
输入设备向计算机输入数据,输出设备接收计算机输出的数据。
从计算机结构的视角来看的话, I/O 描述了计算机系统与外部设备之间通信的过程。
我们再先从应用程序的角度来解读一下 I/O。
根据大学里学到的操作系统相关的知识:为了保证操作系统的稳定性和安全性,一个进程的地址空间划分为 用户空间(User space) 和 内核空间(Kernel space ) 。
像我们平常运行的应用程序都是运行在用户空间,只有内核空间才能进行系统态级别的资源有关的操作,比如文件管理、进程通信、内存管理等等。也就是说,我们想要进行 IO 操作,一定是要依赖内核空间的能力。
并且,用户空间的程序不能直接访问内核空间。
当想要执行 IO 操作时,由于没有执行这些操作的权限,只能发起系统调用请求操作系统帮忙完成。
因此,用户进程想要执行 IO 操作的话,必须通过 系统调用 来间接访问内核空间
我们在平常开发过程中接触最多的就是 磁盘 IO(读写文件) 和 网络 IO(网络请求和响应)。
从应用程序的视角来看的话,我们的应用程序对操作系统的内核发起 IO 调用(系统调用),操作系统负责的内核执行具体的 IO 操作。也就是说,我们的应用程序实际上只是发起了 IO 操作的调用而已,具体 IO 的执行是由操作系统的内核来完成的。
当应用程序发起 I/O 调用后,会经历两个步骤:
- 内核等待 I/O 设备准备好数据
- 内核将数据从内核空间拷贝到用户空间。
2、有哪些常见的 IO 模型?
UNIX 系统下, IO 模型一共有 5 种:同步阻塞 I/O、同步非阻塞 I/O、I/O 多路复用、信号驱动 I/O 和异步 I/O。
这也是我们经常提到的 5 种 IO 模型。
三、Java 中 3 种常见 IO 模型
1、BIO (Blocking I/O)
BIO 属于同步阻塞 IO 模型 。
-
在BIO模型中,应用程序发起I/O调用后,会一直阻塞,直到内核把数据拷贝到用户空间。
-
这种模型简单直观,但性能上可能不是最优的,尤其是在处理大量并发连接时。
-
适用于IO操作快速且不会造成长时间阻塞的应用。
在客户端连接数量不高的情况下,是没问题的。但是,当面对十万甚至百万级连接的时候,传统的 BIO 模型是无能为力的。因此,我们需要一种更高效的 I/O 处理模型来应对更高的并发量。
2、NIO (Non-blocking/New I/O)
-
NIO于Java 1.4中引入,提供了Channel、Selector、Buffer等抽象。
-
NIO支持面向缓冲的、基于通道的I/O操作方法,适用于高负载、高并发的网络应用。
-
在NIO中,线程首先发起select调用,询问内核数据是否准备就绪,等内核把数据准备好了,用户线程再发起read调用。read调用的过程(数据从内核空间到用户空间)还是阻塞的。但通过这种方式,减少了无效的系统调用,降低了CPU资源的消耗。
-
NIO也可以看作是IO多路复用模型,通过Selector,一个线程可以管理多个客户端连接。
同步非阻塞 IO 模型中,应用程序会一直发起 read 调用,等待数据从内核空间拷贝到用户空间的这段时间里,线程依然是阻塞的,直到在内核把数据拷贝到用户空间。
相比于同步阻塞 IO 模型,同步非阻塞 IO 模型确实有了很大改进。通过轮询操作,避免了一直阻塞。
但是,这种 IO 模型同样存在问题:应用程序不断进行 I/O 系统调用轮询数据是否已经准备好的过程是十分消耗 CPU 资源的。
这个时候,I/O 多路复用模型 就上场了。
IO 多路复用模型中,线程首先发起 select 调用,询问内核数据是否准备就绪,等内核把数据准备好了,用户线程再发起 read 调用。read 调用的过程(数据从内核空间 -> 用户空间)还是阻塞的。
目前支持 IO 多路复用的系统调用,有 select,epoll 等等。select 系统调用,目前几乎在所有的操作系统上都有支持。
- select 调用:内核提供的系统调用,它支持一次查询多个系统调用的可用状态。几乎所有的操作系统都支持。
- epoll 调用:linux 2.6 内核,属于 select 调用的增强版本,优化了 IO 的执行效率。
IO 多路复用模型,通过减少无效的系统调用,减少了对 CPU 资源的消耗。
Java 中的 NIO ,有一个非常重要的选择器 ( Selector ) 的概念,也可以被称为 多路复用器。通过它,只需要一个线程便可以管理多个客户端连接。当客户端数据到了之后,才会为其服务。
3、AIO (Asynchronous I/O)
-
AIO是Java 7中引入的NIO的改进版,即NIO 2。
-
AIO基于事件和回调机制实现,应用程序发起I/O操作后会直接返回,不会阻塞。当后台处理完成,操作系统会通知相应的线程进行后续的操作。
-
AIO的应用目前还不是很广泛,因为在一些场景下,其性能提升并不明显。
目前来说 AIO 的应用还不是很广泛。Netty 之前也尝试使用过 AIO,不过又放弃了。这是因为,Netty 使用了 AIO 之后,在 Linux 系统上的性能并没有多少提升。
最后,来一张图,简单总结一下 Java 中的 BIO、NIO、AIO。
四、Java IO模型的优缺点及应用场景
1、BIO
-
优点:编程模型简单,代码按照编写顺序执行。
-
缺点:在处理大量并发连接时,性能可能不是最优的,因为每个连接都需要一个独立的线程来处理。
-
应用场景:适用于IO操作快速且不会造成长时间阻塞的应用。
2、NIO
-
优点:提高了并发处理能力,一个线程可以管理多个连接;减少了无效的系统调用,降低了CPU资源的消耗。
-
缺点:编程模型相对复杂,需要管理Channel、Selector、Buffer等抽象;在处理大量小数据包时,可能因为频繁的上下文切换而降低性能。
-
应用场景:适用于高负载、高并发的网络应用,如聊天室、在线游戏等。
3、AIO
-
优点:异步操作,不会阻塞调用线程;提高了系统的吞吐量和响应速度。
-
缺点:编程模型复杂,需要处理回调机制和异步通知;在某些场景下,性能提升可能不明显。
-
应用场景:适用于需要高响应性或处理大量网络请求的服务器,但需注意其应用场景的局限性。
五、Java IO模型的示例代码
以下是Java中BIO、NIO模型的简单示例代码:
1、BIO示例代码
import java.io.IOException;
import java.io.InputStream;
import java.net.ServerSocket;
import java.net.Socket;
public class BlockingIOExample {
public static void main(String[] args) throws IOException {
ServerSocket serverSocket = new ServerSocket(8080);
while (true) {
Socket clientSocket = serverSocket.accept();
InputStream input = clientSocket.getInputStream();
byte[] buffer = new byte[1024];
int bytesRead = input.read(buffer);
while (bytesRead != -1) {
System.out.print(new String(buffer, 0, bytesRead));
bytesRead = input.read(buffer);
}
}
}
}
2、NIO示例代码
import java.io.IOException;
import java.net.InetSocketAddress;
import java.nio.ByteBuffer;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;
public class NonBlockingIOExample {
public static void main(String[] args) throws IOException {
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
serverSocketChannel.socket().bind(new InetSocketAddress(8080));
serverSocketChannel.configureBlocking(false);
while (true) {
SocketChannel client = serverSocketChannel.accept();
if (client != null) {
client.configureBlocking(false);
ByteBuffer buffer = ByteBuffer.allocate(1024);
int bytesRead = client.read(buffer);
while (bytesRead != -1) {
buffer.flip();
while (buffer.hasRemaining()) {
System.out.print((char) buffer.get());
}
buffer.clear();
bytesRead = client.read(buffer);
}
}
}
}
}
通过以上示例代码,可以直观地看到BIO和NIO在处理网络连接时的不同方式。BIO采用阻塞方式等待客户端连接和数据读取,而NIO则采用非阻塞方式,可以在等待客户端连接和数据读取的同时执行其他任务。