一、Java IO 概述
1、IO
在 Java 中,IO(Input/Output,输入/输出) 是程序与外部资源(如文件、网络、内存、控制台等)进行数据交互的核心机制。
所有IO 都是通过输入/输出流来处理的。这些流按照统一的方式来处理与各种数据源之间的通信,例如文件、网络连接或内存块。
Java 通过一套标准库(java.io
和 java.nio
)提供了丰富的类来处理不同类型的 IO 操作。
2、IO流的分类
流是数据的载体。
-
按数据方向
-
输入流(Input Stream):从数据源(如文件、网络等)读取数据。
-
输出流(Output Stream):向目标(如文件、网络等)写入数据。
-
-
按数据类型
-
字节流(Byte Streams):以字节(8位)为单位操作,处理所有二进制数据(如图片、音频、视频等)。
- 基类:InputStream 和 OutputStream。
-
字符流(Character Streams):以字符(16位Unicode)为单位操作,专门处理文本数据。
- 基类:Reader 和 Writer。
-
-
按功能
-
节点流(Node Streams):直接操作数据源(如文件流)。
-
处理流(Processing Streams):对现有流进行包装,增强功能(如缓冲、转换格式)。
-
3、IO设计模式
Java IO 通过装饰器模式扩展流的功能,例如:
- 缓冲功能:
BufferedInputStream
、BufferedWriter
。 - 数据转换:
InputStreamReader
(字节转字符)、DataInputStream
(处理基本数据类型)。
4、核心类与常用流
(1)字节流
- InputStream(输入流)
- FileInputStream:从文件读取字节。
- ByteArrayInputStream:从字节数组读取。
- BufferedInputStream:提供缓冲功能,减少IO次数。
- DataInputStream:读取Java基本数据类型(如int、double)。
- ObjectInputStream:反序列化对象(需实现Serializable接口)。
- OutputStream(输出流)
- FileOutputStream:向文件写入字节。
- ByteArrayOutputStream:写入字节数组。
- BufferedOutputStream:缓冲输出流。
- DataOutputStream:写入Java基本数据类型。
- ObjectOutputStream:序列化对象。
(2)字符流
- Reader(字符输入流)
- FileReader:读取文本文件。
- BufferedReader:提供缓冲功能,支持readLine()逐行读取。
- InputStreamReader:将字节流转换为字符流(可指定编码)。
- Writer(字符输出流)
- FileWriter:写入文本文件。
- BufferedWriter:缓冲输出流。
- OutputStreamWriter:将字符流转换为字节流(可指定编码)。
(3)转换流
- InputStreamReader 和 OutputStreamWriter:用于字节流与字符流的转换,支持字符编码(如UTF-8、GBK)。
5、示例
(1)文件读写
-
字节流示例(复制文件):
try (FileInputStream fis = new FileInputStream("input.jpg"); FileOutputStream fos = new FileOutputStream("output.jpg")) { byte[] buffer = new byte[1024]; int bytesRead; while ((bytesRead = fis.read(buffer)) != -1) { fos.write(buffer, 0, bytesRead); } }
-
字符流示例(逐行读取文本):
try (BufferedReader br = new BufferedReader(new FileReader("file.txt"))) { String line; while ((line = br.readLine()) != null) { System.out.println(line); } }
(2)对象序列化
// 序列化
try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("data.obj"))) {
oos.writeObject(new Person("Alice", 30));
}
// 反序列化
try (ObjectInputStream ois = new ObjectInputStream(new FileInputStream("data.obj"))) {
Person p = (Person) ois.readObject();
}
(3)缓冲流提升性能
// 使用缓冲流复制文件(效率更高)
try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream("input.txt"));
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("output.txt"))) {
int data;
while ((data = bis.read()) != -1) {
bos.write(data);
}
}
6、应用场景
IO流主要用于处理输入和输出操作,适用于以下场景:
- 文件读写:通过IO流可以读取和写入文件中的数据,如读取配置文件、写入日志等。
- 网络通信:通过IO流可以进行网络数据的传输和接收,如Socket通信、HTTP请求等。
- 数据库操作:通过IO流可以将数据读取到内存中,或将内存中的数据写入到数据库中。
- 文本处理:通过IO流可以读取和写入文本文件,进行文本处理和操作。
二、Linux 网络IO模型
Linux 的内核将所有外部设备都看做一个文件来操作,对一个文件的读写操作会调用内核提供的系统命令,返回一个 file descriptor(fd,文件描述符)。而对一个 socket 的读写也会有相应的描述符,称为socketfd(socket描述符),描述符就是一个数字,它指向内核中的一个结构体(文件路径,数据区等一些属性)。
根据 UNIX 网络编程对 I/O 模型的分类,UNIX 提供了 5 种 I/O 模型,分别如下:
(1) 阻塞 I/O 模型:最常用的 I/O 模型就是阻塞 I/O 模型,缺省情形下,所有文件操作都是阻塞的。以套接字接口为例来讲解此模型:在进程空间中调用recvfrom,其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误时才返回,在此期间一直会等待,进程在从调用 recvfrom 开始到它返回的整段时间内都是被阻塞的,因此被称为阻寨 I/O 模型,如图 1-1 所示:
(2)非阻塞 I/0 模型:recvfrom 从应用层到内核的时候,如果该缓冲区没有数据的话就直接返回一个 EWOULDBLOCK 错误,一般都对非阻塞 I/O 模型进行轮询检查这个状态,看内核是不是有数据到来。如图1-2所示。
(3)I/0 复用模型:Linux 提供 select/poll,进程通过将一个或多个 fd 传递给 select 或poll 系统调用,阻塞在 select 操作上,这样 select/poll 可以帮我们侦测多个 fd 是否处于就绪状态。select/poll 是顺序扫描 fd 是否就绪,而且支持的 fd 数量有限,因此它的使用受到了一些制约。Linux 还提供了一个 epoll 系统调用,epoll 使用基于事件驱动方式代替顺序扫描,因此性能更高。当有fd就绪时,立即回调函数rollback。如图 1-3 所示。
(4)信号驱动 I/0 模型:首先开启套接口信号驱动 I/O 功能,并通过系统调用 sigaction执行一个信号处理函数(此系统调用立即返回,进程继续工作,它是非阻塞的)。当数据准备就绪时,就为该进程生成一个 SIGIO 信号,通过信号回调通知应用程序调用 recvfrom来读取数据,并通知主循环函数处理数据。如图 1-4所示。
(5)异步 I/0:告知内核启动某个操作,并让内核在整个操作完成后(包括将数据从内核复制到用户自己的缓冲区)通知我们。这种模型与信号驱动模型的主要区别是:信号驱动 I/O 由内核通知我们何时可以开始一个 I/O 操作;异步 I/O 模型由内核通知我们 I/O操作何时已经完成。如图 1-5 所示。
十、资料
- 《UNIX 网络编程》