在Java.io包中操作文件内容主要有两大类:字节流和字符流,两类都分为输入输出操作。
- 在字节流中,输入数据使用InputStream类,输出数据使用OutputStream类。主要用来处理字节或二进制对象(图片、音频)。
- 在字符流中,输入数据主要使用Reader类,输出数据使用Writer类。主要用来处理字符或字符串(一个字符占两个字节)。
- 这四个都是抽象类。
所有文件的存储都是按字节(byte)来存储的,在磁盘上保留的并不是文件的字符而是把字符编码成字节,再存储这些字节到磁盘。在读取文件(特别是文本文件)时,也是一个字节一个字节的读取以形成字节序列。
一、使用场景
字符流是由Java虚拟机将字节转化为Unicode字符为单位的字符而成的,对支持多国语言支持性比较好,如果是关系到中文(文本)的用字符流比较好。字符流只能处理字符或者字符串。
字节流可用于任何类型的对象,包括二进制对象。字节流提供了处理任何类型的IO操作功能,但是她不能直接处理Unicode字符。如果是音频文件、图片、歌曲,就使用字节流比较好。
字节流是最基本的,所有的InputStream和OutputStream的子类都是,主要是用来处理二进制数据,她是按字节来处理的,但是实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理的,也就是要进行字符集的转化,这两个之间通过InputStreamReader,OutputStreamWriter来关联,实际上是通过byte[]和String来关联。
二、字节流和字符流的区别
- 字节流在操作的时候本身是不会用到缓冲区(内存)的,是直接操作文件本身的。而字符流在操作的时候是使用到缓冲区的。
- 字节流在操作文件时,即使不关闭资源(close方法),文件也能输出。字符流不关闭资源的话,则不会输出任何内容,说明字符流用的是缓存区,可以使用flush方法强制进行刷新缓冲区,这是才能在不close的情况下输出内容
- 读写单位不同。字节流以字节为单位,通常用来处理二进制文件。字符流以字符为单位,在读写的时候根据码表映射,每个字符对应多个字节。
- 处理对象不同。字节流能处理所有类型的文件数据(图片、音频)。字符流适用于处理文本数据。
三、Java IO中的字节流和字符流
IO流主要的分类方式有以下3种:
- 按数据流的方向:输入流、输出流
- 按处理数据单位:字节流、字符流
- 按功能:节点流、处理流
IO 分类图:
1.字节流
InputStream和OutputStream是两个抽象类,是字节流的基类,所有具体的字节流实现都是分别继承了这两个类。
InputStream类有很多的实现子类,下面列举了一些比较常用的:
- InputStream:InputStream是所有字节输入流的抽象基类,前面说过抽象类不能被实例化,实际上是作为模板而存在的,为所有实现类定义了处理输入流的方法。
- FileInputStream:文件输入流,一个非常重要的字节输入流,用于对文件进行读取操作。
- PipedInputStream:管道字节输入流,能实现多线程间的管道通讯。
- ByteArrayInputStream:字节数组输入流,从字节数组(byte[])中进行以字节为单位的读取,也就是将资源文件都已字节的形式存入到该类的字节数组中去。
- FilterInputStream:装饰者类,具体装饰者集成该类,这些都是处理类,作用是对节点类进行封装,实现一些特殊功能。
- DataInputStream:数据输入流,它是用来装饰其他输入流,作用是“允许应用程序以与机器无关方式从底层输入流中读取基本Java数据类型”。
- BufferedInputStream:缓冲流,对节点流进行装饰,内部会与一个缓存区,用来存放字节,每次都将缓存区存满后发送,而不是一个字节或两个字节这样发送,效率更高。
- ObjectInputStream:对象输入流,用来提供对基本数据或对象的持久存储。通俗的说,也就是能直接传输对象,通常应用在反序列化中。它也是一种处理流,构造器的入参是一个InputStream对象。
OutputStream类继承关系图:
OutputStream类继承关系与InputStream类型,需要注意的是PrintStream。
2.字符流
与字节流类似,字符流也有两个抽象基类,分别是Reader和Writer。其他的字符流实现类都是继承了这两个类。
以Reader为例,它的主要实现子类如下图:
各个类的详细说:
- InputStreamReader:从字节流到字符流的桥梁(InputStreamReader构造器入参是FileInputStream的实例对象),它读取字节并使用指定的字符集将其解码为字符。它是由的字符集可通过名称指定,也可以显示给定,或者可以接收平台的默认字符集。
- BufferedReader:从字符输入流中读取文本,设置一个缓存区来提高效率。BufferedReader是对InputStreamReader的封装,前者构造器的入参就是后者的一个实例对象。
- FileReader:用于读取字符文件的便利类,new FileReader(File file)等同于new InputStreamReader(new FileInputStream(file),"UTF-8"),但FileReader不能指定指定字符编码和默认缓冲区大小。
- PipedReader:管道字符输入流。实现多线程间的管道通信。
- CharArrayReader:从Char数组中读取数据的介质流。
- StringReader:从String中读取数据的介质流。
Writer与Reader结构类似,方向相反,不在赘述。唯一有区别的是,Writer的子类PrintWriter。
3.节点流和处理流
节点流:直接操作数据读写的流类,比如 FileInputStream
处理流:对一个已经存在的流的连接和封装,通过对数据进行处理为程序提供功能强大、灵活的读写功能,例如 BufferedInputStream(缓存字节流)
处理流和节点流应用了 Java 的装饰者设计模式。
下图就很形象地描绘了节点流和处理流,处理流是对节点流的封装,最终的数据处理还是由节点流完成的。
在诸多的处理流中,有一个非常重要,那就是 缓冲流。
我们知道,程序与磁盘的交互相对于内存运算是很慢的,容易成为程序的性能瓶颈。减少程序与磁盘的交互,是提升程序效率一种有效手段。缓冲流,就应用这种思路:普通流每次读写一个字节,而缓冲流在内存中设置一个缓冲区,缓冲区先存储足够的待操作数据后,再与内存或磁盘进行交互。这样,在总数量不变的情况下,通过提高每次交互的数据量,较少了交互次数。
联想一下生活中的例子,我们搬砖的时候,一块一块地往车上装肯定是效率很低效的。我们可以使用一个小推车,先把砖装到小推车上,再把这小推车推到车前,把砖撞到车上。这个例子中,小推车可以视为缓冲区,小推车的存在,减少了我们装车的次数,从而提高了效率。
注意:缓冲流效率一定高吗?不一定,某些情况下,缓冲流效率反而更低。
原文链接:https://blog.youkuaiyun.com/chenjian723122704/article/details/112976558