详解字节流和字符流

本文详细阐述了字节流和字符流的概念,字节流包括InputStream和OutputStream,字符流涵盖Reader和Writer。字符流使用缓冲区,如CharArrayReader和StringReader,而字节流如FileInputStream和FileOutputStream则直接操作文件。两者在处理数据格式、数据来源、是否需要格式化输出、是否需要缓冲、输入输出类型以及流转化等方面存在区别。在选择使用场景时,要考虑数据是否为纯文本、是否需要缓冲和格式化等条件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、明确字符和字节的概念

字节:1 byte = 8 bit
字符:1 char = 2 byte = 16 bit(java默认)

在计算机硬件层面,1 bit 是数据最小的单位。但是在大多数情况下,1 bit 存储的信息太少,我们通常把 1 字节作为数据最小的基本单位。

而字符实际上也是对字节的一种包装,那为什么还需要引入字符?
对于西方世界,使用英语等语种的国家来说,1字节有 256个符号编码,对于26个英文字母加上常用的标点符号已经够用了。这就是常用的ASCII 码。
但是对于东方国家,中文,日文等文字,数量太多,1个字节根本没有办法表示所有的字符,所以引入了Unicode —— 统一编码,而这种编码的常规字符集就是使用2个字节,所以引入了字符的概念。

但是,从根本而言,一切都是字节流,字符流也是字节流的一种形式。

二、关于 java中字节流和字符流

2.1 字节流,字符流概念

Java中,读取数据时,字节流的数据存储单位是字节,会使用字节类型数组 byte[] 来保存数据,可以操作字节,字节数组。
而 字符流的存储单位是字符,使用字符类数组 char[] 来保存数据,可以操作字符,字符数组或字符串。

2.2 java中的字节流,字符流相关API

Java 的I/O库有两个分支:

  • 面向字节流的InputSteam和OutputStream
  • 面向字符的Reader 和 wirter
    图片来自网络
    ByteArrayInputStream – 把内存中的一个缓冲区作为 InputStream 使用 .
    StringBufferInputStream – 把一个 String 对象作为 InputStream .
    FileInputStream – 把一个文件作为 InputStream ,实现对文件的读取操作
    PipedInputStream :实现了 pipe 的概念,主要在线程中使用 . 管道输入流是指一个通讯管道的接收端。
    一个线程通过管道输出流发送数据,而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
    SequenceInputStream :把多个 InputStream 合并为一个 InputStream . “序列输入流”类允许应用程序把几个输入流连续地合并起来,
    并且使它们像单个输入流一样出现。每个输入流依次被读取,直到到达该流的末尾。
    图片来自网络
    ByteArrayOutputStream : 把信息存入内存中的一个缓冲区中 . 该类实现一个以字节数组形式写入数据的输出流。
    FileOutputStream: 文件输出流是向 File 或 FileDescriptor 输出数据的一个输出流。
    PipedOutputStream: 管道输出流是指一个通讯管道的发送端。 一个线程通过管道输出流发送数据,
    而另一个线程通过管道输入流读取数据,这样可实现两个线程间的通讯。
    图片来自网络
    CharArrayReader :与 ByteArrayInputStream 对应此类实现一个可用作字符输入流的字符缓冲区
    StringReader : 与 StringBufferInputStream 对应其源为一个字符串的字符流。
    FileReader : 与 FileInputStream 对应
    PipedReader :与 PipedInputStream 对应
    图片来着网络
    CharArrayWrite : 与 ByteArrayOutputStream 对应
    StringWrite :无与之对应的以字节为导向的 stream
    FileWrite : 与 FileOutputStream 对应
    PipedWrite :与 PipedOutputStream 对应

2.3 字符流,字节流API的使用

字节流示例

//字节流写文件
public static void writeFile(){
    String str = "采用数据流方式(字节流)写文件!";
    try{
        BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("D://hello.txt",true));
        //需要转化为字节
        byte[] data = str.getBytes();
        bos.write(data);
        bos.close();
    }catch (FileNotFoundException e){
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }
}
//字节流读文件
public static void readFile(){
    try {
        BufferedInputStream bis = new BufferedInputStream(new FileInputStream("D://hello.txt"));
        byte[] data = new byte[1024];
        int n = -1;
        while((n=bis.read(data,0,data.length))!=-1){
            String str = new String(data,0,n,"UTF-8");
            System.out.println(str);
        }
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }

字符流示例

//字符流写文件
public static void writeFile(){
    File file = new File("D:\\hello.txt");
    String str = " hello, everybody! welcome to the study of Java!";
    try{
        FileWriter fw = new FileWriter(file);
        BufferedWriter bw = new BufferedWriter(fw);
        bw.write(str);
        bw.close();
        fw.close();
    }catch(IOException e){
        e.printStackTrace();
    }
}
//字符流读文件
public static void readerFile(){
    File file = new File("D:\\hello.txt");
    try{
        BufferedReader br = new BufferedReader(new FileReader(file));

        String str = null;
        while( (str = br.readLine()) != null){
            System.out.println(str);
        }
        br.close();
    }catch(FileNotFoundException e){
        e.printStackTrace();
    }catch(IOException e){
        e.printStackTrace();
    }
}

三、字节流和字符流的区别

字节流和字符流的区别:

  • 字节流在操作文件时,本身不会用到缓冲区(内存),是对文件本身直接操作的;而字符流在操作时是使用到缓冲区的。
  • 字节流在操作文件时,即使不关闭资源(close)文件也能输出;字符流如果不是用close方法的话,则不会输出任何内容,说明字符流使用了缓冲区。且可以使用flush方法强制进行刷新缓冲区,此时在不close情况下也能输出内容。
  • Reader类的read()方法返回类型是int,占两个字节,如果到达流的末尾,则返回-1;inputStream的read()方法虽然也返回int,打算面向字节流,占一个字节。因此对于超过一个字节的只能使用字符流来读取,如汉字。
  • 处理方式不同;字节流:处理字节和字节数组成的二进制对象。
    字符流:处理字符,字符数或字符串。

注:缓冲区是什么??
缓冲区可以理解为一段特殊的内存。
在某些情况下,如果程序频繁操作一个资源,则性能会很低,为了提升性能,可以将这部分数据暂时读入内存的一块区域,之后就可以直接从内存中读取数据,提升速度和性能。

四、使用场景判断

4.1 数据格式

  • 二进制格式(不能确定是纯文本):字节流,InputStream、OutputStream及其子类。
  • 纯文本格式(含中英文或其他编码方式):字符流,Reader,Writer及其子类。

4.2 数据来源

  • 文件:字节流 FileInputStream,FileOutputStream;字符流 FileReader,FileWriter
  • byte[]: 字节流 ByteArrayInputStream, ByteArrayOutputStream char[]:字符流
  • CharArrayReader, CharArrayWriter String: 字节
  • StringBufferInputStream, StringBufferOuputStream ;字符流 StringReader,StringWriter
  • 网络数据流:字节流 InputStream, OutputStream;字符流 Reader, Writer

4.3 是否需要格式化输出

需要格式化输出的:PrintStream, PrintWriter

4.4 是否需要缓冲

需要缓冲:字节流 BufferedInputStream, BufferedOutputStream;字符流 BufferedReader, BufferedWriter

4.5 输入还是输出

  • 输入:Reader, InputStream 类型的子类
  • 输出:Writer, OutputStream 类型的子类

4.6 是否有流转化

  • 字节到字符:InputStreamReader
  • 字符到字节:OutputStreamWriter

4.7 特殊需要

  • 对象输入输出:ObjectInputStream, ObjectOutputStream
  • 进程间通信:PipedInputStream, PipedOutputStream, PipedReader, PipedWriter
  • 合并输入: SequenceInputStream
### Java 字节流字符流的区别及用法场景 #### 一、定义上的差异 字节流字符流的主要区别在于其处理的数据单位不同。字节流以 `8位`(即一个字节)为单位进行数据传输,适用于任何类型的二进制数据,如图片、音频文件等[^1]。而字符流则专门用于处理文本数据,它以 `16位` Unicode 字符为单位进行操作,能够自动完成字符集转换,从而简化了文本文件的读写过程[^2]。 #### 二、继承体系的不同 在 Java 的 I/O 类库中,字节流的核心抽象基类是 `InputStream` `OutputStream`,所有具体的字节流都派生于这两个类。与此相对应的是字符流,它的核心抽象基类分别是 `Reader` `Writer`。因此,在选择使用何种流时,可以根据具体需求决定是否需要支持字符编码转换[^3]。 #### 三、适用场景分析 - **字节流的应用** - 当涉及非文本型数据的操作时,比如图像文件 (.jpg, .png),视频文件 (.mp4) 或者其他二进制格式 (如 `.class`, `.exe`) 文件,则应该选用字节流来进行处理[^4]。 - **字符流的应用** - 对于纯文本文件或者需要考虑特定编码方式的情况,例如 XML 文档、JSON 数据或是普通的 UTF-8 编码文本文件,推荐采用字符流以便更方便地管理字符串并避免潜在的编码错误。 #### 四、两者之间的联系 尽管二者存在上述显著差别,但在某些情况下可能还需要互相配合工作。例如当从网络接收到原始字节数组却希望将其解释成某种指定编码的文字串的时候;或者是反过来要把一段文字按照给定编码转回对应的字节数组再发送出去的情形下,就可以借助桥接器类——`InputStreamReader` 及 `OutputStreamWriter` 实现这种转换关系。 ```java // 使用 InputStreamReader 将字节流转换为字符流的例子 InputStream inputStream = new FileInputStream("example.txt"); Reader reader = new InputStreamReader(inputStream, StandardCharsets.UTF_8); // 使用 OutputStreamWriter 将字符流转回字节流的例子 OutputStream outputStream = new FileOutputStream("output.txt"); Writer writer = new OutputStreamWriter(outputStream, StandardCharsets.UTF_8); ``` #### 五、性能考量 由于每次调用字符流方法内部都会经历一次额外的字符编码/解码过程,所以在追求极致速度的情况下可能会稍微逊色一点于直接操作底层字节的方式。不过对于大多数日常应用而言,这点开销完全可以忽略不计,并且利用好高级别的封装反而有助于减少程序复杂度以及提高可维护性。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值