JavaBase-IO流-转换流_javabean转字节流-优快云博客

本文链接：https://blog.youkuaiyun.com/jllion/article/details/116267284

转换流

说明和使用

转换流提供了在字节流和字符流之间的转换
Java API提供了两个转换流
- InputStreamReader：将InputStream转换成Reader
- OutputStreamWriter：将Writer转换为OutputStream
字节流中的数据都是字符时，转换成字符流操作更高效。
很多时候我们使用转换流来处理文件乱码问题。实现编码和解码的功能

转换流使用

private void transferEncoding() {
    InputStreamReader inputStreamReader = null;
    OutputStreamWriter outputStreamWriter = null;
    try {
        inputStreamReader = new InputStreamReader(new FileInputStream(new File("hello1.txt")),"UTF-8");
        outputStreamWriter = new OutputStreamWriter(new FileOutputStream("hello2.txt"),"GBK");
        char[] cbuf = new char[10];
        int length;
        while((length = inputStreamReader.read(cbuf))!=-1){
            outputStreamWriter.write(cbuf,0,length);
        }
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if(inputStreamReader != null){
            try {
                inputStreamReader.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        if(outputStreamWriter != null){
            try {
                outputStreamWriter.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

补充：字符编码

编码表的由来
- 计算机只能识别二进制数据，早期由来是信号。为了方便应用计算机，让它可以识别各个国家的文字。就将各个国家的文字用数字来表示，并一一对应，形成一张表。这就是编码表
常见的编码表
- ASCII：美国标准信息交换码
  - 用一个字节的7位可以表示。
- IOS8859-1：拉丁码表。欧洲码表
  - 用一个字节的8位表示。
- GB2312：中国的中文编码表。最多两个字节编码所有字符
- GBK：中国中文编码表升级，融合了更多的中文文字符号。最多两个字节编码
- Unicode：国际标准码，融合了目前人类使用的所有字符。为每个字符分配唯一的字符码。所有的文字都是用两个字节表示。
- UTF-8：变长的编码方式，可用1-4个字节来表示一个字符。
Unicode不完美，这里就有三个问题，一个是，我们已经知道，英文字母只用一个字节表示就够了，第二个问题是如何才能区别Unicode和ASCII？计算机怎么知道两个字节表示一个符号，而不是分别表示两个符号呢？第三个，如果和GBK等双字节编码方式一样，用最高位是1或0表示两个字节和一个字节，就少了很多值无法用于表示字符，不够表示所有字符。Unicode在很长一段时间内无法推广，直到互联网的出现
面向传输的众多UTF(UCS Transfer Format)标准出现了，顾名思义，UTF-8就是每次8个位传输数据，而UTF-16就是每次16个位。这是为传输而设计的编码，并使编码无国界，这样就可以显示全世界上所有文化的字符了。
Unicode只定义了一个庞大的、全球通用的字符集，并为每个字符规定了唯一确定的编号，具体存储成什么样的字节流，取决于字符编码方案。推荐的Unicode编码是UTF-8和UTF-16