Java Io 之 编码

本文深入探讨Java字符串编码知识,通过示例展示不同编码方式的转换与应用,揭示字符乱码与编码间的直接关系。

Java字符串编码一些知识总结:

package com.dcz.io;

import java.io.UnsupportedEncodingException;

public class EncodeDemo {
	
	public static void main(String[] args) throws UnsupportedEncodingException {
		
		String str = "中国ABC";
		// 转换成字节数组是项目默认的编码GBK
		byte[] byteArray = str.getBytes();
		for(byte b : byteArray){
			System.out.print(Integer.toHexString(b & 0xff) + " ");
		}
		
		System.out.println();
		
		// 显示转换为GBK编码
		byte[] byteArray2 = str.getBytes("gbk");
		for(byte b: byteArray2){
			System.out.print(Integer.toHexString(b & 0xff) + " ");
		}
		
		System.out.println();
		
		// 显示转换为UTF-8编码(在UTF-8编码中,中文占用3个字节,英文占用一个字节)
		byte[] byteArray3 = str.getBytes("utf-8");
		for(byte b : byteArray3){
			System.out.print(Integer.toHexString(b & 0xff) + " ");
		}
		
		System.out.println();
		
		// 显示转换为UTF-16be(在此编码上,中文和英文各站两个字节)
		byte[] byteArray4 = str.getBytes("utf-16be");
		for(byte b : byteArray4){
			System.out.print(Integer.toHexString(b & 0xff) + " ");
		}
		
		/**
		 * 当你的字节序列是某种编码时候,想把字节序列变成字符串也需要使用某种编码,否则乱码。
		 */
		
		System.out.println();
		
		// 乱码原因是由于转换和反转编码不统一
		String str1 = new String(byteArray3);
		System.out.println(str1);
		
		// 不乱码原因是由于转换和反转使用了统一格式编码
		String str2 = new String(byteArray3, "utf-8");
		System.out.println(str2);
		
	}

}

总结:从上面的测试代码中可以了解到字符乱码是和字符编码有直接关系。

Java IO中指定文件读写的编码格式,可以通过使用`InputStreamReader`和`OutputStreamWriter`这两个类,它们允许在创建对象时明确指定字符编码。默认情况下,`FileReader`和`FileWriter`会使用系统的默认编码格式进行文件的读写操作,但如果需要使用特定的编码(如UTF-8、GBK等),就需要使用`InputStreamReader`和`OutputStreamWriter`。 ### 文件读取时指定编码格式 在读取文件时,可以将`FileInputStream`作为`InputStreamReader`的输入流,并在构造`InputStreamReader`时指定编码格式。例如: ```java InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"), "utf-8"); ``` 上述代码通过`InputStreamReader`指定了以UTF-8编码格式读取文件`utf-8.txt`。这样可以确保文件内容以正确的字符编码被解析,避免因编码不匹配导致的乱码问题[^1]。 ### 文件写入时指定编码格式 在写入文件时,可以将`FileOutputStream`作为`OutputStreamWriter`的输出流,并在构造`OutputStreamWriter`时指定编码格式。例如: ```java OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk"); ``` 上述代码通过`OutputStreamWriter`指定了以GBK编码格式写入数据到文件`gbk.txt`。这样可以确保生成的文件内容符合指定的字符编码要求。 ### 读写文件时的编码转换示例 以下是一个完整的示例,演示如何从一个以UTF-8编码的文件中读取数据,并将数据写入到一个以GBK编码的文件中: ```java package io; import java.io.*; public class Demo6_TransIO { public static void main(String[] args) throws IOException { InputStreamReader isr = new InputStreamReader(new FileInputStream("utf-8.txt"), "utf-8"); OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("gbk.txt"), "gbk"); int c; while ((c = isr.read()) != -1) { osw.write(c); } isr.close(); osw.close(); } } ``` 在这个例子中,程序从`utf-8.txt`文件中读取字符数据,并将这些字符写入到`gbk.txt`文件中,同时保持字符编码格式的转换。通过这种方式,可以实现不同编码格式之间的文件内容转换。 ### 使用工具类简化编码操作 除了上述方法外,还可以借助Apache Commons IO库中的`IOUtils`类来简化编码操作。例如,可以使用`IOUtils.write()`方法直接指定编码格式写入数据到文件: ```java FileOutputStream outputStream = new FileOutputStream("F:/test/te.txt", true); IOUtils.write("abc", outputStream, "GBK"); outputStream.close(); ``` 上述代码通过`IOUtils.write()`方法将字符串`"abc"`以GBK编码格式写入到文件中,同时使用了追加模式(`true`参数)[^2]。 ### 总结 在Java IO中指定文件读写编码格式,主要依赖于`InputStreamReader`和`OutputStreamWriter`类,通过在构造时传入具体的编码名称,可以灵活地处理不同编码格式的文件。此外,借助Apache Commons IO库中的工具类,也可以简化编码格式的指定操作,提高开发效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值