Java IO操作之字符编码

说明

在 Java 开发中,最常见的编码类型有 ISO8859-1,GBK/GB2312,Unicode,UTF-8 等编码格式。

  • ISO8859-1:属于单字节编码,只能表示0 ~ 255 的字符范围,主要应用于英文。
  • GBK/GB2312:属于中文编码,专门用来表示汉字,是双字节编码。GBK 可以表示简体中文和繁体中文;GB2312 只能表示简体中文,GBK兼容GB2312。
  • Unicode:Java 中使用此编码,是最标准的一种编码,使用十六进制编码,但是不兼容 ISO8859-1。
  • UTF:UTF 兼容 ISO8859-1,同事可以用来表示所有的语言字符,UTF 编码是不定长度的,每个一个字符为 1 ~ 6个字节不等。一般在中文网页中使用此编码,可以节省空间。

获取本机的编码显示

通过 System 类,可以获取到系统的相关信息。

public class Demo {
	public static void main(String[] args) {
		
		// 输出系统相关的信息
		System.getProperties().list(System.out);
		
		// 获取系统默认编码
		System.out.println( System.getProperty("file.encoding") );	// GBK
	}
}

控制台输出:

由于控制台输出太多,截取一部分

-- listing properties --
java.runtime.name=Java(TM) SE Runtime Environment
sun.boot.library.path=D:\JDK\jdk1.8.0_91\jre\bin
java.vm.version=25.91-b15
java.vm.vendor=Oracle Corporation
java.vendor.url=http://java.oracle.com/
path.separator=;
java.vm.name=Java HotSpot(TM) 64-Bit Server VM
file.encoding.pkg=sun.io
user.script=
user.country=CN
sun.java.launcher=SUN_STANDARD
sun.os.patch.level=
java.vm.specification.name=Java Virtual Machine Specification
user.dir=E:\WorkspaceEclipse\java8Study
java.runtime.version=1.8.0_91-b15
java.awt.graphicsenv=sun.awt.Win32GraphicsEnvironment
java.endorsed.dirs=D:\JDK\jdk1.8.0_91\jre\lib\endorsed
os.arch=amd64
java.io.tmpdir=C:\Users\Wayfreem\AppData\Local\Temp\
line.separator=

通过流进行编码

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
 
public class Demo {
	public static void main(String[] args) throws Exception {// 此处直接抛出错误
		File file = new File("e:" + File.separator + "demo" + File.separator + "my.txt");
		if (!file.getParentFile().exists()) {
			file.getParentFile().mkdirs();
		}
		OutputStream out = new FileOutputStream(file);
		// 不使用编码 out.write("使用流转换编码格式".getBytes());// 没有进行编码

		out.write("使用流转换编码格式".getBytes("ISO8859-1"));// 进行编码
		out.close();
	}
 
}
### Java IO指定字符编码的方式 在Java中,可以通过`InputStreamReader`和`OutputStreamWriter`类来实现对特定字符编码的支持。这两个类分别用于将字节流转换为字符流以及将字符流转换回字节流,并允许开发者通过构造函数显式地指定所需的字符编码。 以下是具体示例代码: #### 使用 `InputStreamReader` 指定字符编码读取文件 ```java import java.io.FileInputStream; import java.io.InputStreamReader; public class ReadWithEncoding { public static void main(String[] args) throws Exception { FileInputStream fis = new FileInputStream("example.txt"); InputStreamReader isr = new InputStreamReader(fis, "UTF-8"); // 显式指定 UTF-8 编码 int data; while ((data = isr.read()) != -1) { System.out.print((char) data); } isr.close(); fis.close(); } } ``` 上述代码展示了如何利用`InputStreamReader`配合`FileInputStream`完成带指定编码的文件读取操作[^4]。 #### 使用 `OutputStreamWriter` 指定字符编码写入文件 ```java import java.io.FileOutputStream; import java.io.OutputStreamWriter; public class WriteWithEncoding { public static void main(String[] args) throws Exception { FileOutputStream fos = new FileOutputStream("output.txt"); OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8"); // 显式指定 UTF-8 编码 osw.write("Java支持多种字符编码方式!"); osw.flush(); osw.close(); fos.close(); } } ``` 此部分说明了借助`OutputStreamWriter`与`FileOutputStream`组合可以向目标文件写出带有指定编码的内容。 当不希望依赖平台默认编码时,以上方法显得尤为重要。例如,在跨操作系统环境中传输文本数据或者处理多语言环境下的字符串时,明确设置字符集能够有效避免乱码问题的发生[^3]。 ### 注意事项 如果尝试使用的编码名称非法,则会抛出`UnsupportedEncodingException`异常;因此建议始终验证所选编码的有效性并妥善捕获可能产生的错误情况。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wayfreem

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值