《Java核心技术 卷Ⅱ 高级特性(原书第10版)》一2.2 文本输入与输出

本文探讨了文本格式的数据输入输出(I/O)方法,对比了二进制格式的特点,并介绍了字符编码的重要性。重点讲解了Java中如何利用OutputStreamWriter和InputStreamReader类进行不同编码方式的转换。

2.2 文本输入与输出

在保存数据时,可以选择二进制格式或文本格式。例如,整数1234存储成二进制数时,它被写为由字节00 00 04 D2构成的序列(十六进制表示法),而存储成文本格式时,它被存成了字符串“1234”。尽管二进制格式的I/O高速且高效,但是不宜人来阅读。我们首先讨论文本格式的I/O,然后在2.3节中讨论二进制格式的I/O。
在存储文本字符串时,需要考虑字符编码(character encoding)方式。在Java内部使用的UTF-16编码方式中,字符串“1234”编码为00 31 00 32 00 33 00 34(十六进制)。但是,许多程序都希望文本文件按照其他的编码方式编码。在UTF-8这种在互联网上最常用的编码方式中,这个字符串将写出为4A 6F 73 C3 A9,其中并没有用于前3个字母的任何0字节,而字符é占用了两个字节。
OutputStreamWriter类将使用选定的字符编码方式,把Unicode码元的输出流转换为字节流。而InputStreamReader类将包含字节(用某种字符编码方式表示的字符)的输入流转换为可以产生Unicode码元的读入器。
例如,下面的代码就展示了如何让一个输入读入器可以从控制台读入键盘敲击信息,并将其转换为Unicode:
image

这个输入流读入器会假定使用主机系统所使用的默认字符编码方式。在桌面操作系统中,它可能是像Windows 1252或MacRoman这样的古老的字符编码方式。你应该总是在InputStreamReader的构造器中选择一种具体的编码方式。例如,
image

请查看2.2.4节以了解字符编码方式的更多信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值