Java I/O与流:从基础到高级应用
1. 文本编码:Unicode与UTF
在计算机早期,每个字符由一个字节表示,ASCII标准规定了256种可能的位组合代表哪些字符。但它只能容纳美国和英语字符,对于亚洲、非洲、中东和斯拉夫字母则无法表示。于是,许多社区制定了自己的字节到字符的映射标准,这导致处理文件时必须知道其使用的标准。
Unicode标准将字符映射到16位值,可表示65,536个可能的字符,几乎能对所有语言进行编码,但中文、日语和韩语等字符数量巨大的语言无法完全表示。Java采用了双重策略来处理文本:
- 程序可以使用UTF来读写Unicode。
- 程序可以使用读取器和写入器在内部Unicode和外部8位编码之间进行转换。
UTF(UCS Transformation Format)是一种压缩Unicode文本字符串的标准,一些类有读写UTF的方法,可在外部UTF和内部Unicode之间进行转换。
2. 文件输入输出
2.1 File类
java.io.File 类表示主机文件系统上可能存在的文件或目录的名称。其构造函数有以下几种形式:
File(String pathname);
File(String dir, String subpath);
File(File dir, String subpath);
需要注意的是,构造 File 实例不会在本地文件系统上创建文件,只是封装指定的字符串。该类接受Un
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



