Java 编程:字符集、运算符、修饰符与编码准则
一、Unicode 字符集
Unicode 字符集是 Java 编程语言用于管理文本的字符系统。字符集本质上是一个有序的字符列表,每个字符对应一个特定的数值。
1.1 Unicode 简介
Unicode 是一个国际字符集,包含世界各地语言的字母、符号和表意文字。每个字符用 16 位无符号数值表示,因此可以支持超过 65,000 个唯一字符,但目前只有约一半的数值分配了字符。随着各种语言字符的不断纳入,Unicode 字符集也在持续完善。
1.2 与 ASCII 字符集对比
许多编程语言仍在使用 ASCII 字符集,即美国信息交换标准代码。8 位扩展 ASCII 集规模较小,因此 Java 开发者选择使用 Unicode 以支持国际用户。不过,ASCII 本质上是 Unicode 的一个子集,包含相应的数值,所以熟悉 ASCII 的程序员使用 Unicode 应该不会有问题。
1.3 可打印与不可打印字符
- 可打印字符 :具有可以在显示器上显示或由打印机打印的符号表示,如常见的字母、数字和标点符号。例如,在 Unicode 字符集中,数值 32 对应的字符是空格,它也被视为可打印字符。
- 不可打印字符 :没有可见的符号表示,有时也称为控制字符,因为很多可以通过按住键盘上的控制键并按下另一个键来生成。数值 0 到 31 的 Unicode 字符以及数值为 127 的删除字符都是不可打印字符。不可打印字符在很多情况下用于表示特殊条件,如
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



