Unicode是什么?
Unicode是java使用的编码表,他与C语言使用ASCLL类似。
public class Test {
public static void main(String\u005B\u005D args) {
System.out.println(\u0022 你好 \u0022);
}
}
上述代码中的中括号以及引号就是用unicode表示的。
Unicode的 由来:
在Unicode之前,有多种不同的编码规则,在这样对于一个给定的代码值,不同的编码就对应不同的值,并且采用大字符集的与语言其编码长度可能不同,Unicode的出现就是为了解决这个问题的。
Unicode统一采用2个字节来表示一个编码,即使是英文字符也是用两个字节来表示的,只不过是前边填0。
Unicode的作用:
这样一来大大拓展了Unicode的容量,使他可以容纳世界上所有文字和符号。能够使计算机实现跨平台跨语言的转换和处理。
由于java采用了Unicode,所以java是一种跨平台语言。
那么像UTF8,UTF18,UTF32都是将数字转换到程序数据的编码方案。
Char和Unicode的关系:
Char存储Unicode的字符串。
码点:是编码表上一字符所对应的编码值。
编码单元: 每个字母用16位表示,对码点编码得到的一个或两个16位序列。