代码点(Code Point)
在字符集中每一个字符都有自己对应的唯一的编号,这个编号就叫做代码点。
代码单元(Code Unit)
不同的编码方式,表示字符的代码点的位数都不一定相同,但是都会选择用一个最短的比特长度做一个单位,这个单位就叫代码单元。
比如UTF-8
的代码单元是8 bit
,也就是一个字节长度;而UTF-16
的代码单元则是16 bit
,也就是两个字节长度。
在字符集中每一个字符都有自己对应的唯一的编号,这个编号就叫做代码点。
不同的编码方式,表示字符的代码点的位数都不一定相同,但是都会选择用一个最短的比特长度做一个单位,这个单位就叫代码单元。
比如UTF-8
的代码单元是8 bit
,也就是一个字节长度;而UTF-16
的代码单元则是16 bit
,也就是两个字节长度。