
其他
harrisonlee.net
这个作者很懒,什么都没留下…
展开
-
UTF-8、UTF-16、UTF-32及其各自的实现方式
背景 上述三种编码都是对Unicode字符集的实现,前两者使用变长方式,最后一种使用定长的方式。三种中,最早出现的是UTF-16,是为了弥补UCS-2的缺陷,因为UCS-2使用定长16bits的编码方式,当时IEEE提出了UCS-4但惨遭拒绝,有点类似当今的UTF-32,原因是空间浪费大。所以此时UTF-16登场了。UTF的全称是:Unicode (or Universal Coded Chara...原创 2020-01-07 15:11:35 · 935 阅读 · 0 评论 -
字符集和编码
乱码是我们日常开发中经常遇到的问题,而且每次感觉都很棘手,所以很有必要来深入分析一下这个问题。 首先,什么是字符集和编码。 字符集,可以看作是字符的一种映射。比如Unicode的映射目标就是一种数字,叫做码点(code point)。除了Unicode还有其他一些字符集,比如我国的GBK,GB2312,GB18030, 欧洲的ISO-8859-1等,这些字符集的区别不是本文的重点,只要清楚字符集到...原创 2020-01-06 15:08:13 · 237 阅读 · 0 评论