为什么会有这么多种编码方式?
为什么会有乱码?
英文怎么没有乱码?
unicode和UTF-8是一回事儿吗?
如何判断一段文字是使用哪种编码方式?
还有两个base64和url encode, 这是什么鬼东西?
显示中的文字
我们为什么能在显示屏上看到文字?一定要有一个应用程序通过某个组件,将文字显示出来。应用程序可以是浏览器, 系统程序, 普通应用程序。通过给组件设定某个属性,如text属性。 要想显示某个字,除了知道这个字的编码,还要确定使用哪种字体。字体文件中通常包含一个编码和样式的对照表,对照表中使用的编码可能是Unicode,也可能是不存在的。
字符串转换–>猜测编码–> 选择Font --> 显示
根据上面的过程, 出现乱码,基本就有两种原因
- 转换过程中出错
- 编码猜错了(或者没有猜测,仅支持一种文字编码)
- 选择的Font不包括要显示的文字

Excel VBA 编辑器

上面的乱码是哪种错误呢?

上面这种乱码就是字体中文字不全造成的。
Unicode和UTF-8的转换关系

例子:
https://www.compart.com/en/unicode/U+8A9E
传输中的文字
发送和接收方必须明确知道编码方式,不能使用猜的方法。 否则很容易出现乱码。
字符和字符串
本文深入探讨了文字编码的原理,解释了乱码产生的原因,包括转换错误和字体缺失,并详细阐述了Unicode与UTF-8的关系,以及如何正确处理字符和字符串在不同场景下的编码问题。
378

被折叠的 条评论
为什么被折叠?



