编解码是什么?做什么的?
- 也简称为编码方式。计算机只能存储、传输和处理二进制的数据,编解码就是帮助人与计算机沟通的工具
- 编码:将文本转化为二进制信息;解码:将二进制信息解析为文本
- 乱码的产生:通过一种编码方式存储的信息用另外一种编码方式解码
编解码方式的发展
ASCII 码(美国信息交换标准代码)
- ASCII 码是 20 世纪 60 年代美国指定的一套编码方式,对常用字符做了编码
- ASCII 码用一个字节的后七位规定了共 128 个字符的编码,第一位统一规定为 0
Unicode
- 每个国家的字符都有区别,所以都自己规定了一套编码方式,导致同一个二进制会被解码为不同的字符
- 这时 Unicode 应运而生,它并不是一种编码方式,它规定了世界上所有常用字符对应的二进制
UTF-8
- UTF-8 是目前互联网上使用最为广泛的一种 Unicode 的实现方式
- 是一种可变长的编码方式,它最大限度地节省了存储字符需要的空间,这也是它受欢迎的主要原因之一
GBK 编码方式
- UTF-8 对世界上所有常用字符做了编码,其中汉字大多数需要占用 3 个字节
- 最常用的中文编码方式,是在 GB2312 标准基础上的扩展规范,使用了双字节编码方式
- 共收录了 21003 个汉字,完全兼容 GB2312 标准,同时支持繁体汉字以及日韩文字等