1、很早以前,人们发现8 个晶体管在一起,最为稳定,于是称8个位为一个“字节”
2、8个字节,可以有256个不同状态,美国人把0-127用来存储大小写英文字母、数字及一些符号。这就是ASCII
3、后来,各个国家也开始使用计算机,他们觉得127个编码不够,就把128-255也用起来了,这就是ASCII 的扩展字符集。
4、即便是这样,还是不够,等到中国人用的时候,远远不够,于是国人把128-255的扩展字符取消掉了,规定,若为汉字,则用两个0-127,来表示,这样就可以表示约7000多个字了,这个方案被称为“GB2312”
5、世界各地的人们都碰到了中国的类似的问题,于是ISO废除了散乱的编码方案,重新搞了一个,囊括地球上所有的字母、符号。这就是“unicode”,它用16位来表示一个字符,其中英文符号还是保留,其高位永远为0。只不过这个方案存储时,空间会浪费一些。
6、由于计算机网络传输系统传送的问题,unicode 如何传送在网络上是个问题,于是utf-8产生了,实现unicode 与utf-8的对应。网页中编码常使用“utf-8”