ASCII码
使用7个bits就可以完全表示ASCII码,包含95个可打印字符,33个不可打印字符
ASCII码因为很多应用或者国家中的符号都无法表示(数学的乘除、大于等于等符号),因此后续对ASCII码进行了扩充,扩充的编码称为extended ascii码
Extend ASCII码
在ASCII码的基础上的拓展,但是还是无法表示全部国家的编码
字符编码集的国际化
因为欧洲、中亚、东亚、拉丁美洲国家的语言多样性
语言体系不一样,不以有限字符组合的语言(如中文、韩文、日文)等问题,因此编码开始国际化
中文编码集
GB2312
1980年发明的,称为《信息交换用汉字编码字符集–基本集》
GB2312一共收录了7445个字符包括6763个汉字和682个其他字符
但是GB2312不符合国际标准
GBK
因GB2312不符合国际标准,所以1995年推出了GBK编码
GBK称为《汉字内码扩展规范》,向下兼容GB2312,向上支持国际ISO标准
收录了21003个汉字,支持全部中日韩汉字,但是还是存在无法兼容外国内容的问题
Unicode
unicode称为统一码,万国码,单一码,兼容全球的字符集,兼容全世界所有的语言
unicode定义了世界通用的字符集,使用UTF-*实现了编码
UTF-8以字节为单位对unicode进行编码