编码发展历程
编码格式 | 介绍 |
---|---|
ASCII | 英文字符、数字、空格、回车等 |
ISO-8859-* | 西欧常用,支持德法俩国字符,兼容ASCII |
GB2312 | 支持简体中文字符,兼容ASCII |
GBK | GB2312的扩展,支持繁体中文 |
GB18030 | GBK的扩展,支持少数民族字符 |
BIG5 | 台湾地区常用,支持繁体中文 |
UTF-8 UTF-* | 统一码,全球通用 |
ANSI | 不同操作系统中表示为不同的编码格式,eg:简体windows中ANSI代表GBK,繁体windows中ANSI代表BIG5 |
常用编码字符大小
编码格式 | 英文字符 | 中文字符 |
---|---|---|
ASCII | 1byte | - |
GB 2312/GBK | 1byte | 2byte |
UTF-8 | 1byte | 3~4byte |
… | … | … |