常用中文字符用utf-8编码占用3个字节(大约2万多字),但超大字符集中的更大多数汉字要占4个字节(在unicode编码体系中,U+20000开始有5万多汉字)。 GBK、GB2312收编的汉字占2个字节,严格地用iso8859-1无法表示汉字,只能转为问号。
UTF-8,GBK,GB2312,iso8859-1字节比较
最新推荐文章于 2023-07-23 20:50:34 发布
本文详细介绍了中文字符在不同编码体系下的占用字节数,包括UTF-8、GBK、GB2312等常见编码方式,并指出ISO8859-1无法正确表示汉字的问题。
396

被折叠的 条评论
为什么被折叠?



