
字符编码
文章平均质量分 77
子虚
这个作者很懒,什么都没留下…
展开
-
关于编码: ascii(ansi), gb-2312, unicode, utf8(续)
一、1. 最早,只有ascii码,美国使用。1个字节8位,只用了后7位(0-127),表示了英语中一般的字符以及数字、字母;2.计算机普及,中国对ascii码进行扩展GB2312,两个字节表示一个汉字(原ascii码的英文继续由1个字节表示);注意:如果说汉字的ascii码(注意,下面会提到),其实指的是gb23123.越来越多的国家都使用计转载 2012-05-10 11:24:40 · 1354 阅读 · 0 评论 -
关于编码: ascii(ansi), gb-2312, unicode, utf8
很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为"字节"。 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去。他们看到这样是好的,于是它们就这机器称为"计算机"。 开始计算机只在美国用。八位的字节一共可以组合出256转载 2012-05-10 11:20:45 · 986 阅读 · 0 评论 -
unicode编码表
unicode编码表1 unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制,2的16次方等于65536,所以UCS-2最多能编码6553转载 2012-05-10 14:15:33 · 88213 阅读 · 0 评论 -
GBK编码表
GBK 汉字内码扩展规范编码表(二) 全国信息技术标准化技术委员会 汉字内码扩展规范(GBK) ChineseInternal Code Specification 1.0 版 (按分类顺序排列) ● GBK/1:GB2312非汉字符号 A1 0 1 23 4 5 6 7 8 9 A B C D E FA转载 2012-10-10 16:36:09 · 59391 阅读 · 0 评论