-
术语
-
编码
-
将英文,汉语,符号等转化二进制数.
-
-
解码
-
将二进制数解析显示成英文,汉语,符号等.
-
解码时使用了错误的解码规则,会导致解析错误或乱码.
-
-
字符
-
各种文字和符号的总称.
-
包括各国文字,标点符号,图形符号,数字等.
-
-
字符集Charset
-
一个系统支持的所有抽象字符的集合.
-
-
字符编码Character Encoding
-
一套法则.
-
用于将字符转化为计算机可以接受的数字代码.
-
-
-
常用字符集和字符编码
-
ASCII
-
American Standard Code forInformation Interchange,美国信息交换标准代码
-
基于拉丁字母的一套电脑编码系统.
-
主要用于显示现代英语.
-
使用七位二进制表示一个字符,共有128个字符.
-
-
GBXXXX
-
将汉字转化为计算机可以接受的数字系统的数.
-
每个汉字使用一个16位二进制表示,称为”全角”
-
包含两个大于8位二进制的字节
-
每个字符均大于127
-
-
兼容ASCII码,由七位二进制组成,称为”半角”
-
GB2312或GB2312-80或GB0
-
中国国家标准简体中文字符集
-
全称《信息交换用汉字编码字符集·基本集》
-
由中国国家标准总局发布,1981年5月1日实施。
-
通行于中国大陆;新加坡等地.
-
中国大陆几乎所有的中文系统和国际化的软件都支持GB2312.
-
包含大约7000个简体汉字
-
不能处理人名、古汉语等
-
-
GBK
-
GBK是对GB2310-80的扩展
-
由微软制定
-
非国家标准,被中国公布为“技术规范指导性文件”
-
包含简体中文、台湾和香港的繁体字、日语及朝鲜语汉字等。
-
-
GB18030
-
全称:国家标准GB 18030-2005《信息技术中文编码字符集》
-
现行版本由国家质监总局和中国国家标准委员会于2005年11月8日发布,2006年5月1日实施。为中国境内所有软件产品支持的强制规格。
-
与GB2312-1980完全兼容,与GBK基本兼容
-
支持GB13000及Unicode的全部统一汉字
-
共收录汉字70244个
-
与UTF-8相同,采用多字节编码,每个字可以由1个、2个或4个字节组成。
-
编码空间庞大,最多可定义161万个字符。
-
支持中国国内少数民族的文字、繁体汉字以及日韩汉字
-
-
-
BIG5
-
繁体中文社区常用。
-
-
-
Unicode 统一码 万国码 标准万国码 单一码
-
伟大的创想
-
解决全球网络化的文字乱码问题
-
由4个字节组成
-
基于通用字符集(Universal Character Set)的标准
-
由非营利性组织-Unicode发布
-
-
UCS & UNICODE
-
基于ISO 10646标准字符集
-
-
UTF-32
-
所有字符采用四个字节
-
-
UTF-16
-
所有字符采用二个字节
-
-
UTF-8
-
可变长度字符编码
-
128个US-ASCII字符只需一个字节编码
-
带个附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母使用两个字节编码
-
其他基本多文种平面(BMP)中的字符(包含大部分常用字)使用三个字节编码
-
其他极少使用的Unicode辅助平面的字符使用四字节编码。
-
-
网络最通用
-
-
字符集与字符编码
最新推荐文章于 2024-08-11 08:30:00 发布