字符编码——一些基本概念

本文介绍了字符编码的基本概念,包括字符、存储空间、字符编号、字符集与字符编码的区别。字符编码涉及ASCII、GB2312、Unicode等,强调字符集如GBK是双字节字符集,而UTF-8则根据字符不同占用1-4个字节。编码和解码是信息转换过程,字符编码定义了字符到字节流的映射规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇介绍字符编码中的常规知识

字符

字符是具有语义值的最小文本单元,是各种文字和符号的总称
包括各个国家文字、标点符号、图形符号、数字等。
比如字母’a’,符号’@’,汉字’中’等,每个字符都代表某种含义。

存储空间

很多人对字符有一个误解:英文占一个字节,汉字占两个字节
这种说法是极其不严谨的,原因如下:

  • 是否是OSD中所占有的存储空间
  • 是否是在传输协议中占用的存储空间

一个字符所占用的存储空间是根据实际情况下来看的

  • 在字库中:看你选用的是什么字库,点阵字库还是矢量字库。若是点阵字库的话字库的尺寸如何,若8x8则是8byte、16x16则是32byte。这一点可以参考点阵字库与矢量字库

  • 在传输中:选用的是什么字符集的编码方式,ASCII 英文一个字节
    gb2312,gbk 中文两个字节,英文一个字节
    在中文系统中ansi一般指gb2312或gbk

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Spark!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值