数据编码与表示-优快云博客

本文链接：https://blog.youkuaiyun.com/pk_20140716/article/details/104649666

重要的人机界面
由符号组成
为每个符号进行编码，由输入/输出设备进行转换
一般以字符串的形式在计算机存储器中存放
字符集编码标准
ASCII
UNICODE
UTF-8
ascii字符编码
采用7位二进制编码，占用一个字节
表示128个西文字符
ascii码字符集
unicode编码
使用16位表示一个字符，可表示65536个字符
将整个编码空间划分为块，每块为16的整数倍，按块进行分配
保留6400个码点供本地使用
依然无法覆盖所有字符
utf-8编码

字符位数	字节1	字节2	字节3	字节4	字节5	字节6
7	0ddddddd
11	110ddddd	10dddddd
16	1110dddd	10dddddd	10dddddd
21	11110ddd	10dddddd	10dddddd	10dddddd
26	111110dd	10dddddd	10dddddd	10dddddd	10dddddd
31	1111110d	10dddddd	10dddddd	10dddddd	10dddddd	10dddddd

变长字符编码，提高存储空间利用率
字符长度由首字节确定
字符首字节外，均以“10”开始，可自同步
可扩展性强
成为互联网上占据统治地位的字符集

进位计数法
$\sum_{i=m}^{-k}{D_{i}R^{i}}$
N表示某个数值
r表示这个数的基数
i表示这些符号排列的位号
$D_{i}$ 是位号为i的位上的一个符号
$r^{i}$ 是位号i的位上的一个1代表的值

二进制
r=2，基本符号 0 1
八进制
r=8，基本符号0 1 2 3 4 5 6 7
十进制
r=10，基本符号0 1 2 3 4 5 6 7 8 9
十六进制
r=16，基本符号0 1 2 3 4 5 6 7 8 9 A B C D E F
计算机采用二进制

二进制整数的进位表示法
具体到n位无符号二进制整数，如
$b_{n-1}b_{n-2}...b_{1}$
其中 $b_{i}$ 为0或1
表示的值为N= $\sum_{i=0}^{n-1}{b_{i}2^{i}}$
可表示的范围为0------ $2^{n}-1$ ，共 $2^{n}$ 个数。

负数表现形式
原码：符号位||数的绝对值
反码：符号位||数值
补码：反码的最低位+1

补码与真值的对应

补码求真值
N= $-b_{n-1}*2^{n-1}+\sum_{i=0}^{n-2}{b_{i}2^{i}}$
真值求补码
正数的补码是绝对值原码
负数的补码是绝对值原码按位求反后，再在最低位加1
补码的加法运算
加法运算符号位和数据位同样计算
[x+y]补=[x]补+[y]补
[x]补与[-x]补
[x]补在同符号位内，逐位求反，再在最低位加1，即可得[-x]补