一、相关概念
1、Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码,1 个unicode字符可以为1、2、3、4字节,这取决于unicode的值。
2、UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。1 个UTF8字符占 1个字节。
3、字节(Byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,一个字节等于8位二进制数。
4、数据存储是以“字节”(Byte)为单位,数据传输是以“位”(bit)为单位,一个位就代表一个0或1(即二进制),每 8 个位(bit)组成一个字节(Byte)。8bit = 1Byte ,数据存储是以 10 进制表示,数据传输是以2进制表示所以 1KB 不等于 1000B,1KB=1024B,1KB=1024Byte=1024×8bit。
二、常用数据类型对应字节数
32位编译器:
char :1个字节
char*(即指针变量): 4个字节(32位的寻址空间是2^32, 即32个bit,也就是4个字节。同理64位编译器)
short int : 2个字节
int: 4个字节
unsigned int : 4个字节
float: 4个字节
double: 8个字节
long: 4个字节
long long: 8个字节
unsigned long: 4个字节
64位编译器:
char :1个字节
char*(即指针变量): 8个字节
short int : 2个字节
int: 4个字节
unsigned int : 4个字节
float: 4个字节
double: 8个字节
long: 8个字节
long long: 8个字节
unsigned long: 8个字节
摘自http://www.cnblogs.com/augellis/archive/2009/09/29/1576501.html和百度百科
本文详细介绍了Unicode、UTF-8等字符编码的概念,并对比了32位与64位编译器下常见数据类型的字节数差异。
3388

被折叠的 条评论
为什么被折叠?



