bit又名比特、位,简称b,是计算机硬盘中的最小存储单位,是二进制中的一个数位“0”或数位“1”,1bit所代表的数据对我们而言毫无意义,因为其不能构成人类可读信息的基本单位,只表示可以衡量信息的可能性的多少。例如用2个bit代表一个可读信息的基本单位,那么只有2^2=4种可能性,英文字母中只能表示abcd,后面其他的英文字母就无法表示了。
有足够的可能性,一开始是以8个bit代表一个可读信息的基本单位,具有2^8=256种可能性,可以表示所有的现代美国英语字母以及一些常用字符,以此方法进行编码称为ASCII编码。在ASCII编码下,8bit代表一个可读信息基本单位,即8bit=1byte(比特,简称B)被确定了下来。后来,各非英语语言国家发现,表示自己国家的语言需要的编码位远远超过ASCII的容纳范围,每个国家又推出了针对自己语言的不同编码方式,但这些编码方式之间在相互转换过程中又非常麻烦。后来由ISO和UNICODE组织牵头,编写了UNICODE编码(国际码),可以表示各国语言,这也随之成为了业界标准。
在UNICDOE编码下,一个基本可读数据单位可能为16位或32位,因为8bit=1byte之前已经被作为标准确定下来,所以不再进行更改,因此认为UNICDOE编码下一个基本可读数据单位长度为2byte或4byte。