字节
由于电路实现上的原因,计算机的计数方式为二进制,即由0和1组成。二进制与十进制的对应关系如下。
二进制 | 十进制 |
---|---|
0 | 0 |
1 | 1 |
10 | 2 |
11 | 3 |
100 | 4 |
101 | 5 |
二进制的计算规则是2进1。二进制转十进制计算公式为
dec = 2^(n-1)+x*2^(n-2)+...+x*2^0
比如二进制1001的十进制为2^3+1=9
对于计算机而言,一个0或者1表示1位。比如:101就是3位,英文为3-bit
8-bit组成一个字节,英文为1-byte
那么1-byte能表达多少数呢?
即0000 0000 ~ 1111 1111,转化为10进制即0-255共256个数。
在计算机领域,这256个数可以有多种不同的表示。在ASCII编码上,每个数代表一个符号;在整数领域。代表0-255共256个整数。
为了方便的表示字节,一般采用16进制的形式。16进制与二进制和十进制的对应关系如下。
二进制 | 十进制 | 16进制 |
---|---|---|
0000 | 0 | 0 |
0001 | 1 | 1 |
0010 | 2 | 2 |
0011 | 3 | 3 |
0100 | 4 | 4 |
0101 | 5 | 5 |
0110 | 6 | 6 |
0111 | 7 | 7 |
1000 | 8 | 8 |
1001 | 9 | 9 |
1010 | 10 | a |
1011 | 11 | b |
1100 | 12 | c |
1101 | 13 | d |
1110 | 14 | e |
1111 | 15 | f |
使用16进制表达一个字节是为了方便的转换2进制,比如:
0xff
可以很快算出二进制为1111 1111
0xab
等于1010 1011
总而言之,1个字节就是8个位,一般用16进制表示。计算范围为0~256
字节码
字节码是采用字节为单位的编码。以Java虚拟机读取的字节码为例。假设有一个Java程序为输出Hello world
public class HelloWorld
{
/**
* The old standby!
* @param args The parameters are ignored.
*/
public static void main(String... args) {
System.out.println("Hello World!");
}
}
经过javac
生成的.class文件为01组成的文件,使用vs code的hexeditor
插件打开后可看到
上图中紧挨着的2个数字或者字母就是用16进制表达的1个字节。这些字节根据Java虚拟机规范的要求在不同的位置表达不同的意思。针对这些字节的编码被称为字节码。
字节码文件
由javac生成的.class文件被称为字节码文件。
字节码文件中表达含义的编码和内容必须按照虚拟机规范。
比如,文件的头4个字节代表magic
,至于什么是magic
后续解释。
字节码指令
前面已经讲过JVM是纯软件实现的栈式虚拟机,而栈式虚拟机为了执行相关的运算或者访问内存的操作则会提供一些指令。由于虚拟机时纯软件模拟的仿真计算机,那么这些指令可以脱离平台指令实现。这就是为什么Java总说是平台无关的。
而这些由虚拟机提供的指令被称为字节码指令。其含义是指令由字节组成。上面已经说过了,1个字节可以表达0-255共256个数。Java虚拟机规范利用这256个数的其中一部分表示栈式虚拟机的操作 。
比如,0x1A表示将第一个int型本地变量推送至栈顶。
在字节码文件中有一部分就是表示这些指令。
这3个字节分别表示下面3条指令。
iload_0
iconst_2
if_icmpge
上述指令可由javap工具分析Helloworld.class文件查看
使用字节码的好处
计算机一般是一个字节一个字节的读取数据,使用字节进行编码符合计算机的读取数据的流程。不管是本机还是网络都很方便。除此之外,使用16进制解码工具查看也很方便。第三,使用通用的字节码指令针对的是纯软件的虚拟机,其内容与平台无关。因此使用字节码的程序很方便移植,甚至可以说不需要任何操作,直接放在有Java虚拟机的机器上运行即可,实现了一次编译,处处运行。