java虚拟机

本文深入探讨Java虚拟机的原理、结构和运行机制,详细阐述其关键组成部分及其作用,包括指令集、寄存器、栈、无用单元收集堆和方法区。同时,解释Java虚拟机如何通过字节码实现跨平台性,以及其运行过程,为开发者提供深入理解Java虚拟机的必要知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

定义

  Java 虚拟机 (Java Virtual Machine 简称JVM)是运行所有Java程序的抽象计算机,是 Java语言 的运行环境,它是Java 最具吸引力的特性之一。

编辑本段简介

  Java 虚拟机 (JVM)一种用于计算机设备的规范,可用不同的方式( 软件 或硬件)加以实现。编译虚拟机的 指令集 与编译 微处理器 的指令集非常类似。Java虚拟机包括一套 字节码 指令集、一组 寄存器 、一个栈、一个 垃圾回收 堆和一个存储方法域。
  Java虚拟机(JVM)是可运行Java代码的假想计算机。只要根据JVM规格描述将 解释器 移植到特定的计算机上,就能保证经过编译的任何Java代码能够在该系统上运行。
  Java虚拟机是一个想象中的机器,在实际的计算机上通过软件模拟来实现。Java虚拟机有自己想象中的硬件,如处理器、堆栈、寄存器等,还具有相应的指令系统。

编辑本段特点

  Java语言的一个非常重要的特点就是与平台的无关性。而使用Java 虚拟机 是实现这一特点的关键。一般的高级语言如果要在不同的平台上运行,至少需要编译成不同的 目标代码 。而引入Java语言虚拟机后, Java语言 在不同平台上运行时不需要重新编译。Java语言使用模式Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言 编译程序 只需生成在Java虚拟机上运行的目标代码( 字节码 ),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的 机器指令 执行。

编辑本段使用主体

  Java 虚拟机 是Java语言底层实现的基础,对Java语言感兴趣的人都应对Java虚拟机有个大概的了解。这有助于理解Java语言的一些性质,也有助于使用Java语言。对于要在特定平台上实现Java虚拟机的 软件 人员,Java语言的 编译器 作者以及要用硬件 芯片 实现Java虚拟机的人来说,则必须深刻理解Java虚拟机的规范。另外,如果你想扩展Java语言,或是把其它语言编译成Java语言的 字节码 ,你也需要深入地了解Java虚拟机。

编辑本段安装方法

  
   java虚拟机安装方法

java虚拟机安装方法

[1]
下载解压
  下载j2sdk-1_4_2_05-linux-i586.bin随便放到一个目录里, 比如 /tmp。
  在 终端 里输入:sh j2sdk-1_4_2_05-linux-i586.bin回车
  之后会出现一堆 软件 说明,按回车n次直到问你yes or no,当然回答yes,输入y,回车后开始 解压缩
  完成之后,在/tmp里就会出现一个名为j2sdk1.4.2_05的文件夹。
   安装
  安装很简单:将j2sdk1.4.2_05文件夹复制到/usr目录里。
  设置 环境变量
  只有设置好环境变量,系统才能调用java 虚拟环境
  打开/etc/profile文件,在相关位置中加入:
  export JAVA_HOME=/usr/j2sdk1.4.2_05
  export PATH=/usr/j2sdk1.4.2_05/bin:$PATH
  export CLASSPATH=/usr/j2sdk1.4.2_05/lib:/usr/j2sdk1.4.2_05/jre/lib:.:
   保存  
 设置中文 字体
  注意:下面涉及到的文件请先备份,以防万一!
  进入/usr/j2sdk1.4.2_05/jre/lib/文件夹
  删除里面所有带.zn的文档,只留下font.properties.zh文档。
  安装simsun字体如果不喜欢simsun可以不装。
  编辑font.properties.zh,将所有-tlc-song-medium-r-normal--*-%d-*-*-c-*-gbk-0 替换成:
  -misc-simsun-medium-r-normal--*-%d-*-*-c-*-gbk-0(如果没装simsun字体,可以将-simsun-那里改成你喜欢的字体,前提是该字体在系统中存在)
  之后在终端中转到目录/usr/j2sdk1.4.2_05/jre/bin/下
  输入命令:
  ./ControlPanel回车

编辑本段支持的数据类型

  Java 虚拟机 支持Java语言的基本数据类型如下:
  byte://1字节有符号整数的补码
  short://2 字节 有符号整数的补码
  int://4字节有符号整数的补码
  long://8字节有符号整数的补码
  float://4字节IEEE754 单精度浮点数
  double://8字节IEEE754 双精度浮点数
  char://2字节无符号Unicode 字符
  几乎所有的Java类型检查都是在编译时完成的。上面列出的原始 数据类型 的数据在Java执行时不需要用硬件标记。操作这些原始数据类型数据的 字节码 (指令)本身就已经指出了 操作数 的数据类型,例如iadd、ladd、fadd和dadd指令都是把两个数相加,其操作数类型别是int、long、float和double。虚拟机没有给boolean(布尔)类型设置单独的指令。boolean型的数据是由integer指令,包括integer返回来处理的。boolean型的 数组 则是用byte数组来处理的。虚拟机使用IEEE754格式的浮点数。不支持 IEEE 格式的较旧的计算机,在运行Java数值计算程序时,可能会非常慢。
  虚拟机支持的其它数据类型包括:
  object//对一个Javaobject(对象)的4字节引用
  returnAddress//4字节,用于jsr/ret/jsr-w/ret-w指令
  注:Java数组被当作object处理。
  虚拟机的规范对于object内部的结构没有任何特殊的要求。在Sun公司的实现中,对object的引用是一个句柄,其中包含一对 指针 :一个指针指向该object的方法表,另一个指向该object的数据。用Java虚拟机的字节码表示的程序应该遵守类型规定。Java虚拟机的实现应拒绝执行违反了类型规定的字节码程序。Java虚拟机由于字节码定义的限制似乎只能运行于32位 地址空间 的机器上。但是可以创建一个Java虚拟机,它自动地把字节码转换成64位的形式。从Java虚拟机支持的数据类型可以看出,Java对数据类型的内部格式进行了严格规定,这样使得各种Java虚拟机的实现对数据的解释是相同的,从而保证了Java的与平台无关性和可移植性。

编辑本段JVM规格描述

  JVM的设计目标是提供一个基于抽象规格描述的计算机模型,为解释程序开发人员提范的任何系统上运行。JVM对其实现的某些方面给出了具体的定义,特别是对Java 可执行代码 ,即 字节码 (Bytecode)的格式给出了明确的规格。这一规格包括 操作码 操作数 的语法和数值、 标识符 的数值表示方式、以及Java类文件中的Java对象、 常量缓冲 池在JVM的存储映象。这些定义为JVM 解释器 开发人员提供了所需的信息和开发环境。Java的设计者希望给开发人员以随心所欲使用Java的自由。
  JVM定义了控制Java代码 解释执行 和具体实现的五种规格,它们是:
  *JVM 指令系统
  *JVM 寄存器
  *JVM栈结构
  *JVM碎片回收堆
  *JVM存储区

JVM指令系统

  JVM指令系统同其他计算机的指令系统极其相似。Java指令也是由  操作码 和操作数两部分组成。操作码为8位二进制数, 操作数 进紧随在操作码的后面,其长度根据需要而不同。操作码用于指定一条指令操作的性质(在这里我们采用汇编符号的形式进行说明),如iload表示从 存储器 中装入一个整数,anewarray表示为一个新 数组 分配空间,iand表示两个整数的"与",ret用于 流程控制 ,表示从对某一方法的调用中返回。当长度大于8位时,操作数被分为两个以上 字节 存放。JVM采用了"big endian"的编码方式来处理这种情况,即高位bits存放在低字节中。这同 Motorola及其他的RISC CPU采用的 编码方式 是一致的,而与Intel采用的"little endian "的编码方式即低位bits存放在低位字节的方法不同。Java指令系统是以Java语言的实现为目的设计的,其中包含了用于调用方法和监视多线程系统的指令。Java的8位操作码的长度使得JVM最多有256种指令,目前已使用了160多种操作码。

JVM寄存器

  所有的CPU均包含用于保存系统状态和处理器所需信息的 寄存器组 。如果 虚拟机 定义较多的 寄存器 ,便可以从中得到更多的信息而不必对栈或内存进行访问,这有利于提高运行速度。然而,如果虚拟机中的寄存器比实际CPU的寄存器多,在实现虚拟机时就会占用处理器大量的时间来用常规 存储器 模拟寄存器,这反而会降低虚拟机的效率。针对这种情况,JVM只设置了4个最为常用的寄存器。它们是:pc 程序计数器  optop 操作数 栈顶 指针  frame当前执行环境指针 vars指向当前执行环境中第一个 局部变量 的指针 所有寄存器均为32位。pc用于记录程序的执行。optop,frame和vars用于记录指向Java栈区的指针。

JVM栈结构

  作为基于栈结构的计算机,Java栈是JVM存储信息的主要方法。当JVM得到一个Java 字节码 应用程序 后,便为该代码中一个类的每一个方法创建一个栈框架,以保存该方法的状态信息。每个栈框架包括以下三类信息:局部 变量  执行环境  操作数 栈  局部变量 用于存储一个类的方法中所用到的局部变量。vars 寄存器 指向该变量表中的第一个局部变量。
  执行环境用于保存 解释器 对Java字节码进行解释过程中所需的信息。它们是:上次调用的方法、局部变量 指针 和操作数栈的栈顶和栈底指针。执行环境是一个执行一个方法的控制中心。例如:如果解释器要执行iadd(整数加法),首先要从frame寄存器中找到当前执行环境,而后便从执行环境中找到操作数栈,从栈顶弹出两个整数进行加法运算,最后将结果压入栈顶。
  操作数栈用于存储运算所需操作数及运算的结果。

JVM碎片回收堆

  Java类的实例所需的 存储空间 是在堆上分配的。 解释器 具体承担为类实例分配空间的工作。解释器在为一个实例分配完存储空间后,便开始记录对该实例所占用的内存区域的使用。一旦对象使用完毕,便将其回收到堆中。在Java语言中,除了new语句外没有其他方法为一对象申请和释放内存。对内存进行释放和回收的工作是由Java运行系统承担的。这允许Java运行系统的设计者自己决定碎片回收的方法。在SUN公司开发的Java解释器和Hot Java环境中,碎片回收用 后台 线程的方式来执行。这不但为运行系统提供了良好的性能,而且使 程序设计 人员摆脱了自己控制内存使用的风险。

JVM存储区

  JVM有两类存储区: 常量缓冲 池和方法区。常量缓冲池用于存储类名称、方法和字段名称以及串常量。方法区则用于存储Java方法的 字节码 。对于这两种 存储区域 具体实现方式在JVM规格中没有明确规定。这使得Java 应用程序 的存储布局必须在运行过程中确定,依赖于具体平台的实现方式。JVM是为Java字节码定义的一种独立于具体平台的规格描述,是 Java平台 独立性的基础。目前的JVM还存在一些限制和不足,有待于进一步的完善,但无论如何,JVM的思想是成功的。对比分析:如果把Java原程序想象成我们的C++原程序,Java原程序编译后生成的字节码就相当于C++原程序编译后的80x86的 机器码 (二进制 程序文件 ),JVM 虚拟机 相当于80x86 计算机系统 ,Java 解释器 相当于80x86CPU。在80x86CPU上运行的是机器码,在Java解释器上运行的是Java字节码。
  Java解释器相当于运行Java字节码的“CPU”,但该“CPU”不是通过硬件实现的,而是用 软件 实现的。Java解释器实际上就是特定的平台下的一个应用程序。只要实现了特定平台下的解释器程序,Java字节码就能通过解释器程序在该平台下运行,这是Java跨平台的根本。当前,并不是在所有的平台下都有相应Java解释器程序,这也是Java并不能在所有的平台下都能运行的原因,它只能在已实现了Java解释器程序的平台下运行。

编辑本段体系结构

  Java 虚拟机 由五个部分组成:一组 指令集 、一组 寄存器 、一个 、一个无用单元收集堆(Garbage-collected-heap)、一个方法区域。这五部分是Java虚拟机的逻辑成份,不依赖任何实现技术或组织方式,但它们的功能必须在真实机器上以某种方式实现。

Java指令集

  Java 虚拟机 支持大约248个 字节码 。每个字节码执行一种基本的CPU运算,例如,把一个整数加到 寄存器 子程序 转移等。Java 指令集 相当于Java程序的汇编语言。
  Java指令集中的指令包含一个单字节的操作符,用于指定要执行的操作,还有0个或多个 操作数 ,提供操作所需的参数或数据。许多指令没有操作数,仅由一个单字节的操作符构成。
  虚拟机的内层循环的执行过程如下:
  do{
  取一个操作符字节;
  根据操作符的值执行一个动作;
  }while(程序未结束)
  由于 指令系统 的简单性,使得虚拟机执行的过程十分简单,从而有利于提高执行的效率。指令中操作数的数量和大小是由操作符决定的。如果操作数比一个 字节 大,那么它存储的顺序是高位字节优先。例如,一个16位的参数存放时占用两个字节,其值为:
  第一个字节*256+第二个字节字节码 指令流 一般只是 字节对齐 的。指令tabltch和lookup是例外,在这两条指令内部要求强制的4字节 边界对齐

寄存器

  Java 虚拟机 寄存器 用于保存机器的运行状态,与微处理器中的某些专用寄存器类似。
  Java虚拟机的寄存器有四种:
  pc:Java 程序计数器
  optop:指向 操作数 栈顶端的 指针
  frame:指向当前执行方法的执行环境的指针。
  vars:指向当前执行方法的 局部变量 区第一个变量的指针。

  Java 虚拟机 的栈有三个区域: 局部变量 区、运行环境区、 操作数 区。
  ⑴局部变量区 每个Java方法使用一个固定大小的局部变量集。它们按照与vars 寄存器 的字 偏移量 来寻址。局部变量都是32位的。长整数和 双精度浮点数 占据了两个局部变量的空间,却按照第一个局部变量的索引来寻址。(例如,一个具有索引n的局部变量,如果是一个双精度浮点数,那么它实际占据了索引n和n+1所代表的 存储空间 。)虚拟机规范并不要求在局部变量中的64位的值是64位对齐的。虚拟机提供了把局部变量中的值装载到操作数栈的指令,也提供了把操作数栈中的值写入局部变量的指令。
  ⑵运行环境区 在运行环境中包含的信息用于 动态链接 ,正常的方法返回以及 异常传播
   ·动态链接
  运行环境包括对指向当前类和当前方法的 解释器 符号表 指针 ,用于支持方法代码的动态链接。方法的 class文件 代码在引用要调用的方法和要访问的 变量 时使用符号。动态链接把符号形式的方法调用翻译成实际方法调用,装载必要的类以解释还没有定义的符号,并把变量访问翻译成与这些变量运行时的 存储结构 相应的 偏移地址 。动态链接方法和变量使得方法中使用的其它类的变化不会影响到本程序的代码。
  ·正常的方法返回
  如果当前方法正常地结束了,在执行了一条具有正确类型的返回指令时,调用的方法会得到一个返回值。执行环境在正常返回的情况下用于恢复调用者的寄存器,并把调用者的 程序计数器 增加一个恰当的数值,以跳过已执行过的方法调用指令,然后在调用者的执行环境中继续执行下去。
   ·异常和错误传播
  异常情况在Java中被称作Error(错误)或Exception(异常),是Throwable类的子类,在程序中的原因是:①动态链接错,如无法找到所需的class文件。②运行时错,如对一个空指针的引用
   ·程序使用了throw语句。
  当异常发生时,Java虚拟机采取如下措施:
  ·检查与当前方法相联系的catch子句表。每个catch子句包含其有效指令范围,能够处理的异常类型,以及处理异常的代码块地址。
  ·与异常相匹配的catch子句应该符合下面的条件:造成异常的指令在其指令范围之内,发生的异常类型是其能处理的异常类型的子类型。如果找到了匹配的catch子句,那么系统转移到指定的 异常处理 块处执行;如果没有找到异常处理块,重复寻找匹配的catch子句的过程,直到当前方法的所有嵌套的catch子句都被检查过。
  ·由于虚拟机从第一个匹配的catch子句处继续执行,所以catch子句表中的顺序是很重要的。因为Java代码是结构化的,因此总可以把某个方法的所有的异常处理器都按序排列到一个表中,对任意可能的程序计数器的值,都可以用线性的顺序找到合适的异常处理块,以处理在该程序计数器值下发生的异常情况。
  ·如果找不到匹配的catch子句,那么当前方法得到一个"未截获异常"的结果并返回到当前方法的调用者,好像异常刚刚在其调用者中发生一样。如果在调用者中仍然没有找到相应的异常处理块,那么这种错误传播将被继续下去。如果错误被传播到最顶层,那么系统将调用一个缺省的异常处理块。
  ⑶操作数栈区  机器指令 只从操作数栈中取操作数,对它们进行操作,并把结果返回到栈中。选择栈结构的原因是:在只有少量寄存器或非 通用寄存器 的机器(如Intel486)上,也能够高效地模拟虚拟机的行为。操作数栈是32位的。它用于给方法传递参数,并从方法接收结果,也用于支持操作的参数,并保存操作的结果。例如,iadd指令将两个整数相加。相加的两个整数应该是操作数栈顶的两个字。这两个字是由先前的指令压进堆栈的。这两个整数将从堆栈弹出、相加,并把结果压回到操作数栈中。
  每个原始 数据类型 都有专门的指令对它们进行必须的操作。每个操作数在栈中需要一个存储位置,除了long和double型,它们需要两个位置。操作数只能被适用于其类型的操作符所操作。例如,压入两个int类型的数,如果把它们当作是一个long类型的数则是非法的。在Sun的虚拟机实现中,这个限制由 字节码 验证器强制实行。但是,有少数操作(操作符dupe和swap),用于对运行时数据区进行操作时是不考虑类型的。

无用单元收集堆

  Java的堆是一个运行时数据区,类的实例(对象)从中分配空间。Java语言具有无用单元收集能力:它不给程序员显式释放对象的能力。Java不规定具体使用的无用单元收集算法,可以根据系统的需求使用各种各样的算法。

方法区

  方法区与传统语言中的编译后代码或是Unix进程中的正文段类似。它保存方法代码(编译后的java代码)和 符号表 。在当前的Java实现中,方法代码不包括在无用单元收集堆中,但计划在将来的版本中实现。每个类文件包含了一个Java类或一个Java界面的编译后的代码。可以说类文件是Java语言的执行代码文件。为了保证类文件的平台无关性,Java 虚拟机 规范中对类文件的格式也作了详细的说明。其具体细节请参考Sun公司的Java虚拟机规范。

编辑本段JVM的运行过程

  上面对 虚拟机 的各个部分进行了比较详细的说明,下面通过一个具体的例子来分析它的运行过程。
  虚拟机通过调用某个指定类的方法main启动,传递给main一个字符串 数组 参数,使指定的类被装载,同时链接该类所使用的其它的类型,并且初始化它们。例如对于程序:
  class HelloApp
  {
  public static void main(String[] args)
  {
  System.out.println("Hello World!");
  for (int i = 0; i < args.length; i++ )
  {
  System.out.println(args);
  }
  }
  }
  编译后在命令行模式下键入:java HelloApp run virtual machine
  将通过调用HelloApp的方法main来启动java虚拟机,传递给main一个包含三个字符串"run"、"virtual"、"machine"的数组。现在我们略述虚拟机在执行HelloApp时可能采取的步骤。
  开始试图执行类HelloApp的main方法,发现该类并没有被装载,也就是说虚拟机当前不包含该类的二进制代表,于是虚拟机使用ClassLoader试图寻找这样的二进制代表。如果这个进程失败,则抛出一个异常。类被装载后同时在main方法被调用之前,必须对类HelloApp与其它类型进行链接然后初始化。链接包含三个阶段:检验,准备和解析。检验检查被装载的主类的符号和语义,准备则创建类或接口的静态域以及把这些域初始化为标准的默认值,解析负责检查主类对其它类或接口的符号引用,在这一步它是可选的。类的初始化是对类中声明的静态初始化函数和静态域的初始化 构造方法 的执行。一个类在初始化之前它的父类必须被初始化。整个过程如下:
  

[2]

编辑本段Java虚拟机命令行参数说明

   一、运行class文件
  执行带main方法的class文件,Java 虚拟机 [3] 命令参数行为:
  java <CLASS文件名>
  注意:CLASS文件名不要带文件后缀.class
  例如:
  java Test
  如果执行的class文件是带包的,即在类文件中使用了:
  package <;包名>
  那应该在包的基路径下执行,Java虚拟机 命令行参数
  java <;包名>.CLASS文件名
  例如:
  PackageTest.java中,其包名为:com.ee2ee.test,对应的语句为:
  package com.ee2ee.test;
  PackageTest.java及编译后的class文件PackageTest.class的存放目录如下:
  classes
  |__com
  |__ee2ee
  |__test
  |__PackageTest.java
  |__PackageTest.class
  要运行PackageTest.class,应在classes目录下执行:
  java com.ee2ee.test.PackageTest
   二、运行jar文件中的class
  原理和运行class文件一样,只需加上参数-cp <jar文件名>;即可。
  例如:执行test.jar中的类com.ee2ee.test.PackageTest,命令行如下:
  java -cp test.jar com.ee2ee.test.PackageTest
   三、显示JDK版本信息
  当一台机器上有多个jdk版本时,需要知道当前使用的是那个版本的jdk,使用参数-version即可知道其版本,命令行为:
  java -version
   四、增加虚拟机可以使用的最大内存
  Java虚拟机可使用的最大内存是有限制的,缺省值通常为64MB或128MB。
  如果一个 应用程序 为了提高性能而把数据加载内存中而占用较大的内存, 比如 超过了默认的最大值128MB,需要加大java虚拟机可使用的最大内存,否则会出现Out of Memory( 系统内存 不足)的异常。启动java时,需要使用如下两个参数:
  -Xms java虚拟机初始化时使用的内存大小
  -Xmx java虚拟机可以使用的最大内存
  以上两个命令行参数中设置的size,可以带单位,例如:256m表示256MB
  举例说明:
  java -Xms128m -Xmx256m ...
  表示Java虚拟机初始化时使用的内存为128MB,可使用的最大内存为256MB。
  对于tomcat,可以修改其 脚本 catalina. sh(Unix平台)或catalina.bat(Windows平台),设置 变量 JAVA_OPTS即可,例如:
  JAVA_OPTS='-Xms128m -Xmx256m'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值