初识JVM中的方法内联

在C++中,可以明确定义内联函数,使用inline关键字。在Java中不能定义内联函数,但是方法的内联在JIT编译中还是存在的,只不过是JIT自动优化的,我们无法在写代码的时候指定。 

所谓内联函数就是指函数在被调用的地方直接展开,编译器在调用时不用像一般函数那样,参数压栈,返回时参数出栈以及资源释放等,这样提高了程序执行速度。 一般函数的调用时,JVM会自动新建一个堆栈框架来处理参数和下一条指令的地址,当执行完函数调用后再撤销该堆栈。  

写一段Java代码来测试一下。 

public class Test {  
    public static void foo() {     
        boolean t = true;  
        boolean f = false;  
        System.out.println(t == f);  
    }     
  
    public static void main(String[] args) {     
        foo();     
    }  
}  

看一下这段代码的字节码信息,使用命令 

Javap代码  

javap -c -s -l -verbose Test  

关键部位的字节码信息如下 
Bytecode代码 

public static void foo();  
  Signature: ()V  
  LineNumberTable:  
   line 5: 0  
   line 6: 2  
   line 7: 4  
   line 8: 20  
  
  LocalVariableTable:  
   Start  Length  Slot  Name   Signature  
   2      19      0    t       Z  
   4      17      1    f       Z  
  
  
  Code:  
   Stack=3, Locals=2, Args_size=0  
   0:   iconst_1  
   1:   istore_0  
   2:   iconst_0  
   3:   istore_1  
   4:   getstatic       #15; //Field java/lang/System.out:Ljava/io/PrintStream;  
   7:   iload_0  
   8:   iload_1  
   9:   if_icmpne       16  
   12:  iconst_1  
   13:  goto    17  
   16:  iconst_0  
   17:  invokevirtual   #21; //Method java/io/PrintStream.println:(Z)V  
   20:  return  
  LineNumberTable:  
   line 5: 0  
   line 6: 2  
   line 7: 4  
   line 8: 20  
  
  LocalVariableTable:  
   Start  Length  Slot  Name   Signature  
   2      19      0    t       Z  
   4      17      1    f       Z  
  
  StackMapTable: number_of_entries = 2  
   frame_type = 255 /* full_frame */  
     offset_delta = 16  
     locals = [ int, int ]  
     stack = [ class java/io/PrintStream ]  
   frame_type = 255 /* full_frame */  
     offset_delta = 0  
     locals = [ int, int ]  
     stack = [ class java/io/PrintStream, int ]  
  
  
public static void main(java.lang.String[]);  
  Signature: ([Ljava/lang/String;)V  
  LineNumberTable:  
   line 11: 0  
   line 12: 3  
  
  LocalVariableTable:  
   Start  Length  Slot  Name   Signature  
   0      4      0    args       [Ljava/lang/String;  
  
  
  Code:  
   Stack=0, Locals=1, Args_size=1  
   0:   invokestatic    #33; //Method foo:()V  
   3:   return  
  LineNumberTable:  
   line 11: 0  
   line 12: 3  
  
  LocalVariableTable:  
   Start  Length  Slot  Name   Signature  
   0      4      0    args       [Ljava/lang/String;

可以看到在字节码中是不能反映出方法内联的,方法内联是在JIT编译时发生的,Oracle对方法内联的举例(传送门:http://java.sun.com/developer/technicalArticles/Networking/HotSpot/inlining.html),JVM会做出优化。要发现该方法是否被内联可以使用如下命令: 

Runtime option代码 

java -Xrunhprof:cpu=times InlineMe  


在本文中我没有进行这个测试,如果想看这个测试结果,可以到这里来看。(传送门:http://spring8314.iteye.com/blog/139299) 
也可以使用参数:(这个参数只能在debug mode下使用,可以参见http://www.oracle.com/technetwork/java/javase/tech/exactoptions-jsp-141536.html,建议使用fastdebug来玩,传送门:http://agapple.iteye.com/blog/1056599) 

Runtime option代码  

-XX:+PrintInlining  

打印出来的内容如下 

Inline log代码  

@ 0   org.dothwinds.test.Test::foo (21 bytes)  

可以看到log中存在foo方法。后面的21字节表示字节码所占用的字节。那么用javap可以看到foo方法的字节码正好占用21字节 

Bytecode代码 

Code:  
 Stack=3, Locals=2, Args_size=0  
 0:   iconst_1  
 1:   istore_0  
 2:   iconst_0  
 3:   istore_1  
 4:   getstatic       #15; //Field java/lang/System.out:Ljava/io/PrintStream;  
 7:   iload_0  
 8:   iload_1  
 9:   if_icmpne       16  
 12:  iconst_1  
 13:  goto    17  
 16:  iconst_0  
 17:  invokevirtual   #21; //Method java/io/PrintStream.println:(Z)V  
 20:  return  

我们将这段代码反汇编x86asm来看看。 

java -Xcomp -XX:+UnlockDiagnosticVMOptions -XX:+Pr  
intAssembly org/dothwinds/test/Test >log.log  

到当前目录下找到这个log文件,将有意义的代码提取出来。 

X86 asm代码 

Code:  
[Disassembling for mach='i386']  
[Entry Point]  
[Verified Entry Point]  
[Constants]  
  # {method} 'main' '([Ljava/lang/String;)V' in 'org/dothwinds/test/Test'  
  # parm0:    ecx       = '[Ljava/lang/String;'  
  #           [sp+0x20]  (sp of caller)  
  ;;  block B6 [0, 0]  
  
  0x01cd3930: mov    %eax,-0x8000(%esp)  
  0x01cd3937: push   %ebp  
  0x01cd3938: sub    $0x18,%esp         ;*invokestatic foo  
                                        ; - org.dothwinds.test.Test::main@0 (line 11)  
  ;;  block B0 [0, 3]  
  
  ;;   10 move [obj:0x0|L] [edx|L] [patch_normal] [bci:4]  
  0x01cd393b: nop      
  0x01cd393c: nop      
  0x01cd393d: nop      
  0x01cd393e: nop      
  0x01cd393f: nop      
  0x01cd3940: jmp    0x01cd3990         ;   {no_reloc}  
  ;;   12 move [Base:[edx|L] Disp: 2147483647|L] [ecx|L] [patch_normal] [bci:4]  
  0x01cd3945: nop      
  0x01cd3946: nop      
  0x01cd3947: nop      
  0x01cd3948: jmp    0x01cd39bb         ; implicit exception: dispatches to 0x01cd399a  
  0x01cd394d: nop                       ;*getstatic out  
                                        ; - org.dothwinds.test.Test::foo@4 (line 7)  
                                        ; - org.dothwinds.test.Test::main@0 (line 11)  
  0x01cd394e: cmp    (%ecx),%eax        ; implicit exception: dispatches to 0x01cd39c5  
  0x01cd3950: mov    $0x0,%edx          ;*invokevirtual println  
                                        ; - org.dothwinds.test.Test::foo@17 (line 7)  
                                        ; - org.dothwinds.test.Test::main@0 (line 11)  
  0x01cd3955: nop      
  0x01cd3956: mov    $0xffffffff,%eax   ;   {oop(NULL)}  
  0x01cd395b: call   0x01c0b210         ; OopMap{off=48}  
                                        ;*invokevirtual println  
                                        ; - org.dothwinds.test.Test::foo@17 (line 7)  
                                        ; - org.dothwinds.test.Test::main@0 (line 11)  
                                        ;   {virtual_call}  
  0x01cd3960: add    $0x18,%esp  
  0x01cd3963: pop    %ebp  
  0x01cd3964: test   %eax,0x260100      ;   {poll_return}  
  0x01cd396a: ret      

X86 asm代码 

0x01cd395b: call   0x01c0b210         ; OopMap{off=48}  
                                      ;*invokevirtual println  
                                      ; - org.dothwinds.test.Test::foo@17 (line 7)  
                                      ; - org.dothwinds.test.Test::main@0 (line 11)  
                                      ;   {virtual_call}  

每行右边分号后面是注释。它会显示当前机器指令对应的原本的Java字节码是什么、字节码是从哪里来的。 
可以看到这里call指令对应的字节码原本是个invokevirtual,而它原本是在foo()方法中的,并且被main()方法内联了。 

如果不想进行方法内联,可以使用参数: 

Runtime option代码 

-XX:CompileCommand=dontinline,org/dothwinds/test/Test,foo  

但是需要注意的是,C1(Client模式)下是不检查dontinline的,解决方法可以见帖子:传送门(http://hllvm.group.iteye.com/group/topic/26381) 
如果嫌这种方式麻烦,那只能使用C2(Server模式)来玩了。 

基础篇-0-Java虚拟机导学课程 11:33 基础篇-1-初识JVM 22:27 基础篇-2-Java虚拟机的组成 04:47 基础篇-3-字节码文件的组成-以正确的姿势打开字节码文件 10:41 基础篇(补)-3.5-字节码文件的组成-基础信息 15:54 基础篇-4-字节码文件的组成-常量池和方法 25:51 基础篇-5-字节码文件常见工具的使用1 11:43 基础篇-6-字节码文件常见工具的使用2 22:20 基础篇-7-类的生命周期加载阶段 22:09 基础篇-8-类的生命周期2连接阶段 19:58 基础篇-9-类的生命周期3初始化阶段 26:27 基础篇-10-类加载器的分类 13:56 基础篇-11-启动类加载器 13:36 基础篇-12-扩展和应用程序类加载器 16:26 基础篇-13-双亲委派机制 18:43 基础篇-14-打破类的双亲委派机制-自定义类加载器 25:16 基础篇-15-打破双亲委派机制2-线程上下文类加载器 20:17 基础篇-16-打破双亲委派机制3-osgi和类的热部署 11:53 基础篇-17-JDK9之后的类加载器 09:05 基础篇-18-运行时数据区-程序计数器 15:42 基础篇-19-栈-局部变量表 19:20 基础篇-20-栈-操作数栈和帧数据 12:08 基础篇-21-栈-内存溢出 15:28 基础篇-22-堆内存 25:56 基础篇-23-方法区的实现 16:25 基础篇-24-方法区-字符串常量池 20:40 基础篇-25-直接内存 12:39 基础篇-26-自动垃圾回收 11:32 基础篇-27-方法区的回收 11:32 基础篇-28-引用计数法 15:41 基础篇-29-可达性分析法 20:25 基础篇-30-软引用 24:40 基础篇-31-弱虚终结器引用 12:08 基础篇-32-垃圾回收算法的评价标准 13:31 基础篇-33-垃圾回收算法1 10:05 基础篇-34-垃圾回收算法-分代GC 20:19 基础篇-35-垃圾回收器1 15:54 基础篇-36-垃圾回收器2 11:44 基础篇-37-垃圾回收器3 15:51 基础篇-38-g1垃圾回收器 26:23 实战篇-1-内存泄漏和内存溢出 21:25 实战篇-2-解决内存泄漏-监控-top命令 12:16 实战篇-3-解决内存泄漏-监控-visualvm 12:50 实战篇-4-解决内存泄漏-监控-arthas tunnel 15:18 实战篇-5-解决内存泄漏-监控-prometheus-grafana 17:53 实战篇-6-解决内存泄漏-堆内存状况对比 08:39 实战篇-7-解决内存泄漏-内存泄漏产生的几大原因 16:01 实战篇-8-内存泄漏产生的原因2 13:30 实战篇-9-内存泄漏产生的原因3 10:43 实战篇-10-内存泄漏产生的原因4 10:04 实战篇-11-内存泄漏产生原因2-并发请求问题 17:30 实战篇-12-导出堆内存快照并使用MAT分析 08:38 实战篇-13-MAT内存泄漏检测原理 17:23 实战篇-14-服务器导出内存快照和MAT使用小技巧 13:31 实战篇-15-实战1-查询大数据量导致的内存溢出 26:24 实战篇-16-实战2-mybatis导致的内存溢出 10:34 实战篇-17-实战3-k8s容器环境导出大文件内存溢出 26:13 实战篇-18-系统不处理业务时也占用大量的内存 14:13 实战篇-19-文章审核接口的内存问题 18:28 实战篇-20-btrace和arthas在线定位问题 20:15 实战篇-21-GC调优的核心目标 11:23 实战篇-22-GC调优的常用工具 12:05 实战篇-23-GC调优的常见工具2 14:25 实战篇-24-常见的GC模式 13:38 实战篇-25-基础JVM参数的设置 28:31 实战篇-26-垃圾回收器的选择 18:04 实战篇-27-垃圾回收参数调优 07:56 实战篇-28-实战-GC调优和内存调优 30:43 实战篇-29-性能问题的现象和解决思路 10:49 实战篇-30-定位进程CPU占用率高的问题 18:52 实战篇-31-接口响应时间很长问题的定位 14:44 实战篇-32-火焰图定位接口响应时间长的问题 12:03 实战篇-33-死锁问题的检测 14:37 实战篇-34-基准测试框架JMH的使用 28:24 实战篇-35-实战-性能调优 26:36 高级篇-01-GraalVM介绍 12:13 高级篇-02-GraalVM的两种运行模式 15:43 高级篇-03-使用SpringBoot3构建GraalVM应用 15:08 高级篇-04-将GraalVM应用部署到函数计算 25:13 高级篇-05-将GraalVM应用部署到Serverless 09:14 高级篇-06-参数优化和故障诊断 22:31 高级篇-07-垃圾回收器的技术演进 13:09 高级篇-08-ShenandoahGC 22:50 高级篇-09-ZGC 14:35 高级篇-10-实战案例-内存不足时的垃圾回收测试 09:47 高级篇-11-JavaAgent技术 12:16 高级篇-12-JavaAgent环境搭建 15:24 高级篇-13-查看内存的使用情况 18:48 高级篇-14-生成内存快照 13:47 高级篇-15-获取类加载器的信息 16:26 高级篇-16-打印类的源码 18:00 高级篇-17-使用ASM增强方法 29:45 高级篇-18-使用ByteBuddy打印方法执行的参数和耗时 21:55 高级篇-19-APM系统和数据采集 24:30 原理篇-01-栈上的数据存储 15:05 原理篇-02-boolean在栈上的存储方式 22:48 原理篇-03-对象在堆上的存储1 17:27 原理篇-04-对象在堆上的存储2 25:14 原理篇-05-方法调用的原理1-静态绑定 19:26 原理篇-06-方法调用的原理2-动态绑定 15:25 原理篇-07-异常捕获的原理 12:00 原理篇-08-JIT即时编译器 14:49 原理篇-09-JIT即时编译器优化手段1-方法内联 16:49 原理篇-10-JIT即时编译器优化手段2-逃逸分析 09:03 原理篇-11-g1垃圾回收器原理-年轻代回收 27:57 原理篇-12-g1垃圾回收器原理-混合回收 17:24 原理篇-13-ZGC原理 26:27 原理篇-14-ShenandoahGC原理 09:39 面试篇-01-什么是JVM 16:38 面试篇-02-字节码文件的组成 15:02 面试篇-03-什么是运行时数据区 20:09 面试篇-04-哪些区域会出现内存溢出 11:56 面试篇-05-JDK6-8内存区域上的不同 14:36 面试篇-06-类的生命周期 17:17 面试篇-07-什么是类加载器 17:05 面试篇-08-什么是双亲委派机制 12:15 面试篇-09-如何打破双亲委派机制 18:10 面试篇-10-tomcat的自定义类加载器 31:18 面试篇-11-如何判断堆上的对象有没有被引用 10:05 面试篇-12-JVM中都有哪些引用类型 16:58 面试篇-13-theadlocal中为什么要使用弱引用 12:16 面试篇-14-有哪些垃圾回收算法 24:54 面试篇-15-有哪些常用的垃圾回收器 18:55 面试篇-16-如何解决内存泄漏问题 23:52 面试篇-17-常见的JVM参数 11:11 这是目前我学习的视频集合,要不要全看,或者少了什么,有哪些重要内容需要进行学习汇总或刷题或通过小实例验证
最新发布
10-02
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值