不安全的代码: 教你“随心所欲”地在内存中操作Java的类和对象(4)

本文介绍了一种在Java中获取对象内存地址的方法,并详细解析了32位和64位JVM环境下类的内存布局,包括关键字段如header、klasspointer、layouthelper等的作用。

原文地址:https://zeroturnaround.com/rebellabs/dangerous-code-how-to-be-unsafe-with-java-classes-objects-in-memory/4/

如何获取一个对象的内存地址

获取一个对象的内存地址要比获取类的有趣多了。下面我们用一个java.lang.Object类型的对象数组来帮助实现这个目标。这个数组的长度只有1。

实现的步骤如下:

  1. 把目标对象(想要获取其地址的对象)作为刚刚提到的那个数组——helper array——的第一个元素(当然也是唯一的元素)。显然目标对象可以放在数组的索引为0的地方,因为数组的类型是Object(只要非基型元素都可以放下)。
  2. 然后,得到helper array的开始位移。一个数组的开始位移指的是指向数组第一个元素的指针在数组对象中的位移。(这里有点绕,但是想一下,一个数组对象并不是本身就是那个数组,而是包含指向数组的指针的对象元素,而这里要找的就是那个指针在数组对象中的位移)。Java中数组对象与数组关系如下图所示(如有错误请指正):
    这里写图片描述
  3. 我们需要检查JVM地址的大小:
    • 如果JVM是32位的,那么用sun.misc.Unsafe类从<数组地址> + <位移>的位置取出的4字节整型值就是目标对象的地址。
    • 如果JVM是64位的,那么从<数组地址> + <位移> 的位置读取的一个long型值就是目标对象的地址。
For 32 bit JVM
    Object helperArray[]    = new Object[1];
    helperArray[0]      = targetObject;
    long baseOffset         = unsafe.arrayBaseOffset(Object[].class);
    int addressOfObject = unsafe.getInt(helperArray, baseOffset);

For 64 bit JVM
    Object helperArray[]    = new Object[1];
    helperArray[0]      = targetObject;
    long baseOffset         = unsafe.arrayBaseOffset(Object[].class);
    long addressOfObject    = unsafe.getLong(helperArray, baseOffset);

在这里,你可以把targetObject当成是SampleClass的一个实例。当然,目标对象可以是任意类的对象。

类的内存布局(Class Memory Layout)

32-bit JVM

    [header                ] 4  byte
    [klass pointer         ] 4  byte (pointer)
    [C++ vtbl ptr          ] 4  byte (pointer)
    [layout_helper         ] 4  byte
    [super check offset    ] 4  byte 
    [name                  ] 4  byte (pointer)
    [secondary super cache ] 4  byte (pointer)
    [secondary supers      ] 4  byte (pointer)
    [primary supers        ] 32 byte (8 length array of pointer)
    [java mirror           ] 4  byte (pointer)
    [super                 ] 4  byte (pointer)
    [first subklass        ] 4  byte (pointer)
    [next sibling          ] 4  byte (pointer)
    [modifier flags        ] 4  byte
    [access flags          ] 4  byte
64-bit JVM

    [header                ] 8  byte
    [klass pointer         ] 8  byte (4 byte for compressed-oops)
    [C++ vtbl ptr          ] 8  byte (4 byte for compressed-oops)
    [layout_helper         ] 4  byte
    [super check offset    ] 4  byte 
    [name                  ] 8  byte (4 byte for compressed-oops)
    [secondary super cache ] 8  byte (4 byte for compressed-oops)
    [secondary supers      ] 8  byte (4 byte for compressed-oops)
    [primary supers        ] 64 byte (32 byte for compressed-oops)
                                         {8 length array of pointer}
    [java mirror           ] 8  byte (4 byte for compressed-oops)
    [super                 ] 8  byte (4 byte for compressed-oops)
    [first subklass        ] 8  byte (4 byte for compressed-oops)
    [next sibling          ] 8  byte (4 byte for compressed-oops)
    [modifier flags        ] 4  byte
    [access flags          ] 4  byte

详情请见:
http://hg.openjdk.java.net/jdk7/jdk7/hotspot/file/9b0ca45cd756/src/share/vm/oops/klass.hpp

下图是SampleClass在32位JVM中的内存布局。图中列出了从起始地址开始的128个字节。
这里写图片描述
并且SampleBaseClass在32位JVM中的内存布局的头128个字节如下图所示:
这里写图片描述

接下来,我们着重介绍下其中一些重要的域(field)。下面我们介绍下图中用颜色标注的域。

header(红色)总是一个常量值“0x00000001”.

klass pointer(深蓝)是指向内存中java.lang.Class类的指针(所以在两个图中都是0x389708a8)。它表明当前的内存结构是一个类。

layout helper(橙色)是表明当前类结构的大小(shallow size,感兴趣的朋友可以查一下shallow size与retained size的区别)。这个大小不是以字节为单位的,而是总字节数除以JVM的域布局的边界对齐大小得出的值。在我们的环境中,对象是以8字节边界对齐的。layout helper的值为0x10,也就是16,所以,本例中类结构的大小就是16*8=128(字节)。

super(紫色)是一个指向父类所在内存空间的指针。在我们的例子中,SampleBaseClass是SampleClass的父类。在SampleClass中,其super域中的值为0x34104b70,也就是SampleBaseClass在内存中的定义地址。在SampleBaseClass中,这个域的值为0x38970000,也就是java.lang.Object类的地址。这是因为在Java中任何一个类都是Object类的子类。

修改标记(modifier flags, 青色)代表的是一系列Java类的标记。这些标记可以是”public”,”protected”,”private”,”abstract”,”static”,”final”和“strictfp”等。这个域中的值是通过按位的“或”操作计算得出的。我们的例子中,SampleClass这个类是pulic和final的(SampleClass类定义见系列文章2),因此其标记域的值就是“0x00000001 | 0x00000010 = 0x00000011 “。而SampleBaseClass只是”public”的,所以其此域值为“0x00000001”。这个域的取值如下:

modifiersvalues
public0x00000001
protected0x00000002
private0x00000004
abstract0x00000400
static0x00000008
final0x00000010
strict0x00000800
第2章 使用的基本技术及工具 2.1 开发环境 开发平台:Windows10; 数据库:MySQL; JDK:1.7 及以上; 编程语言:Java; 开发根工具:Android Studio 2022 运行设备:android 手机或虚拟机。 2.2 使用的技术及工具介绍 2.2.1 Spring 框架 Android是谷歌旗下著名的移动开源操作系统。这个系统的内核是Linux。 该系统具有很高的兼容性,可以用在包括智能手机、电视、平板等诸多设备上。有着高度兼容的特性。最重要的是,Android开源的属性使开发者可以自由的通过Android系统进行开发。而本系统就是基于Android开发的一款医院挂号系统。Android的开源属性在07年已经推出,就受到了开发者的高度赞扬,而Android开发也成为一时间最热门的词语。开发者可以在Android系统上尽情挥舞画笔随心所欲地创作。Android作为以智能手机、平板、电视为主战场的可移动设备操作系统,使用度适用性非常广泛,远远超过诸如塞班、IOS等系统。在Android平台上,APP的体系结构很大幅度的上简化了组件的工作。在这之中,Java成为了APP开发的唯一语言,Java通过跨平台功能,无需编译基于Android框架开发的软件应用程序,即任意一台搭载了Android的设备均可运行。 2.2.2 SQLite介绍 SQLite,是一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它包含在一个相对小的C库中。它的设计目标是嵌入式的,而且已经在很多嵌入式产品中使用了它,它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。它能够支持Windows/Linux/Unix等等主流的操作系统,同时能够跟很多程序语言相结合,比如PHP、Java等,还有ODBC接口,同样比起MySQL、PostgreSQL这两款开源的世界著名数据库管理系统来讲,它的处理速度比他们都快。SQLite第一个Alpha版本诞生于2000年5月。 至2021年已经接近有21个年头,SQLite也迎来了一个版本 SQLite 3已经发布。 2.2.3 B/S架构介绍 B/S结构是目前使用最多的结构模式,它可以使得系统的开发更加的简单,好操作,而且还可以对其进行维护。使用该结构时只需要在计算机中安装数据库,一些很常用的浏览器就可以了。浏览器就会与数据库进行信息的连接,可以实现很多的功能,B/S结构是可以直接进行使用的,而且B/S结构在使用中极大的减少了工作的维护。基于B/S的软件,所有的数据库之间都是相互独立的,因此是非常安全的。因为基于B/S结构可以清楚的看到系统正在处理的业务,并且能够及时的让管理人员做出决策,这样就可以避免企业的损失。B/S结构的基本特点是集中式的管理模式,用户使用系统生成数据后,这些数据就可以存储到系统的数据库中,方便日后能够用到,这样就可以满足人们的所有的需求。 2.2.4 Java语言介绍 Java是由SUN公司推出,该公司于2010年被oracle公司收购。Java本是印度尼西亚的一个叫做爪洼岛的英文名称,也因此得来java是一杯正冒着热气咖啡的标识。Java语言在移动互联网的大背景下具备了显著的优势广阔的前景,它是面向对象的,分布式的,动态的,具有平台无关性、安全性、健壮性。Java语言的基本语句语法C++一样,但是它面向对象的技术更加彻底,因为Java要求将所有的内容都必须封装成,把作为程序的基本单位。由于允许外有变量、方法。 Java语言的分布式体现在数据分布操作分布,它是面向网络的语言,可以处理TCP/IP协议,它也支持客户机/服务器的计算模式。Java语言的动态性是指在运行时是动态安装的,使得Java可以动态的维护程序。Java支持指针,对内存访问的所有操作都是通过对象实例化实现的,这样就避免了指针操作中易产生的错误,同时也预防了病毒对系统的破坏威胁。 Java语言的编程风格与C语言非常接近,它继承了C++面向对象技术的核心,它面世之后发展迅速,非常流行,对高级C语言形成了很大的冲击。业内人士称之为“一次编译、到处执行”。当然java也有缺点,在每次执行编译后,字节码都需要消耗一定的时间,在某些程度上降低了性能。但是这并影响java成为此次设计语言的选择。Java语言简单易学,使用它的编程时间短,功能性强,开发者学习起来更简便、更快。Java的主要特性有以下几个: (1)面向对象 面向对象有四个特点:封装、继承、多态、抽象。抽象是指忽略一个问题中的次要部分,关注主要部分。多态是指对同一种消息做出的同反应。继承是指在原有的父方法基础上增加自己独有的方法,而改变原来父。 (2)平台无关性 Java编译出来的是字节码,直接由虚拟机执行。在任何平台上,只要有Java虚拟机,Java代码都能运行。 (3)可靠性安全Java内存的访问都必须通过对象的实例变量来实现,避免了指针中出现的错误。 (4)多线程 Java提供了多线程功能,利用编程实现同一时间同时工作的功能。 以这样的形式写出一段基于ssm的图书管理系统文档
最新发布
06-17
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值