Java的JVM虚拟机对String对象的处理

本文深入探讨了 Java 中 String 类的实现原理,包括其不可变性、创建方式、串接操作的影响及 String 的最大长度限制等内容。

要理解 javaString 的 运作方式,必须明确一点:String 是一个非可变类(immutable)。什么是非可变 类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java 为什么要把String 设 计为非 可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对 象,甚至可以共享它们的内部信息。(详见 《Effective java 》item 13)。String 类在java 中 被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。

一、创建。
    好了,知道String 是非可变类以后,我们可以进一步了解String 的构造方式了。创建一个Stirng对象,主要就有以下两种方式:

java 代码
  1. String  str1 =  new  String ( "abc" );    
  2. Stirng str2 =  "abc" ;  

     虽然两个语句都是返回一个String 对象的引用,但是jvm对两者的处理方式是 不一样的。对于第一种,jvm会马上在heap中创建一个String 对象,然后将该对象的 引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String 的 equels 方法查找是对象池中是否存放有该String 对象,如果有,则返回已有的String 对象给用户,而不会在heap中重新创建一个新的String 对象;如果对象池中没有该String 对 象,jvm则在heap中创建新的String 对象,将其引用返回给用户,同时将该引用添加 至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String 的intern方法。看下面的例子:

java 代码
  1. String  str1 =  new  String ( "abc" );  //jvm 在 堆上创建一个String 对象   
  2.   
  3.   //jvm 在strings pool 中找不到值为“abc”的字符串,因此   
  4.   //在堆上创建一个String 对 象,并将该对象的引用加入至strings pool中   
  5.   //此时堆上有两个String 对象   
  6. Stirng str2 =  "abc" ;   
  7.   
  8.   if (str1 == str2){   
  9.          System.out.println( "str1 == str2" );   
  10.  } else {   
  11.          System.out.println( "str1 != str2" );   
  12.  }   
  13.    //打印结果 是 str1 != str2,因为它们是堆上两个不同的对象   
  14.   
  15.   String  str3 =  "abc" ;   
  16.   //此时,jvm发现strings pool中已有“abc”对 象了,因为“abc”equels “abc”   
  17.   //因此直接返回str2指向的对象给 str3,也就是说str2和str3是指向同一个对象的引用   
  18.    if (str2 == str3){   
  19.          System.out.println( "str2 == str3" );   
  20.   } else {   
  21.          System.out.println( "str2 != str3" );   
  22.   }   
  23.   //打印结果 为 str2 == str3   

   再看下面的例子:

java 代码
  1. String  str1 =  new  String ( "abc" );  //jvm 在 堆上创建一个String 对象   
  2.   
  3. str1 = str1.intern();   
  4. //程序显式将str1放到strings pool中,intern运行过程是这样的:首先查 看strings pool   
  5. //有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新 对象的引用加入至   
  6. //strings pool中。执行完该语句后,str1原来指向的String 对象已经成为垃圾对象了,随时会   
  7. //被GC收集。   
  8.   
  9. //此时,jvm发现strings pool中已有“abc”对象 了,因为“abc”equels “abc”   
  10. //因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,   
  11. //此时,堆上的有效对象只有一个。   
  12. Stirng str2 =  "abc" ;   
  13.   
  14.   if (str1 == str2){   
  15.          System.out.println( "str1 == str2" );   
  16.  } else {   
  17.          System.out.println( "str1 != str2" );   
  18.  }   
  19.    //打印结果 是 str1 == str2   
  20.   

 

    为什么jvm可以这样处理String 对象呢?就是因为String 的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。


二、串接(Concatenation)。
     java 程序员应该都知道滥用String 的 串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String 类的非可变 性。既然String 对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但 是串接操作明显是要增长字符串的,也就是要改变String 的内部状态,两者出现了矛盾。怎 么办呢?要维护String 的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而 来了。
    为了解决这个问题,jdk为String 类 提供了一个可变的配套 类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上 有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。

三、String 的长度
   我们可以使用串接操作符得到一个长度更长的字符串,那么,String 对象最多能容纳 多少字符呢?查看String 的源代码我们可以得知类String 中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
    不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。 如果超出这个数量,在编译的时候编译器会报错。


  1.   
  2. /**  
  3.  *   
  4.  * java JVM 对String对象的处理  
  5.  * test String. intern() 方 法   
  6.  *   
  7.  */   
  8. public   class  TestStringIntern {   
  9.   
  10.   
  11.      /**  
  12.      * @param args  
  13.      */   
  14.      public   static   void  main(String[] args) {   
  15.            
  16.          /*  
  17.          * 1.字面上的 "Hi" 字 符串(字符串字面值string literal)将被自动 intern到虚拟机的字符串池中.  
  18.          * 2.不是字面上的String对象  通过调用 intern()方法,被intern到虚拟机的字符串池中.  
  19.          *   
  20.          * 虚拟机的字符串池由 类 String 私有地维护。  
  21.          */   
  22.         String a =  "Hi" ;   
  23.         String b =  "Hi" ;   
  24.         String c =  new  String( "Hi" );   
  25.   
  26.         System.out.println(a == b); // true   
  27.         System.out.println(a == c); // false   
  28.            
  29.         c = c.intern();   
  30.         System.out.println(a == c); // true   
  31.            
  32.          /*  
  33.          * 创建了两个对象   
  34.          * 1.字面"AA" ——被 intern到虚拟机字符串池中了。  
  35.          * 2.new 操作符创建 的 对象  
  36.          *   
  37.          * 由 AA != AA.intern()可以看出:String AA = new String("AA");创建了两个对象。  
  38.          */   
  39.         String AA =  new  String( "AA" );   
  40.         System.out.println(AA ==  "AA" ); // false   
  41.         System.out.println(AA == AA.intern()); // false   
  42.         System.out.println( "AA"  == AA.intern()); // true   
  43.            
  44.            
  45.          /*  
  46.          * JAVA 规范中的例子:  
  47.          */   
  48.         String hello =  "Hello" , lo =  "lo" ;   
  49.         System.out.print((hello ==  "Hello" ) +  " " );       //true   
  50.         System.out.print((hello == ( "Hel" + "lo" )) +  " " );  //true   
  51.         System.out.print((hello == ( "Hel" +lo)) +  " " );    //false--lo为非literal的   
  52.         System.out.println(hello == ( "Hel" +lo).intern()); //true   
  53.   
  54.     }   
  55.   
  56. }   
  57.  
### Java JVM虚拟机运行机制 JVMJava虚拟机)是一种虚拟化的计算机,允许在其上执行Java程序(以及其他由Java编译器编译成字节码的程序),提供了一种跨平台的执行环境,具备“一次编写,到处运行”的特性[^2]。 一个Java文件从编码完成到最终执行,一般主要包括编译和运行两个过程。编译是通过`javac`命令将Java文件编译成字节码,即`.class`文件;运行则是把编译生成的`.class`文件交给Java虚拟机(JVM)执行[^3]。 JVM的运行机制主要包括内存划分、类加载机制和垃圾回收机制等。内存划分是将内存分为不同的区域,如堆、栈、方法区等,不同区域有不同的作用。类加载机制负责将Java字节码文件加载到内存中,并转换成可执行的Java类。垃圾回收机制则负责回收不再使用的内存空间,以提高内存的利用率[^2]。 ### Java类加载顺序 JVM的类加载机制基于类加载器的概念,并按照特定的顺序进行类加载。类加载过程一般分为以下几个步骤: 1. **加载**:通过类的全限定名来获取定义此类的二进制字节流,将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构,在内存中生成一个代表这个类的`java.lang.Class`对象,作为方法区这个类的各种数据的访问入口。 2. **验证**:确保被加载的类的正确性,验证字节码文件的格式、语义等是否符合Java虚拟机规范。 3. **准备**:为类的静态变量分配内存,并将其初始化为默认值。例如,`int`类型的静态变量初始值为0。 4. **解析**:将常量池内的符号引用替换为直接引用的过程。符号引用是一种文本形式的引用,而直接引用是指向目标的指针、句柄或偏移量等。 5. **初始化**:执行类构造器`<clinit>()`方法的过程。`<clinit>()`方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(`static{}`块)中的语句合并产生的。 类加载器有不同的类型,如启动类加载器(Bootstrap ClassLoader)、扩展类加载器(Extension ClassLoader)和应用程序类加载器(Application ClassLoader)等,它们按照双亲委派模型进行类加载,即当一个类加载器收到类加载请求时,它首先会把这个请求委托给父类加载器去完成,只有当父类加载器无法完成加载请求时,子类加载器才会尝试自己去加载[^1]。 以下是一个简单的示例代码,展示类加载过程中静态变量和静态代码块的执行顺序: ```java class Parent { static { System.out.println("Parent static block"); } static int parentStaticVar = 10; } class Child extends Parent { static { System.out.println("Child static block"); } static int childStaticVar = 20; } public class ClassLoadingOrderExample { public static void main(String[] args) { System.out.println(Child.childStaticVar); } } ``` 在上述代码中,当执行`main`方法时,会触发`Child`类的加载。由于`Child`类继承自`Parent`类,根据类加载顺序,会先加载`Parent`类,执行`Parent`类的静态代码块和静态变量初始化,然后加载`Child`类,执行`Child`类的静态代码块和静态变量初始化,最后输出`Child`类的静态变量`childStaticVar`的值。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值