彻底理解java String

本文详细探讨了 Java 中 String 类的实现原理,包括创建方式、串接操作的影响、String 的长度限制及其内部处理机制。此外,还介绍了如何利用 StringBuffer 和 StringBuilder 提升性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。

  一、创建。

  好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:

  java 代码

  1. String str1 = new String("abc");

  2. Stirng str2 = "abc"; //如果"abc"不存在将被放到缓存池中,如果存将缓存池中的该值指向str2,如果要改变str2="aaa"则重复以上的步骤.

  虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个 String对象,然后将该对象的引用返回给用户。

对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中

注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:

  java 代码

      String str1 = new String("abc"); //jvm 在堆上创建一个String对象

  Stirng str2 = "abc";//jvm在strings pool中找不到值为“abc”的字符串,因此在堆上创建一个String对象,并将该对象的引用加入至strings pool中此时堆上有两个String对象

  if(str1 == str2){   //false

     System.out.println("str1 == str2"); 

  }else{

     System.out.println("str1 != str2"); 

   }

  String str3 = "abc"; //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”,因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用

   if(str2 == str3){   //true

  System.out.println("str2 == str3");

  }else{

  System.out.println("str2 != str3");

  }

  2.再看下面的例子:

  java 代码

   String str1 = new String("abc"); //jvm 在堆上创建一个String对象

  str1 = str1.intern();  //程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool有没“abc”对象的引用,如果有的话将该对象引用指向str1,没有,则在堆中新建一个对象,然后将新对象的引用加入至strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会被GC收集。

  Stirng str2 = "abc";//此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”,因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,此时,堆上的有效对象只有一个。

  if(str1 == str2){  //true

     System.out.println("str1 == str2");

  }else{

        System.out.println("str1 != str2");

  }

选创建String ="abc":

     String s1 = "abc";
     String s2 = new String("abc");
      s2 = s2.intern();   //查看strings pool有没“abc”对象的引用,有,将该对象引用指向str1.没有则创建
      System.out.println(s1==s2); //true;

   为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响

            创建string对象很消耗资源,但又经常用到,所以采用了缓冲池的方式.

  二、串接(Concatenation)。

  java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然 String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。

  为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。

  三、String的长度

  我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。

  不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。

  对String类的理解网上有很多的资料,个人觉得很多都是错误的,错误的解释危害性更大。所以为了解释清楚,就来看代码,代码运行出的结果才是最具有说服力的。说明:以下都是个人的理解,欢迎指正。

  public class StringTest {

        public static void main(String[] args) {

  String str1 = new String("abc");

  String str2 = "abc";

  if (str1 == str2) {   //false

      System.out.println("str1 == str2");

  } else {

       System.out.println("str1 != str2");

  }

  String str3 = "abc";

   if (str2 == str3) { //true

        System.out.println("str2 == str3");

   } else {

          System.out.println("str2 != str3");

  }

  str1 = str1.intern();

  if (str1 == str2) { //true

  System.out.println("str1 == str2");

  } else {

         System.out.println("str1 != str2");

  }

  String str4 = new String("abc");

   str4 = str4.intern();

    if (str1 == str4) { //true

      System.out.println("str1 == str4");

     } else {

           System.out.println("str1 != str4");

         }

   }

   }

  运行结果:

  str1 != str2

  str2 == str3

  str1 == str2

  str1 == str4

  看看运行结果后,给出我自己的理解说明:

  1、String有一个所谓的String pool,这是一个什么东西呢,我理解是它是堆(heap)上特殊的一个空间(我叫它特殊堆)。注意它也是在堆上。

  2、产生String类型的对象有两种方法,那么这两种方法有什么区别呢?我的理解是String str = “abc”是先用equals方法(String类覆盖了equals方法)判断这个特殊堆(String pool)是否有abc,有则将原来在栈中指向abc的引用赋值给str,否则就在这个特殊堆(String pool)上创建一个abc对象。String str2 = new String("abc")则是在普通堆上创建abc对象。所以str和str2是指向不同的对象,它们是不同的。

  3、String有个intern()方法,这个方法是个本地方法,当用String str2 = new String("abc")来创建对象时,它相当于告诉JVM,我这个abc对象是放在特殊堆(String pool)上的。所以第三个打印结果是相等的。

  4、需要注意的一点:String是final类,它是恒定类,一旦创建就无法改变,所以用intern()方法是重新在String pool中创建了一个新的对象。

  5、String类有一个伴随类StringBuffer,需要了解它们之间的区别请google之。

  Java语言规范中定义了字符串文字以及更一般的常量表达式的值的字符串是被内部化的,以便它们共享同一个实例。我们试验一下下面代码

         String s3 = "你好,Java自由人";
         String s4 = "你好," + "Java自由人";
         System.out.println(s3==s4);  //true
         System.out.println(s3.intern()==s4.intern()); //true  

      这段代码将打印两个true,也就是说字符串s3和s4是共享同一个实例。不过前提是尽管使用了表达式,但是表达式中必须都是常量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值