(Java)String的intern方法

本文详细介绍了Java中String类的intern()方法的工作原理及其在不同JDK版本间的实现差异,包括性能考量与示例代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.Api简介

public String intern()

返回字符串对象的规范化表示形式。

当调用intern方法时,如果池中已经包含一个等于此String对象的字符串(该对象由equals(Object)方法确定),则返回池中的字符串。否则,将此String对象添加到池中,并且返回此String对象的引用。

它遵循对于任何两个字符串s和t,当且仅当s.equals(t)为true时,s.intern() == t.intern()才为true。

2.JDK7与JDK6区别

由于JDK1.7后,HotSpot将常量池从永久代移到了元空间,正因为如此,JDK1.7后的intern方法在实现上发生了比较大的改变,JDK1.7之后,intern方法还是会先去查询常量池中是否已经存在,如果存在,则返回常量池中的引用,这一点与之前没有区别,区别在于,如果在常量池找不到对应的字符串,则不会再将字符串拷贝到常量池,而只是在常量池中生成一个对原字符串的引用。

3.intern()方法性能

常量池底层使用StringTable数据结构保存字符串引用,实现和HashMap类似,根据字符串的hashcode定位到对应的数组,遍历链表查找字符串,当字符串比较多时,会降低查询效率。

在JDK6中,由于常量池在PermGen中,受到内存大小的限制,不建议使用该方法。

在JDK7、8中,可以通过-XX:StringTableSize参数StringTable大小,测试用例代码及测试结果如下:

测试代码:

public class StringTest {
    public static void main(String[] args) {

        int numArray[] = {10 * 1000, 100 * 1000, 500 * 1000, 1000 * 1000, 5 * 1000 * 1000, 10 * 1000 * 1000};

        for (int i = 0; i < 6 ; i++) {
            int num = numArray[i];
            System.out.println(cost(num));
        }

    }

    public static long cost(int num) {
        long start = System.currentTimeMillis();
        for (int i = 0; i < num; i++) {
            String.valueOf(i).intern();
        }
        return System.currentTimeMillis() - start;
    }
}

测试结果:


4.intern示例及解析

a.示例1:

代码:

public class StringTest {
    public static void main(String[] args) {
        String str1 = "string";
        String str2 = new String("string");
        String str3 = str2.intern();

        System.out.println(str1 == str2);
        System.out.println(str1 == str3);
    }
}
结果:false true

结果分析:

    通过字面量赋值创建字符串时,会优先在常量池中查找是否已经存在相同的字符串,倘若已经存在,栈中的引用直接指向该字符串;倘若不存在,则在常量池中生成一个字符串,再将栈中的引用指向该字符串。而通过new的方式创建字符串时,就直接在堆中生成一个字符串的对象(JDK7以后,HotSpot已将常量池从永久代转移到了堆中),栈中的引用指向该对象。对于堆中的字符串对象,可以通过intern()方法来将字符串添加到常量池中,并返回指向该常量的引用。

    因此,因为str1指向的是字符串中的常量,str2是在堆中生成的对象,所以str1==str2返回false。str2调用intern方法,会将str2中值("string")复制到常量池中,但是常量池中已经存在该字符串(即str1指向的字符串),所以直接返回该字符串的引用,因此str1==str2返回true。

b.示例2:

代码:

public class StringTest{
    public static void main(String[] args) {
        String baseStr = "baseStr";
        final String baseFinalStr = "baseStr";

        String str1 = "baseStr01";
        String str2 = "baseStr" + "01";
        String str3 = baseStr + "01";
        String str4 = baseFinalStr + "01";
        String str5 = new String("baseStr01").intern();

        System.out.println(str1 == str2); 
        System.out.println(str1 == str3);
        System.out.println(str1 == str4);
        System.out.println(str1 == str5);
    }
}
结果:true false true true


5.参考文献

a.String中intern的方法

b.浅谈Java String.intern()

c.通过反编译深入理解Java String及intern

d.怎么用java自带反编译工具查看java字节码文件

### Java 中 `String.intern()` 机制详解 #### 工作理 `String.intern()` 是一种用于获取字符串常量池中对应字符串的方法。当调用此方法时,如果字符串已经存在于常量池,则返回池中的实例;否则会将当前字符串放入常量池并返回这个新的引用。 对于直接使用构造函数创建的字符串对象如 `new String("abc")` ,它会在堆上分配一个新的对象而不是优先查找常量池中存在的相同内容的对象[^1]。这意味着即使有相同的字符串值,在不同地方通过这种方式创建出来的对象也是不同的实体,它们不会共享同一份内存地址,从而可能导致不必要的重复数据以及增加垃圾收集的压力。 为了优化这种情况下的性能问题和节省内存开销,可以利用 `intern()` 方法让这些具有相等字符序列但是独立构建于堆上的字符串能够指向同一个位于永久代(PermGen space 或 Metaspace)内的唯一表示形式: ```java // 创建两个逻辑上相等但实际上不是同一个对象的字符串变量 String str1 = new String("hello"); String str2 = "hello"; System.out.println(str1 == str2); // 输出 false 表明两者并非同一对象 // 使用 intern 后再做对比 str1 = new String("hello").intern(); System.out.println(str1 == str2); // 此时输出 true 显示二者确实是指向了相同的实例 ``` 上述代码片段展示了如何借助 `intern()` 实现字符串间的高效比较及其带来的好处——减少冗余副本数量的同时提高了程序运行效率[^2]。 #### 使用场景 - **大量重复字符串处理**:在应用程序中有许多完全一致却各自占据单独空间的小型文本串时,采用 `intern()` 可有效降低总体消耗; - **哈希表键名管理**:作为 Map 结构里的 key 值时尤为适用,因为这能确保所有映射关系基于独一无二的标准参照物建立起来而不受外部因素干扰; - **配置文件解析器**:读取 XML/YAML 等格式化文档期间遇到频繁出现的关键字或属性名称亦可考虑应用此类技术手段加以简化维护成本。 需要注意的是虽然 `String.intern()` 能够带来诸多便利之处但也存在一定局限性比如可能引起 PermGen/Metaspace 溢出风险所以在实际开发过程中应当权衡利弊合理选用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值