String为什么是不可变类型?

探讨了Java中String类的不可变性,解释了对象和对象引用的区别,以及String对象为何被认为是不可变的,即使在使用某些方法时看似其值能够改变。

什么是不可变量

众所周知, 在Java中, String类是不可变的。那么到底什么是不可变的对象呢? 可以这样认为:如果一个对象,在它创建完成之后,不能再改变它的状态,那么这个对象就是不可变的。不能改变状态的意思是,不能改变对象内的成员变量,包括基本数据类型的值不能改变,引用类型的变量不能指向其他的对象,引用类型指向的对象的状态也不能改变。

区分对象和对象的引用

对于Java初学者, 对于String是不可变对象总是存有疑惑。看下面代码:

String s = "ABCabc";
System.out.println("s = " + s);
s = "123456";
System.out.println("s = " + s);

打印结果为: s = ABCabc

s = 123456

首先创建一个String对象s,然后让s的值为“ABCabc”, 然后又让s的值为“123456”。 从打印结果可以看出,s的值确实改变了。那么怎么还说String对象是不可变的呢? 其实这里存在一个误区: s只是一个String对象的引用,并不是对象本身。对象在内存中是一块内存区,成员变量越多,这块内存区占的空间越大。引用只是一个4字节的数据,里面存放了它所指向的对象的地址,通过这个地址可以访问对象。 也就是说,s只是一个引用,它指向了一个具体的对象,当s=“123456”; 这句代码执行过之后,又创建了一个新的对象“123456”, 而引用s重新指向了这个心的对象,原来的对象“ABCabc”还在内存中存在,并没有改变。内存结构如下图所示:




Java和C++的一个不同点是, 在Java中不可能直接操作对象本身,所有的对象都由一个引用指向,必须通过这个引用才能访问对象本身,包括获取成员变量的值,改变对象的成员变量,调用对象的方法等。而在C++中存在引用,对象和指针三个东西,这三个东西都可以访问对象。其实,Java中的引用和C++中的指针在概念上是相似的,他们都是存放的对象在内存中的地址值,只是在Java中,引用丧失了部分灵活性,比如Java中的引用不能像C++中的指针那样进行加减运算。

为什么String对象是不可变的?

要理解String的不可变性,首先看一下String类中都有哪些成员变量。 在JDK1.6中,String的成员变量有以下几个:

复制代码

public final class String
    implements java.io.Serializable, Comparable<string>, CharSequence{
    /** The value is used for character storage. */
    private final char value[];
 
    /** The offset is the first index of the storage that is used. */
    private final int offset;
 
    /** The count is the number of characters in the String. */
    private final int count;
 
    /** Cache the hash code for the string */
    private int hash; // Default to 0</string>

复制代码

在JDK1.7中,String类做了一些改动,主要是改变了substring方法执行时的行为,这和本文的主题不相关。JDK1.7中String类的主要成员变量就剩下了两个:

复制代码

public final class String
    implements java.io.Serializable, Comparable<string>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];
 
    /** Cache the hash code for the string */
    private int hash; // Default to 0</string>

复制代码

由以上的代码可以看出, 在Java中String类其实就是对字符数组(value)的封装。JDK6中, value是String封装的数组,offset是String在这个value数组中的起始位置,count是String所占的字符的个数。在JDK7中,只有一个value变量,也就是value中的所有字符都是属于String这个对象的。这个改变不影响本文的讨论。 除此之外还有一个hash成员变量,是该String对象的哈希值的缓存,这个成员变量也和本文的讨论无关。在Java中,数组也是对象(可以参考我之前的文章java中数组的特性)。 所以value也只是一个引用,它指向一个真正的数组对象。其实执行了String s = “ABCabc”; 这句代码之后,真正的内存布局应该是这样的:


value,offset和count这三个变量都是private的,并且没有提供setValue, setOffset和setCount等公共方法来修改这些值,所以在String类的外部无法修改String。也就是说一旦初始化就不能修改, 并且在String类的外部不能访问这三个成员。此外,value,offset和count这三个变量都是final的, 也就是说在String类内部,一旦这三个值初始化了, 也不能被改变。所以可以认为String对象是不可变的了。
那么在String中,明明存在一些方法,调用他们可以得到改变后的值。这些方法包括substring, replace, replaceAll, toLowerCase等。例如如下代码:

String a = "ABCabc";
System.out.println("a = " + a);
a = a.replace('A', 'a');
System.out.println("a = " + a);

打印结果为: a = ABCabc

a = aBCabc

那么a的值看似改变了,其实也是同样的误区。再次说明, a只是一个引用, 不是真正的字符串对象,在调用a.replace('A', 'a')时, 方法内部创建了一个新的String对象,并把这个新的对象重新赋给了引用a。String中replace方法的源码可以说明问题

读者可以自己查看其他方法,都是在方法内部重新创建新的String对象,并且返回这个新的对象,原来的对象是不会被改变的。这也是为什么像replace, substring,toLowerCase等方法都存在返回值的原因。也是为什么像下面这样调用不会改变对象的值:

String ss = "123456";
System.out.println("ss = " + ss);
ss.replace('1', '0');
System.out.println("ss = " + ss);

打印结果: ss = 123456

ss = 123456


String对象真的不可变吗?

从上文可知String的成员变量是private final 的,也就是初始化之后不可改变。那么在这几个成员中, value比较特殊,因为他是一个引用变量,而不是真正的对象。value是final修饰的,也就是说final不能再指向其他数组对象,那么我能改变value指向的数组吗? 比如将数组中的某个位置上的字符变为下划线“_”。 至少在我们自己写的普通代码中不能够做到,因为我们根本不能够访问到这个value引用,更不能通过这个引用去修改数组。 那么用什么方式可以访问私有成员呢? 没错,用反射, 可以反射出String对象中的value属性, 进而改变通过获得的value引用改变数组的结构。下面是实例代码:

复制代码

public static void testReflection() throws Exception {
     
    //创建字符串"Hello World", 并赋给引用s
    String s = "Hello World"; 
     
    System.out.println("s = " + s); //Hello World
     
    //获取String类中的value字段
    Field valueFieldOfString = String.class.getDeclaredField("value");
     
    //改变value属性的访问权限
    valueFieldOfString.setAccessible(true);
     
    //获取s对象上的value属性的值
    char[] value = (char[]) valueFieldOfString.get(s);
     
    //改变value所引用的数组中的第5个字符
    value[5] = '_';
     
    System.out.println("s = " + s);  //Hello_World
}

复制代码

打印结果为: s = Hello World

s = Hello_World

在这个过程中,s始终引用的同一个String对象,但是再反射前后,这个String对象发生了变化, 也就是说,通过反射是可以修改所谓的“不可变”对象的。但是一般我们不这么做。这个反射的实例还可以说明一个问题:如果一个对象,他组合的其他对象的状态是可以改变的,那么这个对象很可能不是不可变对象。例如一个Car对象,它组合了一个Wheel对象,虽然这个Wheel对象声明成了private final 的,但是这个Wheel对象内部的状态可以改变, 那么就不能很好的保证Car对象不可变。

### Java 中 StringStringBuffer 和 StringBuilder 的区别 #### 1. **基本概念** - `String` 表示不可变的字符序列。一旦创建了一个 `String` 对象,其内容就无法更改[^2]。 - `StringBuffer` 是一个可变的字符序列,并且是线程安全的。它的所有公共方法都被声明为同步方法,因此适合用于多线程环境[^4]。 - `StringBuilder` 同样是一个可变的字符序列,但它不是线程安全的,因此更适合于单线程环境下的字符串操作[^1]。 #### 2. **特性对比** | 特性 | String | StringBuffer | StringBuilder | |-----------------|----------------------------------|-----------------------------------|----------------------------------| | **可变性** | 不可变 | 可变 | 可变 | | **线程安全性** | 不适用 (因为不可变) | 线程安全 | 非线程安全 | | **性能** | 较低 (每次修改都生成新对象) | 单线程下较低,多线程下较高 | 单线程下最高 | ##### a. **可变性** - `String` 类的对象是不可变的,这意味着每当对字符串进行修改时,实际上会创建一个新的 `String` 对象来存储结果[^2]。 - 而 `StringBuffer` 和 `StringBuilder` 则允许直接在其内部缓冲区中修改数据,而不会生成新的对象。 ##### b. **线程安全性** - `StringBuffer` 提供了内置的线程安全保障机制,所有的方法都被标记为 `synchronized`,这使得它在多线程环境中表现良好,但也带来了额外的开销[^4]。 - `StringBuilder` 并未实现线程安全功能,因此在单线程环境下具有更高的执行效率。 ##### c. **性能** - 如果程序运行在一个单线程环境中并且需要频繁地修改字符串,则应优先考虑使用 `StringBuilder` 来提高性能[^1]。 - 当涉及到多个线程共享同一个字符串变量并对其进行修改时,应该选择 `StringBuffer` 以确保线程之间的协调工作正常进行。 #### 3. **为什么 String不可变的?** `String` 设计成不可变得原因主要有以下几个方面: - 安全性:如果 `String` 是可变的,在某些情况下可能会导致安全隐患。例如,当 `String` 被用作缓存键或者文件路径时,如果它可以被改变,那么可能导致意外的行为发生。 - 缓存优化:JVM会对常量池中的相同值的 `String` 进行重用。这种做法依赖于 `String` 的不变性,从而减少内存消耗。 - 哈希码计算一致性:由于 `String` 经常用做哈希表的关键字,所以保持它们的内容固定是非常重要的。这样可以保证即使经过多次调用也能得到相同的哈希码[^2]。 #### 4. **代码示例** 以下是三种类型的简单比较: ```java // 使用 String String s = "Hello"; s += " World"; // 实际上创建了一个新的 String 对象 System.out.println(s); // 使用 StringBuffer StringBuffer sbf = new StringBuffer("Hello"); sbf.append(" World"); // 修改原有对象 System.out.println(sbf.toString()); // 使用 StringBuilder StringBuilder sbd = new StringBuilder("Hello"); sbd.append(" World"); // 修改原有对象 System.out.println(sbd.toString()); ``` ### 结论 综上所述,对于不同的需求可以选择合适的类来进行处理。如果是简单的字符串连接或者其他少量改动的情况,推荐使用 `String`;而对于大量复杂的字符串操作则建议采用 `StringBuilder` 或者是在多线程条件下选用 `StringBuffer`[^4]。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值