为什么Java字符串是不可变对象？

最新推荐文章于 2022-08-29 08:56:33 发布

转载最新推荐文章于 2022-08-29 08:56:33 发布 · 796 阅读

文章标签：

#string #stringbuilder #安全 #对象 #不可变对象

Java 专栏收录该内容

4 篇文章

订阅专栏

本文探讨了Java中String类不可变性的原因及其带来的多种优势，包括提高字符串池效率、缓存HashCode、确保多线程安全及防止安全漏洞。

java中有一些对象，是不可变对象，而String正是这类对象中的一个，而它的另一个哥们StringBuilder不是。这也是为什么在进行大量的字符串拼接推荐使用StrigBuilder（正如它的名字所表示的）而不是String本身。因为String在改变的过程中会产生大量的String对象，而StringBuilder如果不去创建，它仍是原来的。

转了一个文章，对于java 为什么将String设计为不可变对象解释的很好，一句话总结：为了安全。

------------------------------------------------------------------------------------------

本文主要来介绍一下Java中的不可变对象，以及Java中String类的不可变性，那么为什么Java的String类是不可变对象?让我们一起来分析一下。

答案一：

最流行的Java面试题之一就是：什么是不可变对象(immutable object)，不可变对象有什么好处，在什么情况下应该用，或者更具体一些，Java的String类为什么要设成immutable类型?

不可变对象，顾名思义就是创建后不可以改变的对象，典型的例子就是Java中的String类。

String s = "ABC"; 
s.toLowerCase();

如上s.toLowerCase()并没有改变“ABC“的值，而是创建了一个新的String类“abc”，然后将新的实例的指向变量s。

相对于可变对象，不可变对象有很多优势：

1).不可变对象可以提高String Pool的效率和安全性。如果你知道一个对象是不可变的，那么需要拷贝这个对象的内容时，就不用复制它的本身而只是复制它的地址，复制地址(通常一个指针的大小)需要很小的内存效率也很高。对于同时引用这个“ABC”的其他变量也不会造成影响。

2).不可变对象对于多线程是安全的，因为在多线程同时进行的情况下，一个可变对象的值很可能被其他进程改变，这样会造成不可预期的结果，而使用不可变对象就可以避免这种情况。

当然也有其他方面原因，但是Java把String设成immutable最大的原因应该是效率和安全。

答案二：

这是一个老生常谈的话题(This is an old yet still popular question). 在Java中将String设计成不可变的是综合考虑到各种因素的结果,想要理解这个问题,需要综合内存,同步,数据结构以及安全等方面的考虑. 在下文中,我将为各种原因做一个小结。

1. 字符串常量池的需要

字符串常量池(String pool, String intern pool, String保留池) 是Java堆内存中一个特殊的存储区域, 当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象。

如下面的代码所示,将会在堆内存中只创建一个实际String对象.

String s1 = "abcd"; 
String s2 = "abcd";

请思考: 假若代码如下所示，s1和s2还会指向同一个实际的String对象吗?假若字符串对象允许改变,那么将会导致各种逻辑错误,比如改变一个对象会影响到另一个独立对象. 严格来说，这种常量池的思想,是一种优化手段.

String s1= "ab" + "cd"; 
String s2= "abc" + "d";

也许这个问题违反新手的直觉, 但是考虑到现代编译器会进行常规的优化, 所以他们都会指向常量池中的同一个对象. 或者,你可以用 jd-gui 之类的工具查看一下编译后的class文件.

2. 允许String对象缓存HashCode

Java中String对象的哈希码被频繁地使用, 比如在hashMap 等容器中。

字符串不变性保证了hash码的唯一性,因此可以放心地进行缓存.这也是一种性能优化手段,意味着不必每次都去计算新的哈希码. 在String类的定义中有如下代码:

private int hash;//用来缓存HashCode

3. 安全性

String被许多的Java类(库)用来当做参数,例如网络连接地址URL,文件路径path,还有反射机制所需要的String参数等, 假若String不是固定不变的,将会引起各种安全隐患。

假如有如下的代码:

boolean connect(string s){ 
	if (!isSecure(s)) { 
		throw new SecurityException(); 
	} 
 	// 如果在其他地方可以修改String,那么此处就会引起各种预料不到的问题/错误 
	causeProblem(s); 
}

总体来说, String不可变的原因包括设计考虑,效率优化问题,以及安全性这三大方面. 事实上,这也是Java面试中的许多 “为什么” 的答案。

答案三：String类不可变性的好处

String是所有语言中最常用的一个类。我们知道在Java中，String是不可变的、final的。Java在运行时也保存了一个字符串池(String pool)，这使得String成为了一个特别的类。

String类不可变性的好处

1.只有当字符串是不可变的，字符串池才有可能实现。字符串池的实现可以在运行时节约很多heap空间，因为不同的字符串变量都指向池中的同一个字符串。但如果字符串是可变的，那么String interning将不能实现(译者注：String interning是指对不同的字符串仅仅只保存一个，即不会保存多个相同的字符串。)，因为这样的话，如果变量改变了它的值，那么其它指向这个值的变量的值也会一起改变。

2.如果字符串是可变的，那么会引起很严重的安全问题。譬如，数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接，或者在socket编程中，主机名和端口都是以字符串的形式传入。因为字符串是不可变的，所以它的值是不可改变的，否则黑客们可以钻到空子，改变字符串指向的对象的值，造成安全漏洞。

3.因为字符串是不可变的，所以是多线程安全的，同一个字符串实例可以被多个线程共享。这样便不用因为线程安全问题而使用同步。字符串自己便是线程安全的。

4.类加载器要用到字符串，不可变性提供了安全性，以便正确的类被加载。譬如你想加载java.sql.Connection类，而这个值被改成了myhacked.Connection，那么会对你的数据库造成不可知的破坏。

5.因为字符串是不可变的，所以在它创建的时候hashcode就被缓存了，不需要重新计算。这就使得字符串很适合作为Map中的键，字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。

以上就是我总结的Java字符串不可变性的好处，希望对你有所帮助。