因为会创建大量的StringBuilder对象在堆内存中,这肯定是不允许的,所以这时就建议在循环外创建一个StringBuilder对象,然后循环内调用append方法进行手动拼接。
还有一种特殊情况,如果“+”拼接的是字符串常量中的字符串时,编译器会进行优化,直接将两个字符串常量拼接好。
所以,“+”连接符对于直接相加的字符串常量效率很高,因为在编译期间便确定了它的值;但对于间接相加的情况效率就会变低,建议单线程时使用StringBuilder,多线程时使用StringBuffer替代。
三、String、StringBuilder和StringBuffer
1、主要区别
-
String是不可变字符序列,StringBuilder和StringBuffer是可变字符序列。
-
执行速度StringBuilder > StringBuffer > String。
-
StringBuilder是非线程安全的,StringBuffer是线程安全的。
2、效率测试
import java.util.ArrayList;
import java.util.List;
import java.util.StringJoiner;
public class StringTest {
private static void test01() {
String str = “哪吒,”;
String ret = “”;
System.out.println(“+字符串拼接开始…”);
long start = System.currentTimeMillis();
// + 在循环中的效率太低,用10万条测试吧
for (int i = 0; i < 100000; i++) {
ret += str;
}
long end = System.currentTimeMillis();
System.out.println(“+号拼接10万条数据耗时:”+(end-start)+“ms”);//18288ms
System.out.println(“************”);
}
private static void test02() {
String str = “哪吒,”;
StringBuilder builder = new StringBuilder();
System.out.println(“StringBuilder,字符串拼接开始…”);
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
builder.append(str);
}
long end = System.currentTimeMillis();
System.out.println(“StringBuilder拼接1000万条数据耗时:”+(end-start)+“ms”);//168ms,173ms,239ms
System.out.println(“************”);
}
private static void test03() {
String str = “哪吒,”;
StringBuffer buffer = new StringBuffer();
System.out.println(“StringBuffer,字符串拼接开始…”);
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
buffer.append(str);
}
long end = System.currentTimeMillis();
System.out.println(“StringBuffer拼接1000万条数据耗时:”+(end-start)+“ms”);//527ms,343ms,398ms
System.out.println(“************”);
}
/**
- StringJoiner的效率明显高于List + StringJoiner
*/
private static void test04() {
String str = “哪吒”;
StringJoiner join = new StringJoiner(“,”);
Syste
m.out.println(“StringJoiner,字符串拼接开始…”);
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
join.add(str);
}
long end = System.currentTimeMillis();
System.out.println(“StringJoiner拼接1000万条数据耗时:”+(end-start)+“ms”);//184ms,316ms,243ms
System.out.println(“************”);
}
private static void test05() {
String str = “哪吒”;
List list = new ArrayList();
System.out.println(“List + StringJoiner,字符串拼接开始…”);
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
list.add(str);
}
String ret = String.join(“,”, list);
long end = System.currentTimeMillis();
System.out.println(“List + StringJoiner拼接1000万条数据耗时:”+(end-start)+“ms”);//563ms,477ms,585ms
System.out.println(“************”);
}
public static void main(String[] args) {
test02();
}
}
3、控制台输出
总结:StringBuilder效率最高,+拼接效率最低。
4、源码分析
StringBuilder的源码
@Override
public StringBuilder append(char[] str) {
super.append(str);
return this;
}
StringBuilder继承AbstractStringBuilder
类
public final class StringBuilder
extends AbstractStringBuilder
implements java.io.Serializable, CharSequence
{
…
}
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
append会直接拷贝字符到内部的字符数组中,如果字符数组长度不够,会进行扩展。
StringBuffer和StringBuilder的情况类似,只不过StringBuffer是线程安全的而已。
四、字符串常量池
1、百度百科
常量池在java用于保存在编译期已确定的,已编译的class文件中的一份数据。它包括了关于类,方法,接口等中的常量,也包括字符串常量,如String s = "java"这种申明方式;当然也可扩充,执行器产生的常量也会放入常量池,故认为常量池是JVM的一块特殊的内存空间。
2、字符串的对象分配
字符串的对象分配是需要消耗大量的时间和空间的,而且字符串使用的非常多,很多初级程序员,会将所有的变量都定义为String,不知你年轻的时候是不是这样,哈哈。
JVM为了提高性能和减少内存的开销,在实例化字符串的时候进行了一系列的优化,那就是字符串常量池。JVM会先检查字符串常量池,如果已经存在,就直接返回字符串常量池中的实例引用,如果不存在,就会实例化该字符串并将其放到字符串常量池中。由于String的不可变性,常量池中一定不存在两个相同的字符串。
3、内存区域
在HotSpot VM中字符串常量池是通过一个StringTable类实现的,它是一个Hash表,默认值大小长度是1009;这个StringTable在每个HotSpot VM的实例中只有一份,被所有的类共享;字符串常量由一个一个字符组成,放在了StringTable上。要注意的是,如果放进String Pool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String.intern时性能会大幅下降。
4、举个例子一目了然
public class StringTest {
public static void main(String[] args) {
// 1. 新建一个引用s1指向堆中的对象s1,值为"优快云哪吒"
String s1=new String(“优快云”)+new String(“哪吒”);
// 2. 新建一个引用s2指向堆中的对象s2,值为"优快云哪吒"
String s2=new String(“CS”)+new String(“DN哪吒”);
// 3. 执行s1.intern()会在字符串常量池中新建一个引用"优快云哪吒",该引用指向s1在堆中的地址,并新建一个引用s3指向字符串常量池中的"优快云哪吒"
String s3=s1.intern();
// 4. 执行s2.intern()不会在字符串常量池中创建新的引用,因为"优快云哪吒"已存在,因此只执行了新建一个引用s4指向字符串常量池中"优快云哪吒"的操作
String s4=s2.intern();
// s3和s4指向的都是字符串常量池中的"优快云哪吒",而这个"优快云哪吒"都指向堆中s1的地址
System.out.println(s1==s3); // true
System.out.println(s1==s4); // true
// s3和s4最终关联堆中的地址是对象s1
System.out.println(s2 == s3);// false
System.out.println(s2 == s4);// false
}
}
五、intern()方法
直接使用双引号声明出来的String对象会直接存储在字符串常量池中,如果不是用双引号声明的String对象,可以使用String提供的intern方法。intern 方法是一个native方法,intern方法会从字符串常量池中查询当前字符串是否存在,如果存在,就直接返回当前字符串;如果不存在就会将当前字符串放入常量池中,之后再返回。
JDK1.7的改动:
-
将String常量池 从 Perm 区移动到了 Java Heap区
-
String.intern() 方法时,如果存在堆中的对象,会直接保存对象的引用,而不会重新创建对象。
上一篇:【Java基础知识 7】toString()、String.valueOf、(String)强转
下一篇:【Java基础知识 9】序列化与反序列化
添加微信,备注1024,赠送Java学习路线思维导图