所有的Android开发者在面试的时候,肯定会遇到类似于下面这个Java 275必考题目:
String s1 = "abcdefg";
String s2 = s1.subString(1, 3);
System.out.println(s1);
System.out.println(s2);
Question: How many strings are created and what is the output of the above code?
在Java中,这道题的答案是:对象池中有2个字符串常量:“abcdefg”和“bc”,分别由s1和s2指向它们。程序输出为:
但是在Android中,这道题的答案有些许的不同,程序输出一样,但是对象池中只有一个字符串常量:“abcdefg”。
先来看看两个平台的String源码吧!源码中最大的不同在于成员变量,首先是Android 4.4(API Level 19):
下面是JDK 7的:
可以看到,Android的String类多了两个成员变量offset和length,很自然的想到这两个成员变量都是为char数组value来服务的,接下来去看看Android 4.4 String类的javadoc:

可以看到Android平台的String和Java一样,都是作为不变的常量来对待,都是指向底层的char数组(Android中叫做Backing Array),不同的是Andorid做了一个优化:不同的String对象可以共享同一个Backing Array,只是offset和length略有区别。例如String.subString()方法返回的String对象和调用该方法的源String对象ALWAYS共享同一个BackingArray。
这种优化的好处就像本文开始的那个题目一样,不需要创建那么多的char数组,但是坏处就是被多个String对象共享的Backing Array,只有在所有String对象都被GC的情况下才会被GC。这样会引起小猪挂大猪的现象,例如从一个长度很长的String对象中截取一个较短的子串String对象,虽然源String对象很快标记为垃圾,但是由于子串一直在代码中使用,导致较大的Backing Array一直得不到释放。
不过Android也提供了解决方案,采用下面的代码生成的子串,可以保证子串不会和源String对象共享Backing Array:
眼见为实,下面在Android和Java平台写段代码来验证下:
把上述代码添加到Android项目中任意一处可以执行到的地方,加上断点,在Debug模式下查看每个String的vlaue数组:

String s1 = "abcdefg";
String s2 = s1.subString(1, 3);
System.out.println(s1);
System.out.println(s2);
Question: How many strings are created and what is the output of the above code?
在Java中,这道题的答案是:对象池中有2个字符串常量:“abcdefg”和“bc”,分别由s1和s2指向它们。程序输出为:
abcdefg
bc
但是在Android中,这道题的答案有些许的不同,程序输出一样,但是对象池中只有一个字符串常量:“abcdefg”。
先来看看两个平台的String源码吧!源码中最大的不同在于成员变量,首先是Android 4.4(API Level 19):
public final class String implements Serializable, Comparable<String>, CharSequence {
...
private final char[] value;
private final int offset;
private final int count;
private int hashCode;
...
}
下面是JDK 7的:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0
...
}
可以看到,Android的String类多了两个成员变量offset和length,很自然的想到这两个成员变量都是为char数组value来服务的,接下来去看看Android 4.4 String类的javadoc:
可以看到Android平台的String和Java一样,都是作为不变的常量来对待,都是指向底层的char数组(Android中叫做Backing Array),不同的是Andorid做了一个优化:不同的String对象可以共享同一个Backing Array,只是offset和length略有区别。例如String.subString()方法返回的String对象和调用该方法的源String对象ALWAYS共享同一个BackingArray。
这种优化的好处就像本文开始的那个题目一样,不需要创建那么多的char数组,但是坏处就是被多个String对象共享的Backing Array,只有在所有String对象都被GC的情况下才会被GC。这样会引起小猪挂大猪的现象,例如从一个长度很长的String对象中截取一个较短的子串String对象,虽然源String对象很快标记为垃圾,但是由于子串一直在代码中使用,导致较大的Backing Array一直得不到释放。
不过Android也提供了解决方案,采用下面的代码生成的子串,可以保证子串不会和源String对象共享Backing Array:
String longString = "abcdefg-very-long-xyz";
String subString = new String(longString.subString(1, 2));
眼见为实,下面在Android和Java平台写段代码来验证下:
String s1 = "abcdefg";
String s2 = s1.substring(1, 3);
String s3 = "bc";
String s4 = new String(s1.substring(1, 3));
把上述代码添加到Android项目中任意一处可以执行到的地方,加上断点,在Debug模式下查看每个String的vlaue数组:
老实说,对Android API的关注,一直以来主要集中于非java命名的包上,看来以后也要对这些java包多多关注,哈哈
【后记】本文的测试是基于Android 4.4和Java 1.7的,感谢1楼同学的提醒,Java1.6中的String的行为和Android中类似,也会共享Backing Array。虽然其在Javadoc中并没有像Andorid那样显式说明。