substring(int beginIndex, int endIndex)方法在JDK6和JDK7中是不同的。明白它们之间的差别可以帮助我们更好的使用这个方法。为了简单起见,下面使用substring()代替substring(int beginIndex, int endIndex)。
1.substring()是干什么用的?
substring(int beginIndex, int endIndex)方法返回一个从beginIndex开始到endIndex-1结束的字符串。
String x = "abcdef";
x = x.substring(1,3);
System.out.println(x);
输出:
bc
2.substring()被调用时发生了什么事?
你可能知道x是不可变的,当x被赋予x.substring(1,3)的值时,它像下面这样指向了一个新的字符串:
然而,这张图并不完全正确,它示范了在堆中发生了什么事情。substring()被调用时到底发生了什么在JDK6和JDK7中是不同的。
3.JDK6 中的substring()
字符串由一个字符数组维护。在JDK6中,String类包含3个字段:char[] value,int offset,int count,它们被用来存储真实的字符数组,数组的第一个索引,字符串中字符个数。
当substring()方法被调用时,它会创建一个新的字符串,但字符串的值任然指向堆中的同一个字符数组。两个字符串之间差别在于它们的count和offset的值。
下面的代码很简单,仅包含解释这个问题的关键点:
//JDK 6
String(int offset, int count, char value[]) {
this.value = value;
this.offset = offset;
this.count = count;
}
public String substring(int beginIndex, int endIndex) {
//check boundary
return new String(offset + beginIndex, endIndex - beginIndex, value);
}
4.由JDK6中的substring()方法引起的一个问题
如果你有一个非常长的字符串,但是你仅需要其中很小的一部分。这会引发一个性能问题,只因为你需要很小的一部分,就需要维护整个字符串。对于JDK6,你可以利用下面的代码来解决这个问题,这会让x指向一个真正的子字符串:
x = x.substring(x, y) + ""
5.JDK7中的substring()
在JDK7中改进了这个方法。在JDK7中,substring()方法在堆中创建了一个新的数组。
//JDK 7
public String(char value[], int offset, int count) {
//check boundary
this.value = Arrays.copyOfRange(value, offset, offset + count);
}
public String substring(int beginIndex, int endIndex) {
//check boundary
int subLen = endIndex - beginIndex;
return new String(value, beginIndex, subLen);
}