String中substring方法内存泄漏问题

本文探讨了JDK中String类的substring方法在早期版本中存在的内存泄漏问题,特别是在JDK1.5及更早版本中。该问题源于substring方法内部对原始字符串的引用,导致垃圾回收机制无法正常工作。文章详细解析了问题根源,并对比了新旧版本的实现差异,展示了JDK1.7及后续版本如何通过修改构造函数解决了这一问题。

       众所周知,JDK中以前String类中的substring方法存在内存泄漏问题,之所以说是以前,是因为JDK1.7及以后的版本已经修复了,我看都说JDK1.6的版本也存在这个问题,但是我本机上安装的1.6看了看源码不存在内存泄漏问题啊,又看了1.7的源码,和我本机的1.6的一样,是不是我的1.6版版其实是1.7的?!唉,不管了,反正1.7版本肯定没有这个问题(1.5及更老版本肯定有)了,大家就放心的用吧。

之所以存在内存泄漏的问题,是因为原先的版本中,substring是这样实现的:

public String substring(int beginIndex, int endIndex) {
if (beginIndex < 0) {
throw new StringIndexOutOfBoundsException(beginIndex);
}
if (endIndex > count) {
throw new StringIndexOutOfBoundsException(endIndex);
}
if (beginIndex > endIndex) {
throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
}
return ((beginIndex == 0) && (endIndex == count)) ? this :
new String(offset + beginIndex, endIndex - beginIndex, value);
}

 而其中用到的String构造方法是这样的:

// Package private constructor which shares value array for speed.
String(int offset, int count, char value[]) {
this.value = value;
this.offset = offset;
this.count = count;
}

this.value=value这种实现就出现问题了,因为String类中有几个私有的成员变量:

/** The value is used for character storage. */
private final char value[];
/** The offset is the first index of the storage that is used. */
private final int offset;
/** The count is the number of characters in the String. */
private final int count;
/** Cache the hash code for the string */
private int hash; // Default to 0

明白了吧,这种实现还在引用着原先字符串变量的value[],通过offset和count返回一个长得像的“截取”后的字符串给人一种错觉,导致JVM认为这个最初字符串还在被引用着不对其gc,不过之所以这么做SUN公司(oracle 10年收购了)的JDK编写人员也是有原因的,就是效率问题,如注释所说:

 Package private constructor which shares value array for speed.  

这样导致的后果就是如果有一个很大很长的字符串我只需要其中的一小部分字符串用substring实现的话,如果让你看似得到的“新”的短小字符串一直没被JVM 回收的话,那么相当这个最初的大字符串也没被回收,尤其是你把这个短小“新”的字符串直接以引用的形式付给一个静态的全局变量,在加上如果访问数量很大,那应该“代价”还是蛮可观的,不过可以简单的这样new(s.substring())就避免了这个问题。

        新的JDK中substring之所以不存在这个问题了,是因为这个构造方法改成这样了:

public String(char value[], int offset, int count) {
if (offset < 0) {
throw new StringIndexOutOfBoundsException(offset);
}
if (count < 0) {
throw new StringIndexOutOfBoundsException(count);
}
// Note: offset or count might be near -1>>>1.
if (offset > value.length - count) {
throw new StringIndexOutOfBoundsException(offset + count);
}
this.offset = 0;
this.count = count;
this.value = Arrays.copyOfRange(value, offset, offset+count);
}

其中 value变量不再引用了而是重新新建了一个,所以没有这个问题了,是不是大家看完之后对这个方法有了更全新的认识?大笑

转载请注明—作者:Java我人生(陈磊兴)   原文出处:http://blog.youkuaiyun.com/chenleixing/article/details/43646255


       最后,认真看过的网友们,大神们,如有感觉我这个程序猿有哪个地方说的不对或者不妥或者你有很好的

议或者建议或点子方法,还望您大恩大德施舍n秒的时间留下你的宝贵文字(留言),以便你,我,还有广大的程序猿们更快地成长与进步.......



<think>我们正在讨论Java String类的substring方法。根据引用,substring方法用于从字符串中提取子串,有两个重载版本。下面我将详细解释如何使用这两个方法。</think>### Java String substring() 方法详解 Java 的 `substring()` 方法String 类中最常用的方法之一,用于从原始字符串中提取指定位置的子字符串。该方法有两个重载版本,均返回新字符串(原始字符串保持不变,因为 StringJava 中是不可变的)[^2][^3]。 #### 1. **基本语法** ```java // 提取从 beginIndex 开始到字符串末尾的子串 String substring(int beginIndex) // 提取从 beginIndex 开始到 endIndex 前一位的子串 String substring(int beginIndex, int endIndex) ``` #### 2. **参数说明** | 参数 | 说明 | 取值范围 | |------|------|----------| | `beginIndex` | 子串起始索引(包含) | $[0, \text{str.length()})$ | | `endIndex` | 子串结束索引(不包含) | $[\text{beginIndex}, \text{str.length()}]$ | > **索引规则**:Java 字符串索引从 0 开始,最大索引为 $\text{length()} - 1$。 #### 3. **使用示例** 假设原始字符串:`String str = "Hello, World!";`(长度 = 13) | 方法调用 | 返回值 | 说明 | |----------|--------|------| | `str.substring(7)` | `"World!"` | 从索引 7 开始到末尾 | | `str.substring(0, 5)` | `"Hello"` | 索引 0-4(不含 5) | | `str.substring(7, 12)` | `"World"` | 索引 7-11(不含 12) | | `str.substring(13)` | `""`(空字符串) | 索引等于长度时返回空串 | | `str.substring(2, 2)` | `""` | 起始索引 = 结束索引时返回空串 | #### 4. **边界情况处理** - **索引越界**:会抛出 `StringIndexOutOfBoundsException` ```java str.substring(-1); // 错误:索引 < 0 str.substring(14); // 错误:索引 > length() str.substring(5, 20); // 错误:endIndex > length() ``` - **特殊截取场景**: ```java // 获取最后5个字符 str.substring(str.length() - 5); // "orld!" // 获取第一个字符 str.substring(0, 1); // "H" ``` #### 5. **实际应用场景** 1. **提取身份证出生日期**(假设格式:`"110105199001011234"`) ```java String id = "110105199001011234"; String birth = id.substring(6, 14); // "19900101" ``` 2. **文件路径截取** ```java String path = "/home/user/docs/report.txt"; String fileName = path.substring(path.lastIndexOf("/") + 1); // "report.txt" ``` 3. **关键词提取** ```java String log = "ERROR: Database connection failed"; if (log.startsWith("ERROR")) { String msg = log.substring(7); // "Database connection failed" } ``` #### 6. **重要注意事项** 1. **索引包含规则**:子串包含 `beginIndex` 字符,不包含 `endIndex` 字符 - 数学表示:子串 = $\text{str}[ \text{beginIndex}, \text{endIndex} )$ 2. **内存优化**(Java 7+): - Java 7 前:子串共享原始字符数组,可能导致内存泄漏 - Java 7+:子串创建新数组,牺牲性能换安全性[^1] 3. **与 `split()` 对比**: - `substring()`:按位置截取 - `split()`:按分隔符拆分(返回数组) > 完整示例代码: > ```java > public class SubstringDemo { > public static void main(String[] args) { > String text = "Java Programming"; > System.out.println(text.substring(5)); // "Programming" > System.out.println(text.substring(0, 4)); // "Java" > System.out.println(text.substring(5, 9)); // "Prog" > } > } > ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值