第6条:消除过期的对象引用
当我们从运用手工管理内存的语言时(例如C或者C++)转换到具有垃圾回收功能语言的时候,程序员的工作会变得更高价容易,因为当用完一个对象之后,它们在之后的时间会被自动回收。好多人可能觉得有人帮着收垃圾有点不太习惯= =,还有的人认为就类似请来了一位清洁工,自己就不用再考虑内存管理的事情了。但是事实上还是需要我们去干涉的,看下面的这个例子:
public class Stack {
private Object[] elements;
private int size = 0;
private static final int DEFAULT_INITIAL_CAPACITY = 16;
publci Stack() {
elements = new Object[DEFAULT_INITIAL_CAPACITY];
}
public void push(Object e) {
ensureCapacity();
elements[size++] = e;
}
public Object pop() {
if (0 == size) throw new EmptyStackException();
return elements[--size];
}
/**
* Ensure space for at least one more element
* roughly doubling the capacity each time the
* array needs to grow
* /
private void ensureCapacity() {
if (size == elements.length)
elements = Arrays.copyOf(elements, 2* size + 1);
}
}
上面的这段程序看上去貌似没有什么明显的错误,在平时用的过程中也觉得没什么问题,Stack挺好用的= =。不严格的讲,这段程序有一个”内存泄漏”,随着垃圾回收器活动的增加,或者由于内存占用的不断增加,程序性能的降低会逐渐表现出来。在极端的情况下,这种内存泄漏会导致磁盘交换(Disk Paging),甚至是程序崩溃(OutOfMemoryError错误),但是这种情况比较少见。
如果一个栈先增长,然后再收缩,那么,从栈中弹出来的对象将不会被当作垃圾回收,即使使用栈的程序不在使用这些对象,它们也不会被回收。这是因为,栈内部维护着这些对象的过期引用(obsolete reference)。所谓过期引用是指永远也不会再被解除的引用。在本例中,凡是elements数组的”活动部分(active portion)”之外的任何引用都是过期的。活动部分是指下标小于size的那些元素。
接下来对上面的小例子中的Arrays.copyOf(elements, 2 * size + 1)
进行源代码的追溯。
源码追溯
public static <T> T[] copyOf(T[] original, int newLength) {
return (T[]) copyOf(original, newLength, original.getClass());
}
先是进入了Arrays.java
类中,发现该方法直接调用了copyOf()方法。
public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
@SuppressWarnings("unchecked")
T[] copy = ((Object)newType == (Object)Object[].class)
? (T[]) new Object[newLength]
: (T[]) Array.newInstance(newType.getComponentType(), newLength);
System.arraycopy(original, 0, copy, 0, Math.min(origin.length, newLength);
return copy;
}
紧接着跟进到copyOf()方法中去,在这个里面检测了newType
的类型是否为Object[]
类型的,接着创建了对应类型的数组,并将之前的原数组里的数据通过System.arraycopy()
函数复制到新的数组里面。至于最后的这个方法,在源码里面是以native
方法给出的,看不到具体的代码。
在支持垃圾回收的语言中,内存泄漏是很隐蔽的(称这类内存泄漏为”无意识的对象保持(unintentional object retention)”更为恰当)。如果一个对象引用被无意识的保留起来了,那么,垃圾回收机制不仅不会处理这个对象,而且也不会处理被这个对象所引用的所有其他对象。即使只有少量的几个对象引用被无意识地保留了下来,也会有许许多多的对象被排除在垃圾回收机制之外,从而对性能造成潜在的重大影响。
这类问题的修复方法很简单:一旦对象引用已经过期,只需要清空这些引用即可,也就是指向null。对于上面的小例子来说,只要一个元素被弹出了栈,就将指向其的引用指为null。代码如下:
public Object pop() {
if (0 == size) throw new EmptyStackException();
Object result = elements[--size];
elements[size] = null;
return result;
}
当第一次接触到这么处理垃圾的时候,会发现自己会变得比较纠结= =。。对于每一个对象的引用,一旦程序不在用到它,就把它清空掉,这样做会把代码弄的很乱。手动的去管理内存,要结合代码当前所处的状态来考虑,上面的例子中,Stack类自己管理自己的内存,在一个数组里面存在着活动区和非活动区,在我们看来是这个样子的,但是在垃圾回收器看来,活动区和非活动区中所有对象的引用都等同于有效,都是存储在堆栈中的数据段。我们需要做的工作就是通过某种方式来让垃圾回收器知道非活动部分是不重要的,做法很简单:一旦数组元素变成了非活动部分的一部分,我们就手动清空数组元素。
一般而言,只要是类是自己管理内存,我们就需要警惕内存泄漏的问题,一旦元素被释放掉了(例如上面Stack里面的pop),则该元素中包含的任何对象的引用都应该被清空掉。