深入ThreadLocal的内部机制

最新推荐文章于 2022-12-06 17:15:11 发布

转载最新推荐文章于 2022-12-06 17:15:11 发布 · 2.1k 阅读

294 篇文章

订阅专栏

早在JDK 1.2的版本中就提供java.lang.ThreadLocal，ThreadLocal为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类可以很简洁地编写出优美的多线程程序。ThreadLocal并不是一个Thread，而是Thread的局部变量。当使用ThreadLocal维护变量时，ThreadLocal为每个使用该变量的线程提供独立的变量副本。

ThreadLocal的接口方法：

void set(Object value)：设置当前线程的线程局部变量的值。

public Object get()：该方法返回当前线程所对应的线程局部变量。

public void remove()：将当前线程局部变量的值删除，目的是为了减少内存的占用，该方法是JDK 5.0新增的方法。

需要指出的是，当线程结束后，对应该线程的局部变量将自动被垃圾回收，

所以显式调用该方法清除线程的局部变量并不是必须的操作，但它可以加快内存回收的速度。

protected Object initialValue()：返回该线程局部变量的初始值，该方法是一个protected的方法，显然是为了让子类覆盖而设计的。

这个方法是一个延迟调用方法，在线程第1次调用get()或set(Object)时才执行，

并且仅执行1次。ThreadLocal中的缺省实现直接返回一个null。

在JDK5.0中，ThreadLocal已经支持泛型，该类的类名已经变为ThreadLocal<T>。

ThreadLocal是如何做到为每一个线程维护变量的副本的呢？其实实现的思路很简单：在ThreadLocal类中有一个Map，用于存储每一个线程的变量副本

模拟ThreadLocal代码清单：

package cn.itcast.ref;

import java.util.Collections;

import java.util.HashMap;

import java.util.Map;

import java.util.Random;

public class MyThreadLocal {

//使用同步的map维护对象- 王健-QQ549051701

private static Map<Thread,Object> map =

Collections.synchronizedMap(new HashMap<Thread,Object>());

public static Object get(){

//获取当前线程

Thread currentThread = Thread.currentThread();

Object o = map.get(currentThread);

if(o==null){

o = new Random().nextInt(100);//假设是一个随机数

map.put(currentThread, o);

}

return o;

}

public static void remove(){

Thread currentThread = Thread.currentThread();

if(map.containsKey(currentThread)){

map.remove(currentThread);

}

虽然这个ThreadLocal实现版本显得比较幼稚，但它和JDK所提供的ThreadLocal类在实现思路上是相近的。

测试代码清单：

@Test

public void testMyThreadLocal(){

Object o1 = MyThreadLocal.get();

Object o2 = MyThreadLocal.get();

//以下因为是同一个线程所有值相同

System.err.println(o1+","+o2);

new Thread(){

public void run() {

//在新的线程中获取对象为不同的值

Object o3 = MyThreadLocal.get();

System.err.println("o3:"+o3);

};

}.start();

}

何时清除对象的问题

ThreadLocal可以很好的维护线程局部的对象，那么它是如何做到及时将对象从内存中回收的呢？

遍观ThreadLocal的源代码可知，ThreadLocal是通过弱引用实现对象可以在内存被及时清回收的，以下是从ThreadLocal内部类Entry的源代码，可见Entry内部是WeakReferences（弱引用）的子类，即一个弱引用而已：

static class Entry extends WeakReference<ThreadLocal> {

/** The value associated with this ThreadLocal. */

Object value;

Entry(ThreadLocal k, Object v) {

super(k);

value = v;

}

对象的引用

从JDK1.2版本开始，把对象的引用分为四种级别，从而使程序能更加灵活的控制对象的生命周期。这四种级别由高到低依次为：强引用、软引用、弱引用和虚引用。

1．强引用

Person p = new Persion();

一般情况下介绍的引用实际上都是强引用，这是使用最普遍的引用。如果一个对象具有强引用，那就类似于必不可少的生活用品，垃圾回收器绝不会回收它。当内存空间不足，Java虚拟机宁愿抛出OutOfMemoryError错误，使程序异常终止，也不会靠随意回收具有强引用的对象来解决内存不足问题。

2．软引用（SoftReference）

如果一个对象只具有软引用，那就类似于可有可物的生活用品。如果内存空间足够，垃圾回收器就不会回收它，如果内存空间不足了，就会回收这些对象的内存。只要垃圾回收器没有回收它，该对象就可以被程序使用。软引用可用来实现内存敏感的高速缓存。软引用可以和一个引用队列（ReferenceQueue）联合使用，如果软引用所引用的对象被垃圾回收，Java虚拟机就会把这个软引用加入到与之关联的引用队列中。

3．弱引用（WeakReference）

如果一个对象只具有弱引用，那就类似于可有可物的生活用品。弱引用与软引用的区别在于：只具有弱引用的对象拥有更短暂的生命周期。在垃圾回收器线程扫描它所管辖的内存区域的过程中，一旦发现了只具有弱引用的对象，不管当前内存空间足够与否，都会回收它的内存。不过，由于垃圾回收器是一个优先级很低的线程，因此不一定会很快发现那些只具有弱引用的对象。弱引用可以和一个引用队列（ReferenceQueue）联合使用，如果弱引用所引用的对象被垃圾回收，Java虚拟机就会把这个弱引用加入到与之关联的引用队列中。

4．虚引用（PhantomReference）

"虚引用"顾名思义，就是形同虚设，与其他几种引用都不同，虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用，那么它就和没有任何引用一样，在任何时候都可能被垃圾回收。虚引用主要用来跟踪对象被垃圾回收的活动。虚引用与软引用和弱引用的一个区别在于：虚引用必须和引用队列（ReferenceQueue）联合使用。当垃圾回收器准备回收一个对象时，如果发现它还有虚引用，就会在回收对象的内存之前，把这个虚引用加入到与之关联的引用队列中。程序可以通过判断引用队列中是否已经加入了虚引用，来了解被引用的对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列，那么就可以在所引用的对象的内存被回收之前采取必要的行动。

为弱引用使用较多：

弱引用的示例代码：

/**

* 弱引用的示例－王健 - QQ549051701

@Test

public void testRef2() throws Exception{

//声明一个引用队列

ReferenceQueue<Person> pp = new ReferenceQueue<Person>();

//声明一个弱引用对象,引用一个Person对象

WeakReference<Person> rq = new WeakReference<Person>(new Person("弱引用"),pp);

//催促垃圾回收，由于Person没有被任何变量引用，所以会被回收

System.gc();

//给垃圾回收器留出足够的时间

Thread.sleep(1000);

//被回收以后，获取到的p对象将变成null值

Person p = rq.get();

System.err.println("ppp:"+p);

//被回收以后的对象，将会放到回收队列中，但已经不可以再使用

Reference<? extends Person> ref= pp.poll();

//如果有对象已经被回收，则返回一个对象，否则返回null

System.err.println(">>:"+ref);

}

模拟使用弱引用实现的ThreadLoale

package cn.itcast.ref;

import java.lang.ref.WeakReference;

import java.util.HashMap;

import java.util.Map;

public class MyThreadLocale{

//声明为实例成员变量

private Map<MyThreadLocale, WeakReference<Object>> mm

= new HashMap<MyThreadLocale, WeakReference<Object>>();

public void set(Object t){

mm.put(this,new WeakReference<Object>(t));

}

public Object get(){

WeakReference<Object> wk = mm.get(this);

if(wk==null){

return null;

}else{

Object o = wk.get();

return o;

}

测试代码：

@Test

public void testWeak(){

MyThreadLocale mm = new MyThreadLocale();

mm.set(new Dog("Jack"));

Object o = mm.get();//只要是被强引用就不会被回收

System.gc();

Object oo = mm.get();

System.err.println("返回的值为："+oo);

}

以下是Dog类：

class Dog{

private String name;

public Dog(String name){

this.name=name;

}

@Override

public String toString() {

return "Dog [name=" + name + "]";

}

@Override

protected void finalize() throws Throwable {

System.err.println("OKOKOKK");

}

==============================================================

知其然

synchronized这类线程同步的机制可以解决多线程并发问题，在这种解决方案下，多个线程访问到的，都是同一份变量的内容。为了防止在多线程访问的过程中，可能会出现的并发错误。不得不对多个线程的访问进行同步，这样也就意味着，多个线程必须先后对变量的值进行访问或者修改，这是一种以延长访问时间来换取线程安全性的策略。

而ThreadLocal类为每一个线程都维护了自己独有的变量拷贝。每个线程都拥有了自己独立的一个变量，竞争条件被彻底消除了，那就没有任何必要对这些线程进行同步，它们也能最大限度的由CPU调度，并发执行。并且由于每个线程在访问该变量时，读取和修改的，都是自己独有的那一份变量拷贝，变量被彻底封闭在每个访问的线程中，并发错误出现的可能也完全消除了。对比前一种方案，这是一种以空间来换取线程安全性的策略。

来看一个运用ThreadLocal来实现数据库连接Connection对象线程隔离的例子。

 
import java.sql.Connection;
 
import java.sql.DriverManager;
 
import java.sql.SQLException;
 
 
 
public class ConnectionManager {
 
 
 
    private static ThreadLocal<Connection> connectionHolder = new ThreadLocal<Connection>( {
 
        @Override
 
        protected Connection initialValue() {
 
            Connection conn = null;
 
            try {
 
                conn = DriverManager.getConnection(
 
                        "jdbc:mysql://localhost:3306/test", "username",
 
                        "password");
 
            } catch (SQLException e) {
 
                e.printStackTrace();
 
            }
 
            return conn;
 
        }
 
    };
 
 
 
    public static Connection getConnection() {
 
        return connectionHolder.get();
 
    }
 
 
 
    public static void setConnection(Connection conn) {
 
        connectionHolder.set(conn);
 
    }
 
}

通过调用ConnectionManager.getConnection()方法，每个线程获取到的，都是和当前线程绑定的那个Connection对象，第一次获取时，是通过initialValue()方法的返回值来设置值的。通过ConnectionManager.setConnection(Connection conn)方法设置的Connection对象，也只会和当前线程绑定。这样就实现了Connection对象在多个线程中的完全隔离。在Spring容器中管理多线程环境下的Connection对象时，采用的思路和以上代码非常相似。

知其所以然

那么到底ThreadLocal类是如何实现这种“为每个线程提供不同的变量拷贝”的呢？先来看一下ThreadLocal的set()方法的源码是如何实现的：

 
    /**
 
     * Sets the current thread's copy of this thread-local variable
 
     * to the specified value.  Most subclasses will have no need to 
 
     * override this method, relying solely on the {@link #initialValue}
 
     * method to set the values of thread-locals.
 
     *
 
     * @param value the value to be stored in the current thread's copy of
 
     *        this thread-local.
 
     */
 
    public void set(T value) {
 
        Thread t = Thread.currentThread();
 
        ThreadLocalMap map = getMap(t);
 
        if (map != null)
 
            map.set(this, value);
 
        else
 
            createMap(t, value);
 
    }

没有什么魔法，在这个方法内部我们看到，首先通过getMap(Thread t)方法获取一个和当前线程相关的ThreadLocalMap，然后将变量的值设置到这个ThreadLocalMap对象中，当然如果获取到的ThreadLocalMap对象为空，就通过createMap方法创建。

线程隔离的秘密，就在于ThreadLocalMap这个类。ThreadLocalMap是ThreadLocal类的一个静态内部类，它实现了键值对的设置和获取（对比Map对象来理解），每个线程中都有一个独立的ThreadLocalMap副本，它所存储的值，只能被当前线程读取和修改。ThreadLocal类通过操作每一个线程特有的ThreadLocalMap副本，从而实现了变量访问在不同线程中的隔离。因为每个线程的变量都是自己特有的，完全不会有并发错误。还有一点就是，ThreadLocalMap存储的键值对中的键是this对象指向的ThreadLocal对象，而值就是你所设置的对象了。

为了加深理解，我们接着看上面代码中出现的getMap和createMap方法的实现：

 
ThreadLocalMap getMap(Thread t) {
 
        return t.threadLocals;
 
    }

 
void createMap(Thread t, T firstValue) {
 
        t.threadLocals = new ThreadLocalMap(this, firstValue);
 
    }

代码已经说的非常直白，就是获取和设置Thread内的一个叫threadLocals的变量，而这个变量的类型就是ThreadLocalMap，这样进一步验证了上文中的观点：每个线程都有自己独立的ThreadLocalMap对象。打开java.lang.Thread类的源代码，我们能得到更直观的证明：

 
/* ThreadLocal values pertaining to this thread. This map is maintained
 
     * by the ThreadLocal class. */
 
    ThreadLocal.ThreadLocalMap threadLocals = null;

那么接下来再看一下ThreadLocal类中的get()方法，代码是这么说的：

 
/**
 
     * Returns the value in the current thread's copy of this
 
     * thread-local variable.  If the variable has no value for the
 
     * current thread, it is first initialized to the value returned
 
     * by an invocation of the {@link #initialValue} method.
 
     *
 
     * @return the current thread's value of this thread-local
 
     */
 
    public T get() {
 
        Thread t = Thread.currentThread();
 
        ThreadLocalMap map = getMap(t);
 
        if (map != null) {
 
            ThreadLocalMap.Entry e = map.getEntry(this);
 
            if (e != null)
 
                return (T)e.value;
 
        }
 
        return setInitialValue();
 
    }
 
 
 
    /**
 
     * Variant of set() to establish initialValue. Used instead
 
     * of set() in case user has overridden the set() method.
 
     *
 
     * @return the initial value
 
     */
 
    private T setInitialValue() {
 
        T value = initialValue();
 
        Thread t = Thread.currentThread();
 
        ThreadLocalMap map = getMap(t);
 
        if (map != null)
 
            map.set(this, value);
 
        else
 
            createMap(t, value);
 
        return value;
 
    }

这两个方法的代码告诉我们，在获取和当前线程绑定的值时，ThreadLocalMap对象是以this指向的ThreadLocal对象为键进行查找的，这当然和前面set()方法的代码是相呼应的。

进一步地，我们可以创建不同的ThreadLocal实例来实现多个变量在不同线程间的访问隔离，为什么可以这么做？因为不同的ThreadLocal对象作为不同键，当然也可以在线程的ThreadLocalMap对象中设置不同的值了。通过ThreadLocal对象，在多线程中共享一个值和多个值的区别，就像你在一个HashMap对象中存储一个键值对和多个键值对一样，仅此而已。

设置到这些线程中的隔离变量，会不会导致内存泄漏呢？ThreadLocalMap对象保存在Thread对象中，当某个线程终止后，存储在其中的线程隔离的变量，也将作为Thread实例的垃圾被回收掉，所以完全不用担心内存泄漏的问题。在多个线程中隔离的变量，光荣的生，合理的死，真是圆满，不是么？

最后再提一句，ThreadLocal变量的这种隔离策略，也不是任何情况下都能使用的。如果多个线程并发访问的对象实例只允许，也只能创建那么一个，那就没有别的办法了，老老实实的使用同步机制来访问吧。