线程池
线程池是管理线程的高级技术,通常它提供了如下功能:
- 通过对线程的管理,更加合理的调配资源。通常,线程池里维护着一组空闲线程,并向外提供,根据系统繁忙程度动态增加或减少空闲线程的数量。比较高级的还提供了自动检测异常线程的功能。
- 通过维护池中既存线程,可以节省创建线程的开销,尤其是对于web server这类处理频繁,而处理过程又比较快的程序,创建线程的开销是不能忽略的。
类似在裸机上加OS能够合理管理计算机资源,使用线程池能够低开销且有效的管理线程的生命周期和系统资源,同时提供更为方便易用的接口对外,使得开发更加快速安全。
对于简单的线程池,可以参考文章《Java 理论与实践: 线程池与工作队列》,这里实现了一个简单的带工作队列(Queue)的线程池,当然,也有一些简单的调度,这里就不再赘述。
线程池框架
相对于jdk1.5中的ThreadPoolExecutor中复杂的调度和规划,上面的例子还稍微简单了些。Doug Lee定义了命令模式的接口Executor,使得线程的执行逻辑和时序逻辑得到了分离,提高了健壮性和可扩张性,使得需求变化时不再是将整个程序重写而只需修改相应的执行逻辑----至于时序逻辑,交给ThreadPool吧,它会帮你搞定一切的。不相信?那不如让我们inside ThreadPoolExecutor去看看它是怎么实现这项神奇的功能。
首先我们对ThreadPoolExecutor的框架来一个总体的认识,ThreadPoolExecutor继承了AbstractExecutorService,后者实现了ExecutorService接口,同时ExecutorService又是Executor的子接口;也就是说ThreadPoolExecutor其实是一个Executor的实现。如图示。
ThreadPoolExecutor内部共有5个类,其中RejectExecutionHandler定义了对任务的丢弃方式,它之下有4个实例类。Worker类其实就是在线程池中执行的线程实体,所以它也很重要,可以注意到它被定义为一个内部类,从而可以方便的访问ThreadPoolExecutor类的方法。如图:

这里简单的先介绍一下这些与ThreadPoolExecutor有关的接口或类。Executor已经介绍过了,就是让逻辑分离而做的接口,它定义了抽象方法execute()。而ExecutorService则是负责管理一组任务的服务接口,它的一些实现都已经在其子类AbstractExecutorService中完成了。ThreadPoolExecutor需要实现execute()和shutdown()等抽象方法。
ThreadPoolExecutor代码分析
execute()是整个线程池最核心的方法,可以说线程池对任务的调度就是在这里实现的。来看for循环,如果当前线程池正在运行,则用reject策略将任务reject掉;如果当前线程数小于核心池数量,就new新线程来解决当前任务,注意即使是活动线程空闲也不会使用它们;一旦线程数超过核心池数量,则不再new新线程,而是向队列中添加任务,这里也分成功失败(队列满则失败),成功说明当前线程数满足当前任务数;失败就表示核心池数量的线程已经不能满足当前任务数了,这时就会启用后备线程;addIfUnderMaximumPoolSize(command)返回的结果其实有三种情况:1.新建线程处理当前任务;2.未新建成功;3.新建线程处理了队列里的任务,但未处理当前任务,前两种情况都在后面用if进行了判断,只有最后的情况是需要for循环重新处理的。
public void execute(Runnable command) { if (command == null) throw new NullPointerException(); for (;;) { if (runState != RUNNING) { reject(command); return; } if (poolSize < corePoolSize && addIfUnderCorePoolSize(command)) return; if (workQueue.offer(command)) return; Runnable r = addIfUnderMaximumPoolSize(command); if (r == command) return; if (r == null) { reject(command); return; } // else retry } } |
另外,addThread方法在整个类中也比较重要,是添加线程的入口方法,在上面提到的addIfUnderCorePoolSize和addIfUnderMaximumPoolSize中都使用过,此外两个重要的方法workDone和setPoolSize也分别用到了,因此,得记住这个方法的作用。我们来看看这个方法的实现。前面几句的确很混淆,实际上就是用Runnable生产了一个工人,而线程工厂使用了工人生产出一个线程,再用工人内部的一个属性指向这个线程。其实这里所做的是让t和w都有互相的引用,以便今后操作。
private Thread addThread(Runnable firstTask) { Worker w = new Worker(firstTask); Thread t = threadFactory.newThread(w); if (t != null) { w.thread = t; workers.add(w); int nt = ++poolSize; if (nt > largestPoolSize) largestPoolSize = nt; } return t; } |
理解了这两个方法,就大概理解了线程的调度策略,但是我们仍然没提到线程的生命周期,线程是何时开始何时结束的呢?一定别漏了addIfUnderCorePoolSize和addIfUnderMaximumPoolSize,线程就是在这里开始的。至于结束,可不要错过shutdown和shutdownNow方法。以shutdownNow为例(shutdown类似),判断了安全之后有个if判断当前是否还存在工人。如果还有工人则设置状态及立即中断所有worker(使用interrupt),否则直接中止,最后将工作队列的残留数直接返回。通过这个方法的分析,我们可以得知,如果需要中止线程池,希望回收资源时,可以调用这个方法(或shutdown),而中止的形式是以线程的interrupt来实现的。到此,线程怎么生存的就弄清楚了。
public List shutdownNow() { // Almost the same code as shutdown() SecurityManager security = System.getSecurityManager(); if (security != null) java.security.AccessController.checkPermission(shutdownPerm); boolean fullyTerminated = false; final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { if (workers.size() > 0) { if (security != null) { for (Worker w: workers) security.checkAccess(w.thread); } int state = runState; if (state != TERMINATED) runState = STOP; try { for (Worker w : workers) w.interruptNow(); } catch(SecurityException se) { runState = state; // back out; throw se; } } else { // If no workers, trigger full termination now fullyTerminated = true; runState = TERMINATED; termination.signalAll(); } } finally { mainLock.unlock(); } if (fullyTerminated) terminated(); return Arrays.asList(workQueue.toArray(EMPTY_RUNNABLE_ARRAY)); } |
剩下的主要方法就是对一些重要属性的set和get方法,由于可能会是多个线程并发调度,所以这些方法大都上了锁。另外需要注意的是beforeExecute,afterExecute,terminated三个方法,它们都是protected,并且都没有实现,可以知道这是留着给子类实现的,beforeExecute和afterExecute是在Worker类runTask()中被调用的,terminated方法则在刚刚分析过的shutdownNow中被调用。具体内容可以参看源码。
Worker线程
接下来,我们再深入讨论如何执行任务的细节,这里集中讨论Worker这个内部类是如何来执行一个任务的。首先来看run方法,while循环主要就是保证一直在做未完成的任务,getTask主要所做的就是从工作队列中得到一个Runnable。之后就是调用runTask。Thread.interrupted()主要作用是清除中断标志,就是说如果之前中断了,现在要再启动必须先清除中断标志。这里用到了before/after模式,在run之前做beforeExecute,而之后做afterExecute,重要的是ran,这个标志是用来做什么的呢,这是用来回滚的,如果在catch中ran=false,说明是task.run出错,这样势必没有执行到afterExecute,所以需要在catch中需要再run afterExecute。这段代码让我们对工人线程如何工作有了比较清晰的死路。
private void runTask(Runnable task) { final ReentrantLock runLock = this.runLock; runLock.lock(); try { if (runState == STOP) return; Thread.interrupted(); boolean ran = false; beforeExecute(thread, task); try { task.run(); ran = true; afterExecute(task, null); ++completedTasks; } catch(RuntimeException ex) { if (!ran) afterExecute(task, ex); throw ex; } } finally { runLock.unlock(); } } public void run() { try { Runnable task = firstTask; firstTask = null; while (task != null || (task = getTask()) != null) { runTask(task); task = null; // unnecessary but can help GC } } catch(InterruptedException ie) { // fall through } finally { workerDone(this); } } |
上面用到的getTask是ThreadPoolExecutor,可以看看getTask是用什么样的策略获得一个Runnable。如果还没超过核心池大小,就用take;如果超过了,就用poll。什么意思呢,如果没超过核心池,说明任务很少,我们就用take,即使队列被锁住了,无论如何也要等到一个任务;如果超过核心池,说明任务已经非常多了,工人线程等待一段时间还没有得到一个任务,就马上返回不再等下去。注意两个if判断之后还有一种可能,即等待一定时间后队列已经收缩到核心池以下,这时就需要for循环使用核心池获取任务的策略。
Runnable getTask() throws InterruptedException { for (;;) { switch(runState) { case RUNNING: { if (poolSize <= corePoolSize) // untimed wait if core return workQueue.take(); long timeout = keepAliveTime; if (timeout <= 0) // die immediately for 0 timeout return null; Runnable r = workQueue.poll(timeout, TimeUnit.NANOSECONDS); if (r != null) return r; if (poolSize > corePoolSize) // timed out return null; // else, after timeout, pool shrank so shouldn't die, so retry break; } …… |
线程池与命令模式
命令模式在设计中是相对常用的模式。典型的例子是点菜,作为客户(client)是命令的创建者;服务员是命令的发起者(invoker);而账单就是命令(command);厨师则是命令的执行者(receiver)。其实就是客户将菜单交给厨师的过程。为了解耦客户和厨师,我们有了服务员。现实中也一样,似乎没看到客户直接拿着菜单就去找厨师了。如图,这里省略了客户将Command塞给invoker的过程。
我们设计时往往将client和receiver紧耦合起来,比如在client中直接就receiver.do(message),这样的设计不能适应稍微的变更。而使用了命令模式之后,消息被解耦成为单独的Command对象,这样,Command可以动态装载的并且能够实行一系列在其上的操作,如undo等等。而这个消息也可以在多个对象之间共享。

对应与命令模式,线程池是如何做的呢?你一定猜到了,Runnable就是Command接口,在外面创建的Runnable实例就是ConcreteCommand,那么invoker呢?当然是ThreadPoolExecutor了。也就是说,在jdk中已经实现了差不多全部命令对象的角色,我们需要做的就是创建继承Runnable的ConcreteCommand,调用ThreadPoolExecutor.execute(ConcreteCommand)激发命令,则线程就能自动调度了,因为调度的逻辑已经写在ThreadPoolExecutor中。那么我们还需要实现Receiver吗?其实Receiver就是命令的执行者。而这里,命令的执行者其实是那个Worker线程。可以看到,jdk已经将可复用性做到了极致。
从这个例子可以看出,Runnable在ThreadPoolExecutor中其实是解耦外部的命令创建者和Worker的,否则全写在一起也就没有线程池调度的概念了。Executor其实是定义了Invoker的setCommand接口(即execute),由于invoker的出现,client就彻底的和receiver分离开了。
|
在多线程大师Doug Lea的贡献下,在JDK1.5中加入了许多对并发特性的支持,例如:线程池。 一、简介 线程池类为 java.util.concurrent.ThreadPoolExecutor,常用构造方法为: ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler) corePoolSize: 线程池维护线程的最少数量 maximumPoolSize:线程池维护线程的最大数量 keepAliveTime: 线程池维护线程所允许的空闲时间 unit: 线程池维护线程所允许的空闲时间的单位 workQueue: 线程池所使用的缓冲队列 handler: 线程池对拒绝任务的处理策略 一个任务通过 execute(Runnable)方法被添加到线程池,任务就是一个 Runnable类型的对象,任务的执行方法就是 Runnable类型对象的run()方法。 当一个任务通过execute(Runnable)方法欲添加到线程池时: 如果此时线程池中的数量小于corePoolSize,即使线程池中的线程都处于空闲状态,也要创建新的线程来处理被添加的任务。 如果此时线程池中的数量等于 corePoolSize,但是缓冲队列 workQueue未满,那么任务被放入缓冲队列。 如果此时线程池中的数量大于corePoolSize,缓冲队列workQueue满,并且线程池中的数量小于maximumPoolSize,建新的线程来处理被添加的任务。 如果此时线程池中的数量大于corePoolSize,缓冲队列workQueue满,并且线程池中的数量等于maximumPoolSize,那么通过 handler所指定的策略来处理此任务。 也就是:处理任务的优先级为: 核心线程corePoolSize、任务队列workQueue、最大线程maximumPoolSize,如果三者都满了,使用handler处理被拒绝的任务。 当线程池中的线程数量大于 corePoolSize时,如果某线程空闲时间超过keepAliveTime,线程将被终止。这样,线程池可以动态的调整池中的线程数。 unit可选的参数为java.util.concurrent.TimeUnit中的几个静态属性: NANOSECONDS、MICROSECONDS、MILLISECONDS、SECONDS。 workQueue我常用的是:java.util.concurrent.ArrayBlockingQueue handler有四个选择: ThreadPoolExecutor.AbortPolicy() 抛出java.util.concurrent.RejectedExecutionException异常 ThreadPoolExecutor.CallerRunsPolicy() 重试添加当前的任务,他会自动重复调用execute()方法 ThreadPoolExecutor.DiscardOldestPolicy() 抛弃旧的任务 ThreadPoolExecutor.DiscardPolicy() 抛弃当前的任务 二、一般用法举例 //------------------------------------------------------------ //TestThreadPool.java //package cn.simplelife.exercise; import java.io.Serializable; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.ThreadPoolExecutor; import java.util.concurrent.TimeUnit; public class TestThreadPool { private static int produceTaskSleepTime = 2; private static int consumeTaskSleepTime = 2000; private static int produceTaskMaxNumber = 10; public static void main(String[] args) { //构造一个线程池 ThreadPoolExecutor threadPool = new ThreadPoolExecutor(2, 4, 3, TimeUnit.SECONDS, new ArrayBlockingQueue<Runnable>(3), new ThreadPoolExecutor.DiscardOldestPolicy()); for(int i=1;i<=produceTaskMaxNumber;i++){ try { //产生一个任务,并将其加入到线程池 String task = "task@ " + i; System.out.println("put " + task); threadPool.execute(new ThreadPoolTask(task)); //便于观察,等待一段时间 Thread.sleep(produceTaskSleepTime); } catch (Exception e) { e.printStackTrace(); } } } /** * 线程池执行的任务 * @author hdpan */ public static class ThreadPoolTask implements Runnable,Serializable{ private static final long serialVersionUID = 0; //保存任务所需要的数据 private Object threadPoolTaskData; ThreadPoolTask(Object tasks){ this.threadPoolTaskData = tasks; } public void run(){ //处理一个任务,这里的处理方式太简单了,仅仅是一个打印语句 System.out.println("start .."+threadPoolTaskData); try { 便于观察,等待一段时间 Thread.sleep(consumeTaskSleepTime); } catch (Exception e) { e.printStackTrace(); } threadPoolTaskData = null; } public Object getTask(){ return this.threadPoolTaskData; } } } //------------------------------------------------------------ 说明: 1、在这段程序中,一个任务就是一个Runnable类型的对象,也就是一个ThreadPoolTask类型的对象。 2、一般来说任务除了处理方式外,还需要处理的数据,处理的数据通过构造方法传给任务。 3、在这段程序中,main()方法相当于一个残忍的领导,他派发出许多任务,丢给一个叫 threadPool的任劳任怨的小组来做。 这个小组里面队员至少有两个,如果他们两个忙不过来,任务就被放到任务列表里面。 如果积压的任务过多,多到任务列表都装不下(超过3个)的时候,就雇佣新的队员来帮忙。但是基于成本的考虑,不能雇佣太多的队员,至多只能雇佣 4个。 如果四个队员都在忙时,再有新的任务,这个小组就处理不了了,任务就会被通过一种策略来处理,我们的处理方式是不停的派发,直到接受这个任务为止(更残忍!呵呵)。 因为队员工作是需要成本的,如果工作很闲,闲到 3SECONDS都没有新的任务了,那么有的队员就会被解雇了,但是,为了小组的正常运转,即使工作再闲,小组的队员也不能少于两个。 4、通过调整 produceTaskSleepTime和 consumeTaskSleepTime的大小来实现对派发任务和处理任务的速度的控制,改变这两个值就可以观察不同速率下程序的工作情况。 5、通过调整4中所指的数据,再加上调整任务丢弃策略,换上其他三种策略,就可以看出不同策略下的不同处理方式。 6、对于其他的使用方法,参看jdk的帮助,很容易理解和使用。 | |