写博客是自己对知识梳理,目前是写给自己看,算是自己学习后的作业,也是为了养成一个良好的习惯。
前言
本篇主要是自己对线程池基础的总结。
一、线程池简介
1. 线程池作用
1.1.降低资源消耗,通过重复利用已创建的线程降低线程创建、销毁造成的消耗;
1.2.提高响应速度,当任务到达时,可以不需要等待线程创建就能立即执行;
1.3.提高线程的可管理性。
2. 线程池组成
2.1.线程池管理器(ThreadPool):用于创建并管理线程池,包括创建、销毁线程池,添加新任务;
2.2.工作线程(PoolWorker):线程池中线程,在没有任务时处于等待状态,可以循环的执行任务;
2.3.任务接口(Task):每个任务必须实现的接口,以供工作线程调度任务的执行,它主要规定了任务的入口,任务执行完后的收尾工作,任务的执行状态等;
2.4.任务队列(taskQueue):用于存放没有处理的任务。提供一种缓冲机制。
二、Executors工具类
java中在JUC下有提供Executors的线程池工具类,Executors提供了五种线程池,具体如下图所示:
具体来看一下Executors几种线程池的实现:
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory) {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>(),
threadFactory));
}
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
....
阿里巴巴开发手册已经禁止了使用用Executors来创建线程池,因为它在高并发下会产生内存溢出或CPU飙高的问题,
先给出这个结论,下篇会分析一下具体的原因(不是本篇的重点)。
从上面的源码可以看到Executors工具类创建的线程都是基于以下这个接口:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
RejectedExecutionHandler handler);
三、线程池参数
1. corePoolSize:线程池的核心线程数,即便是线程池里没有任何任务,也会有corePoolSize个线程在候着等任务;
2. maximumPoolSize:最大线程数,不管你提交多少任务,线程池里最多工作线程数;
3. keepAliveTime:线程的存活时间。当线程池里的线程数大于corePoolSize时,如果等了keepAliveTime时长还没有任务可执行,则线程退出;
4. unit:这个用来指定keepAliveTime的单位,比如秒:TimeUnit.SECONDS;
5. workQueue:一个阻塞队列,提交的任务将会被放到这个队列里;
6. threadFactory:线程工厂,用来创建线程,主要是为了给线程起名字,有默认线程工厂;
7. handler:拒绝策略,当线程池里线程被耗尽,且队列也满了的时候会调用。
四、线程池工作原理
线程池工作原理:
1. 先判断当前线程数量是否大于corePoolSize,否则创建线程来执行任务,是则会执行下一步;
2. 判断workQueue队列是否已经满了,否则将任务号缓存到队列中等待执行,是则执行下一步;
3. 判断当前线程数量是否大于maximumPoolSize,否则创建线程执行任务,是则执行下一步;
4. 会调用handler,以表示线程池拒绝接收任务。
具体的过程如下图所示:
五、BlockingQueue
线程池可选择的阻塞队列:
1. 无界队列
队列大小无限制,常用的为无界的LinkedBlockingQueue,使用该队列做为阻塞队列时要尤其当心,
当任务耗时较长时可能会导致大量新任务在队列中堆积最终导致OOM,如Executors.newFixedThreadPool 。
2. 有界队列
常用的有两类,一类是遵循FIFO原则的队列如ArrayBlockingQueue,另一类是优先级队列如PriorityBlockingQueue。
3. 同步移交队列
一个不存储元素的阻塞队列,每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻
塞状态,吞吐量要高于LinkedBlockingQueue,Executors.newCachedThreadPool用的就是它。
通对newCachedThreadPool源码分析就可以得出,它在高并发下占用的CPU超高。则高并发下慎用。
六、拒绝策略
handler的四种拒绝策略:
1. AbortPolicy:直接抛出RejectedExecutionException异常,也是默认策略;
2. CallerRunsPolicy:只用调用者所在的线程来运行任务;
3. DiscardOldestPolicy:丢弃队列中最近的一个任务,执行当前任务;
4. DiscardPolicy:不处理,直接抛弃当前的任务。
七、线程池关闭
1. 为什么要关闭线程池?
线程资源池的释放,避免出现内存泄漏问题,都是在 finally 里关闭线程池。
2. 关闭线程池方式?
shutdown:将线程池的状态设置为SHUTDOWN状态,然后中断所有没有正在执行的任务的线程;
shutdownNow:将线程池状态设置为STOP状态,然后尝试停止所有正在执行任务或暂停的线程。
3. shutdown和shutdownNow区别?
线程池状态不同:shutdown执行时程池的状态是SHUTDOWN;shutdownNow执行时线程池状态是STOP;
关闭线程不同:shutdownNow执行后会将正在执行的线程中断,但shutdown不会。
八、相关问题
1. execute和submit区别?
1.1.execte是没有返回值,submit是有同步阻塞的返回值;
1.2.execte不好捕捉异常,submit可以通过捕获Future.get抛出的异常。
2. 设计线程池是否线程越多越好?
由于CPU的核心数有限,线程之间切换也需要开销,频繁的切换上下文会使性能降低,适得其反,
可以根业务类型来设置线程数。
3. 如何合理配置线程池?
3.1. 业务是CPU密集:会有大量的计算,需要尽量压榨CPU性能,应配置尽可能小的线程,参考值 Ncpu+1;
3.2. 业务是IO密集:会有大量的文件读写,尽可能多配置线程,参考值 2 * Ncpu。
4. 核心线程是否能被回收?
除非设置了 allowCoreTheadTimeOut = true .否则 核心线程即便没有任务也会存活等待任务。
总结
1. 在有高并发下业务下,禁止使用Executors创建线程池;
2. 线程池的线程数需要参考服务器CPU的核数及业务类型(CPU密集 or IO密集)来确认;
3. 使用线程池时要必须要清楚线程池的工作原理和参数详解;
4. 尽可能的结合业务使用ThreadPoolExecutor创建线程池。