Java线程理解:
线程是调度CPU的最小单元,也叫轻量级进程LMP(Light Weight Process)。
两种线程模型:
- 用户级线程(ULT):用户程序实现,不依赖操作系统核心,应用提供创建、同步、调度和管理线程的函数来控制用户线程。
不需要用户态/内核态切换,速度快。内核对ULT无感知,线程阻塞则进程(包括它的所有线程)阻塞。 - 内核级线程(KLT):系统内核管理线程(KLT),内核保存线程的状态和上下文信息,线程阻塞不会引起进程阻塞。在多处理器系统上,
多线程在多处理器上并行运行。线程的创建、调度和管理由内核完成,效率比ULT慢,比进程操作快。
其中,JVM使用的是KLT。
线程是CPU调度的最小单元
线程是我们程序运行的载体
Java线程与系统内核线程:
Java线程创建是依赖于系统内核,通过JVM调用系统库创建内核线程,内核线程与Java-Thread是1:1的关系
因此,线程的创建和销毁是比较费时间,消耗资源的。
所以对于线程,一般会进行池化管理。
线程池的意义:
线程是稀缺资源,它的创建与销毁是一个相对偏重且消耗资源的操作,而Java线程依赖于内核线程,创建线程需要进行操作系统状态切换
,为避免资源过度消耗需要设法重用线程执行多个任务。线程池就是一个线程缓存,负责对线程进行统一分配、调优与监控。
什么时候用线程池?
- 单个任务处理时间比较短
- 需要处理的任务数量很大
线程池优势:
- 重用存在的线程,减少线程创建、消亡,提高性能。
- 提高响应速度,当任务到达时,任务可以不需要等到线程创建就能立即执行。
- 提高线程的可管理性,可统一分配、调优和监控。
线程池原理:
下面为线程池工作原理图:
Java中线程池顶层接口是Executor,其中我们常用的实现类为ThreadPoolExecutor,其构造方法如下:
public ThreadPoolExecutor(int corePoolSize, //线程池中核心线程数的最大值
int maximumPoolSize,//线程池中能拥有最多线程数
long keepAliveTime,//表示空闲线程的存活时间。
TimeUnit unit,//表示keepAliveTime的单位。
BlockingQueue<Runnable> workQueue,//用于缓存任务的阻塞队列
ThreadFactory threadFactory,//
RejectedExecutionHandler handler//表示当workQueue已满,且池中的线程数达到maximumPoolSize时,线程池拒绝添加新任务时采取的策略。
) {
this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
threadFactory, defaultHandler);
}
注意,线程池并没有标记哪个线程是核心线程,哪个是非核心线程,线程池只关心核心线程的数量。
线程池拒绝策略,handler一般可以采取以下四种取值。
名称 | 说明 |
---|---|
ThreadPoolExecutor.AbortPolicy() | 抛出RejectedExecutionException异常 (缺省) |
ThreadPoolExecutor.CallerRunsPolicy() | 由向线程池提交任务的线程来执行该任务 |
ThreadPoolExecutor.DiscardOldestPolicy() | 抛弃最旧的任务(最先提交而没有得到执行的任务) |
ThreadPoolExecutor.DiscardPolicy() | 抛弃当前的任务 |
BlockingQueue 阻塞队列,遵循FIFO,在任意时刻,不管并发有多高,永远只有一个线程能够进行队列的入队或者出队操作。是一个线程安全的队列。
队列分为:有界和无界
有界队列:
队列满,只能进行出队操作,所有入队的操作必须等待,也就是被阻塞。
队列空,只能进行入队操作,所有出队的操作必须等待,也就是被阻塞。
workQueue:它决定了缓存任务的排队策略。对于不同的应用场景我们可能会采取不同的排队策略,这就需要不同类型的阻塞队列,在线程池中常用的阻塞队列有以下2种:
- SynchronousQueue:此队列中不缓存任何一个任务。向线程池提交任务时,如果没有空闲线程来运行任务,则入列操作会阻塞。当有线程来获取任务时,出列操作会唤醒执行入列操作的线程。从这个特性来看,SynchronousQueue是一个无界队列,因此当使用SynchronousQueue作为线程池的阻塞队列时,参数maximumPoolSizes没有任何作用。
- LinkedBlockingQueue:顾名思义是用链表实现的队列,可以是有界的,也可以是无界的,但在Executors中默认使用无界的。
线程池五种状态:
- Running 能接受新任务以及处理已添加的任务。
- Shutdown 不接受新任务,可以处理已经添加的任务。
- Stop 不接受新任务,不处理已经添加的任务,并且中断正在处理的任务。
- Tidying 所有的任务已经终止,ctl记录的"任务数量"为0,ctl负责记录线程池的运行状态与活动线程数量。
- Terminated 线程池彻底终止,则线程池转变为terminated状态。
用一个原子类ctl来表示线程池生命状态。用于保证在高并发状态下,线程池的安全。
源码解析:
Executors中的线程池的工厂方法
为了防止使用者错误搭配ThreadPoolExecutor构造函数的各个参数以及更加方便简洁的创建ThreadPoolExecutor对象,JavaSE中又定义了Executors类,Eexcutors类提供了创建常用配置线程池的方法。以下是Executors常用的三个创建线程池的源代码。
从源码中可以看出,Executors间接的调用了重载的ThreadPoolExecutor构造函数,并帮助用户根据不同的应用场景,配置不同的参数。
- newCachedThreadPool:使用SynchronousQueue作为阻塞队列,队列无界,线程的空闲时限为60秒。这种类型的线程池非常适用IO密集的服务,因为IO请求具有密集、数量巨大、不持续、服务器端CPU等待IO响应时间长的特点。服务器端为了能提高CPU的使用率就应该为每个IO请求都创建一个线程,以免CPU因为等待IO响应而空闲。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
- newFixedThreadPool:需指定核心线程数,核心线程数和最大线程数相同,使用LinkedBlockingQueue 作为阻塞队列,队列无界,线程空闲时间0秒。这种类型的线程池可以适用CPU密集的工作,在这种工作中CPU忙于计算而很少空闲,由于CPU能真正并发的执行的线程数是一定的(比如四核八线程),所以对于那些需要CPU进行大量计算的线程,创建的线程数超过CPU能够真正并发执行的线程数就没有太大的意义。
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
- newSingleThreadExecutor:池中只有一个线程工作,阻塞队列无界,它能保证按照任务提交的顺序来执行任务。
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
- newScheduleThreadPool:创建一个定长的线程池,而且支持定时的以及周期性的任务执行,支持定时及周期性任务执行。
public static ExecutorService newScheduleThreadPool() {
return new ThreadPoolExecutor
(0, Integer.MAX_VALUE,60L,TimeUnit.SECONDS,new SynchronousQueue<Runnable>());
}