本篇内容包括:线程池概述、Java 线程池的几个重要参数、线程池的执行流程、拒绝策略以及线程池状态、Java 线程池的使用(常用的线程池、Executor 框架、ThreadPoolExecutor创建线程池、Executor 框架的继承关系)等内容。
一、线程池概述
池化技术现在已经屡见不鲜了,线程池、数据库连接池、Http 连接池等等都是对这个思想的应用。池化技术的思想主要是为了减少每次获取资源的消耗,提高对资源的利用率。
线程池(Thread Pool)是一种基于池化思想管理线程的工具,由于创建和关闭线程需要花费时间,如果为每一个任务都创建一个线程,非常消耗资源。使用线程池可以避免增加创建和销毁线程的资源消耗,提高响应速度,且能重复利用线程。在使用线程池后,创建线程就变成了从线程池中获取空闲线程,关闭线程变成了向线程池归还线程。
线程池做的工作主要是控制运行的线程的数量,处理过程中将任务放入队列,然后在线程创建后启动这些任务,使用完毕不需要销毁线程而是放回池中,如果线程数量超过了最大数量超出数量的线程排队等候,等其它线程执行完毕,再从队列中取出任务来执行。他的主要特点为:线程复用、控制最大并发数、管理线程。
使用线程池的好处:
- 降低资源消耗:通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
- 提高响应速度:当任务到达时,任务可以不需要的等到线程创建就能立即执行。
- 提高线程的可管理性:线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控。
二、Java 线程池的执行流程
1、线程池的几个重要参数
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
- corePoolSize: 线程池中核心线程的数量
- maximumPoolSize :线程池中最大线程数量
- keepAliveTime:非核心线程的存活时间
- TimeUnit unit:存活时间单位
- workQueue:任务队列
- threadFactory:线程工厂,用于创建线程,一般用默认的即可
- handler:拒绝策略,当队列满了并且工作线程大于等于线程池的最大线程数
2、线程池的执行流程
- 在创建线程池后,等待提交过来的任务请求;
- 当调用
execute()
方法添加一个请求任务时,线程池会做如下判断:
- 如果正在运行的线程数量小于corePoolSize,那么马上创建核心线程运行这个任务;
- 如果正在运行的线程数量大于或者等于corePoolSize,那么将这个任务放入任务队列中;
- 如果任务队列满了且正在运行的线程数量小于 maximumPoolSize(最大线程数),那么创建一个非核心线程立刻运行这个任务;
- 如果任务队列满了且正在运行的线程数量大于或等于 maximumPoolSize,线程池会执行拒绝策略;
- 当一个线程完成任务时,会在队列中取下一个任务来执行;
- 当一个线程无事可做超过一定时间时,线程池会停掉。
3、拒绝策略
线程池任务队列满了,同时也达到了最大线程数,无法创建新的非核心线程去处理任务,此时需要拒绝策略。
- AbortPolicy:抛出 RejectedExecutionException 异常阻止系统正常进行;
- DiscardPolicy:直接丢弃任务,不处理也不抛出异常;
- DiscardOldestPolicy:丢弃任务队列中等待最久的任务,将当前任务放入任务队列中;
- CallerRunsPolicy:将任务回退到调用者,由调用线程处理该任务(不会丢弃任务,但是性能极有可能会急剧下降)。
4、线程池状态
- RUNNING:这个状态表明线程池处于正常状态,可以处理任务,可以接受任务
- SHUTDOWN:这个状态表明线程池处于正常关闭状态,不再接受任务,但是可以处理线程池中剩余的任务
- STOP:这个状态表明线程池处于停止状态,不仅不会再接收新任务,并且还会打断正在执行的任务
- TIDYING:这个状态表明线程池已经没有了任务,所有的任务都被停掉了
- TERMINATED:线程池彻底终止状态
三、Java 线程池的使用
1、常用的线程池
Java 中的 Executor 接口定义一个执行线程的工具。它的子类型即线程池接口是 ExecutorService 。要配置一个线程池是比较复杂的,尤其是对于线程池的原理不是很清楚的情况下,因此在工具类 Executors 下面提供了一些静态工厂方法,生成一些常用的线程池
- newSingleThreadExecutor:创建一个单线程的线程池。这个线程池只有一个线程在工作,也就是相当于单线程串行执行所有任务。如果这个唯一的线程因为异常结束,那么会有一个新的线程来替代它。此线程池保证所有任务的执行顺序按照任务的提交顺序执行。
- newFixedThreadPool:创建固定大小的线程池。每次提交一个任务就创建一个线程,直到线程达到线程池的最大大小。线程池的大小一旦达到最大值就会保持不变,如果某个线程因为执行异常而结束,那么线程池会补充一个新线程。
- newCachedThreadPool:创建一个可缓存的线程池。如果线程池的大小超过了处理任务所需要的线程,那么就会回收部分空闲(60秒不执行任务)的线程,当任务数增加时,此线程池又可以智能的添加新线程来处理任务。此线程池不会对线程池大小做限制,线程池大小完全依赖于操作系统(或者说JVM)能够创建的最大线程大小。
- newScheduledThreadPool:创建一个大小无限的线程池。此线程池支持定时以及周期性执行任务的需求。
阿里编码规约:线程池不允许使用 Executors 去创建,而是通过 ThreadPoolExecutor 的方式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。
Executors 各个方法的弊端:
- newFixedThreadPool和newSingleThreadExecutor:主要问题是堆积的请求处理队列可能会耗费非常大的内存,甚至 OOM。
- newCachedThreadPool和newScheduledThreadPool:主要问题是线程数最大数是 Integer.MAX_VALUE,可能会创建数量非常多的线程,甚至OOM
2、Executor 框架
Java 中的线程池是通过 Executor 框架实现的,该框架中用到了Executor,Executors,ExecutorService,ThreadPoolExecutor ,Callable 和 Future、FutureTask 这几个类
Executor 框架是 Java5 之后引进的,在 Java 5 之后,通过 Executor 来启动线程比使用 Thread 的 start 方法更好,除了更易管理,效率更好(用线程池实现,节约开销)外,还有关键的一点:有助于避免 this 逃逸问题。
this 逃逸是指在构造函数返回之前其他线程就持有该对象的引用. 调用尚未构造完全的对象的方法可能引发令人疑惑的错误。
Executor 框架不仅包括了线程池的管理,还提供了线程工厂、队列以及拒绝策略等,Executor 框架让并发编程变得更加简单。
3、ThreadPoolExecutor创建线程池
ThreadPoolExecutor 是线程池的核心实现。线程的创建和终止需要很大的开销,线程池中预先提供了指定数量的可重用线程,所以使用线程池会节省系统资源,并且每个线程池都维护了一些基础的数据统计,方便线程的管理和监控。
通过下面的demo来了解ThreadPoolExecutor创建线程的过程。
public class TestThreadPool {
public static void main(String[] args) {
ThreadPoolExecutor threadPoolExecutor =
new ThreadPoolExecutor(3, 6, 5, TimeUnit.SECONDS, new LinkedBlockingDeque<>(5));
ExecutorCompletionService<String> executorCompletionService =
new ExecutorCompletionService<>(threadPoolExecutor);
for (int i = 0; i < 20; i++) {
try {
executorCompletionService.submit(()-> {
try {
//System.out.println("---");
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
},"testtask"+i);
System.out.print(" New task: testtask" + i);
System.out.print(" ActiveCount: " + threadPoolExecutor.getActiveCount());
System.out.print(" poolSize: " + threadPoolExecutor.getPoolSize());
System.out.print(" queueSize: " + threadPoolExecutor.getQueue().size());
System.out.println(" taskCount: " + threadPoolExecutor.getTaskCount());
} catch (RejectedExecutionException e) {
System.out.println("Reject:" + i);
}
try {
Thread.sleep(200);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
threadPoolExecutor.shutdown();
}
}
4、Executor 框架的继承关系
Java中的线程池核心实现类是ThreadPoolExecutor,先通过JDK 1.8中ThreadPoolExecutor的 UML 类图,了解下ThreadPoolExecutor的继承关系。
ThreadPoolExecutor实现的顶层接口是Executor,顶层接口Executor提供了一种思想:将任务提交和任务执行进行解耦。用户无需关注如何创建线程,如何调度线程来执行任务,用户只需提供Runnable对象,将任务的运行逻辑提交到执行器(Executor)中,由Executor框架完成线程的调配和任务的执行部分。ExecutorService接口增加了一些能力:
- 扩充执行任务的能力,补充可以为一个或一批异步任务生成Future的方法;
- 提供了管控线程池的方法,比如停止线程池的运行。
AbstractExecutorService则是上层的抽象类,将执行任务的流程串联了起来,保证下层的实现只需关注一个执行任务的方法即可。最下层的实现类ThreadPoolExecutor实现最复杂的运行部分,ThreadPoolExecutor将会一方面维护自身的生命周期,另一方面同时管理线程和任务,使两者良好的结合从而执行并行任务。