彻底理解Java并发：Java线程池

本篇内容包括：线程池概述、Java 线程池的几个重要参数、线程池的执行流程、拒绝策略以及线程池状态、Java 线程池的使用（常用的线程池、Executor 框架、ThreadPoolExecutor创建线程池、Executor 框架的继承关系）等内容。

一、线程池概述

池化技术现在已经屡见不鲜了，线程池、数据库连接池、Http 连接池等等都是对这个思想的应用。池化技术的思想主要是为了减少每次获取资源的消耗，提高对资源的利用率。

线程池（Thread Pool）是一种基于池化思想管理线程的工具，由于创建和关闭线程需要花费时间，如果为每一个任务都创建一个线程，非常消耗资源。使用线程池可以避免增加创建和销毁线程的资源消耗，提高响应速度，且能重复利用线程。在使用线程池后，创建线程就变成了从线程池中获取空闲线程，关闭线程变成了向线程池归还线程。

线程池做的工作主要是控制运行的线程的数量，处理过程中将任务放入队列，然后在线程创建后启动这些任务，使用完毕不需要销毁线程而是放回池中，如果线程数量超过了最大数量超出数量的线程排队等候，等其它线程执行完毕，再从队列中取出任务来执行。他的主要特点为：线程复用、控制最大并发数、管理线程。

使用线程池的好处：

降低资源消耗：通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
提高响应速度：当任务到达时，任务可以不需要的等到线程创建就能立即执行。
提高线程的可管理性：线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。

二、Java 线程池的执行流程

1、线程池的几个重要参数

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)

corePoolSize: 线程池中核心线程的数量
maximumPoolSize ：线程池中最大线程数量
keepAliveTime：非核心线程的存活时间
TimeUnit unit：存活时间单位
workQueue：任务队列
threadFactory：线程工厂，用于创建线程，一般用默认的即可
handler：拒绝策略，当队列满了并且工作线程大于等于线程池的最大线程数

2、线程池的执行流程

在创建线程池后，等待提交过来的任务请求；
当调用 execute() 方法添加一个请求任务时，线程池会做如下判断：

如果正在运行的线程数量小于corePoolSize，那么马上创建核心线程运行这个任务；
如果正在运行的线程数量大于或者等于corePoolSize，那么将这个任务放入任务队列中；
如果任务队列满了且正在运行的线程数量小于 maximumPoolSize（最大线程数），那么创建一个非核心线程立刻运行这个任务；
如果任务队列满了且正在运行的线程数量大于或等于 maximumPoolSize，线程池会执行拒绝策略；

当一个线程完成任务时，会在队列中取下一个任务来执行；
当一个线程无事可做超过一定时间时，线程池会停掉。

3、拒绝策略

线程池任务队列满了，同时也达到了最大线程数，无法创建新的非核心线程去处理任务，此时需要拒绝策略。

AbortPolicy：抛出 RejectedExecutionException 异常阻止系统正常进行；
DiscardPolicy：直接丢弃任务，不处理也不抛出异常；
DiscardOldestPolicy：丢弃任务队列中等待最久的任务，将当前任务放入任务队列中；
CallerRunsPolicy：将任务回退到调用者，由调用线程处理该任务（不会丢弃任务，但是性能极有可能会急剧下降）。

4、线程池状态

RUNNING：这个状态表明线程池处于正常状态，可以处理任务，可以接受任务
SHUTDOWN：这个状态表明线程池处于正常关闭状态，不再接受任务，但是可以处理线程池中剩余的任务
STOP：这个状态表明线程池处于停止状态，不仅不会再接收新任务，并且还会打断正在执行的任务
TIDYING：这个状态表明线程池已经没有了任务，所有的任务都被停掉了
TERMINATED：线程池彻底终止状态

三、Java 线程池的使用

1、常用的线程池

Java 中的 Executor 接口定义一个执行线程的工具。它的子类型即线程池接口是 ExecutorService 。要配置一个线程池是比较复杂的，尤其是对于线程池的原理不是很清楚的情况下，因此在工具类 Executors 下面提供了一些静态工厂方法，生成一些常用的线程池

newSingleThreadExecutor：创建一个单线程的线程池。这个线程池只有一个线程在工作，也就是相当于单线程串行执行所有任务。如果这个唯一的线程因为异常结束，那么会有一个新的线程来替代它。此线程池保证所有任务的执行顺序按照任务的提交顺序执行。
newFixedThreadPool：创建固定大小的线程池。每次提交一个任务就创建一个线程，直到线程达到线程池的最大大小。线程池的大小一旦达到最大值就会保持不变，如果某个线程因为执行异常而结束，那么线程池会补充一个新线程。
newCachedThreadPool：创建一个可缓存的线程池。如果线程池的大小超过了处理任务所需要的线程，那么就会回收部分空闲（60秒不执行任务）的线程，当任务数增加时，此线程池又可以智能的添加新线程来处理任务。此线程池不会对线程池大小做限制，线程池大小完全依赖于操作系统（或者说JVM）能够创建的最大线程大小。
newScheduledThreadPool：创建一个大小无限的线程池。此线程池支持定时以及周期性执行任务的需求。

阿里编码规约：线程池不允许使用 Executors 去创建，而是通过 ThreadPoolExecutor 的方式，这样的处理方式让写的同学更加明确线程池的运行规则，规避资源耗尽的风险。

Executors 各个方法的弊端：

newFixedThreadPool和newSingleThreadExecutor：主要问题是堆积的请求处理队列可能会耗费非常大的内存，甚至 OOM。
newCachedThreadPool和newScheduledThreadPool：主要问题是线程数最大数是 Integer.MAX_VALUE，可能会创建数量非常多的线程，甚至OOM

2、Executor 框架

Java 中的线程池是通过 Executor 框架实现的，该框架中用到了Executor，Executors，ExecutorService，ThreadPoolExecutor ，Callable 和 Future、FutureTask 这几个类

Executor 框架是 Java5 之后引进的，在 Java 5 之后，通过 Executor 来启动线程比使用 Thread 的 start 方法更好，除了更易管理，效率更好（用线程池实现，节约开销）外，还有关键的一点：有助于避免 this 逃逸问题。

this 逃逸是指在构造函数返回之前其他线程就持有该对象的引用. 调用尚未构造完全的对象的方法可能引发令人疑惑的错误。

Executor 框架不仅包括了线程池的管理，还提供了线程工厂、队列以及拒绝策略等，Executor 框架让并发编程变得更加简单。

3、ThreadPoolExecutor创建线程池

ThreadPoolExecutor 是线程池的核心实现。线程的创建和终止需要很大的开销，线程池中预先提供了指定数量的可重用线程，所以使用线程池会节省系统资源，并且每个线程池都维护了一些基础的数据统计，方便线程的管理和监控。

通过下面的demo来了解ThreadPoolExecutor创建线程的过程。

public class TestThreadPool {
	public static void main(String[] args) {
	   ThreadPoolExecutor threadPoolExecutor = 
			   new ThreadPoolExecutor(3, 6, 5, TimeUnit.SECONDS, new LinkedBlockingDeque<>(5));
	   ExecutorCompletionService<String> executorCompletionService = 
			   new ExecutorCompletionService<>(threadPoolExecutor);
       for (int i = 0; i < 20; i++) {
			try {
              executorCompletionService.submit(()-> {  
					try {  
						//System.out.println("---");  
						Thread.sleep(3000);  
					} catch (InterruptedException e) {  
						e.printStackTrace();  
					}  
				},"testtask"+i);
				
                 System.out.print(" New task: testtask" + i);
                 System.out.print(" ActiveCount: " + threadPoolExecutor.getActiveCount());
                 System.out.print(" poolSize: " + threadPoolExecutor.getPoolSize());
                 System.out.print(" queueSize: " + threadPoolExecutor.getQueue().size());
                 System.out.println(" taskCount: " + threadPoolExecutor.getTaskCount());
           } catch (RejectedExecutionException e) {
                 System.out.println("Reject：" + i);
           }
           try {
              Thread.sleep(200);
           } catch (InterruptedException e) {
              e.printStackTrace();
           }
        }
	   threadPoolExecutor.shutdown();
	}
}

4、Executor 框架的继承关系

Java中的线程池核心实现类是ThreadPoolExecutor，先通过JDK 1.8中ThreadPoolExecutor的 UML 类图，了解下ThreadPoolExecutor的继承关系。

ThreadPoolExecutor实现的顶层接口是Executor，顶层接口Executor提供了一种思想：将任务提交和任务执行进行解耦。用户无需关注如何创建线程，如何调度线程来执行任务，用户只需提供Runnable对象，将任务的运行逻辑提交到执行器（Executor）中，由Executor框架完成线程的调配和任务的执行部分。ExecutorService接口增加了一些能力：

扩充执行任务的能力，补充可以为一个或一批异步任务生成Future的方法；
提供了管控线程池的方法，比如停止线程池的运行。

AbstractExecutorService则是上层的抽象类，将执行任务的流程串联了起来，保证下层的实现只需关注一个执行任务的方法即可。最下层的实现类ThreadPoolExecutor实现最复杂的运行部分，ThreadPoolExecutor将会一方面维护自身的生命周期，另一方面同时管理线程和任务，使两者良好的结合从而执行并行任务。