彻底理解Java并发:Java线程池

Java
355
0
0
2022-12-20
标签   Java并发
本篇内容包括:线程池概述、Java 线程池的几个重要参数、线程池的执行流程、拒绝策略以及线程池状态、Java 线程池的使用(常用的线程池、Executor 框架、ThreadPoolExecutor创建线程池、Executor 框架的继承关系)等内容。

一、线程池概述

池化技术现在已经屡见不鲜了,线程池、数据库连接池、Http 连接池等等都是对这个思想的应用。池化技术的思想主要是为了减少每次获取资源的消耗,提高对资源的利用率。

线程池(Thread Pool)是一种基于池化思想管理线程的工具,由于创建和关闭线程需要花费时间,如果为每一个任务都创建一个线程,非常消耗资源。使用线程池可以避免增加创建和销毁线程的资源消耗,提高响应速度,且能重复利用线程。在使用线程池后,创建线程就变成了从线程池中获取空闲线程,关闭线程变成了向线程池归还线程。

线程池做的工作主要是控制运行的线程的数量,处理过程中将任务放入队列,然后在线程创建后启动这些任务,使用完毕不需要销毁线程而是放回池中,如果线程数量超过了最大数量超出数量的线程排队等候,等其它线程执行完毕,再从队列中取出任务来执行。他的主要特点为:线程复用、控制最大并发数、管理线程。

使用线程池的好处:

  • 降低资源消耗:通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
  • 提高响应速度:当任务到达时,任务可以不需要的等到线程创建就能立即执行。
  • 提高线程的可管理性:线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控。

二、Java 线程池的执行流程

1、线程池的几个重要参数

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) 
  • corePoolSize: 线程池中核心线程的数量
  • maximumPoolSize :线程池中最大线程数量
  • keepAliveTime:非核心线程的存活时间
  • TimeUnit unit:存活时间单位
  • workQueue:任务队列
  • threadFactory:线程工厂,用于创建线程,一般用默认的即可
  • handler:拒绝策略,当队列满了并且工作线程大于等于线程池的最大线程数

2、线程池的执行流程

img

  1. 在创建线程池后,等待提交过来的任务请求;
  2. 当调用 execute() 方法添加一个请求任务时,线程池会做如下判断:
  • 如果正在运行的线程数量小于corePoolSize,那么马上创建核心线程运行这个任务;
  • 如果正在运行的线程数量大于或者等于corePoolSize,那么将这个任务放入任务队列中;
  • 如果任务队列满了且正在运行的线程数量小于 maximumPoolSize(最大线程数),那么创建一个非核心线程立刻运行这个任务;
  • 如果任务队列满了且正在运行的线程数量大于或等于 maximumPoolSize,线程池会执行拒绝策略;
  1. 当一个线程完成任务时,会在队列中取下一个任务来执行;
  2. 当一个线程无事可做超过一定时间时,线程池会停掉。

3、拒绝策略

线程池任务队列满了,同时也达到了最大线程数,无法创建新的非核心线程去处理任务,此时需要拒绝策略。

  • AbortPolicy:抛出 RejectedExecutionException 异常阻止系统正常进行;
  • DiscardPolicy:直接丢弃任务,不处理也不抛出异常;
  • DiscardOldestPolicy:丢弃任务队列中等待最久的任务,将当前任务放入任务队列中;
  • CallerRunsPolicy:将任务回退到调用者,由调用线程处理该任务(不会丢弃任务,但是性能极有可能会急剧下降)。

4、线程池状态

  1. RUNNING:这个状态表明线程池处于正常状态,可以处理任务,可以接受任务
  2. SHUTDOWN:这个状态表明线程池处于正常关闭状态,不再接受任务,但是可以处理线程池中剩余的任务
  3. STOP:这个状态表明线程池处于停止状态,不仅不会再接收新任务,并且还会打断正在执行的任务
  4. TIDYING:这个状态表明线程池已经没有了任务,所有的任务都被停掉了
  5. TERMINATED:线程池彻底终止状态

三、Java 线程池的使用

1、常用的线程池

Java 中的 Executor 接口定义一个执行线程的工具。它的子类型即线程池接口是 ExecutorService 。要配置一个线程池是比较复杂的,尤其是对于线程池的原理不是很清楚的情况下,因此在工具类 Executors 下面提供了一些静态工厂方法,生成一些常用的线程池

  1. newSingleThreadExecutor:创建一个单线程的线程池。这个线程池只有一个线程在工作,也就是相当于单线程串行执行所有任务。如果这个唯一的线程因为异常结束,那么会有一个新的线程来替代它。此线程池保证所有任务的执行顺序按照任务的提交顺序执行。
  2. newFixedThreadPool:创建固定大小的线程池。每次提交一个任务就创建一个线程,直到线程达到线程池的最大大小。线程池的大小一旦达到最大值就会保持不变,如果某个线程因为执行异常而结束,那么线程池会补充一个新线程。
  3. newCachedThreadPool:创建一个可缓存的线程池。如果线程池的大小超过了处理任务所需要的线程,那么就会回收部分空闲(60秒不执行任务)的线程,当任务数增加时,此线程池又可以智能的添加新线程来处理任务。此线程池不会对线程池大小做限制,线程池大小完全依赖于操作系统(或者说JVM)能够创建的最大线程大小。
  4. newScheduledThreadPool:创建一个大小无限的线程池。此线程池支持定时以及周期性执行任务的需求。

阿里编码规约:线程池不允许使用 Executors 去创建,而是通过 ThreadPoolExecutor 的方式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。

Executors 各个方法的弊端:

  • newFixedThreadPool和newSingleThreadExecutor:主要问题是堆积的请求处理队列可能会耗费非常大的内存,甚至 OOM。
  • newCachedThreadPool和newScheduledThreadPool:主要问题是线程数最大数是 Integer.MAX_VALUE,可能会创建数量非常多的线程,甚至OOM

2、Executor 框架

Java 中的线程池是通过 Executor 框架实现的,该框架中用到了Executor,Executors,ExecutorService,ThreadPoolExecutor ,Callable 和 Future、FutureTask 这几个类

Executor 框架是 Java5 之后引进的,在 Java 5 之后,通过 Executor 来启动线程比使用 Thread 的 start 方法更好,除了更易管理,效率更好(用线程池实现,节约开销)外,还有关键的一点:有助于避免 this 逃逸问题。

this 逃逸是指在构造函数返回之前其他线程就持有该对象的引用. 调用尚未构造完全的对象的方法可能引发令人疑惑的错误。

Executor 框架不仅包括了线程池的管理,还提供了线程工厂、队列以及拒绝策略等,Executor 框架让并发编程变得更加简单。

3、ThreadPoolExecutor创建线程池

ThreadPoolExecutor 是线程池的核心实现。线程的创建和终止需要很大的开销,线程池中预先提供了指定数量的可重用线程,所以使用线程池会节省系统资源,并且每个线程池都维护了一些基础的数据统计,方便线程的管理和监控。

通过下面的demo来了解ThreadPoolExecutor创建线程的过程。

public class TestThreadPool {
	public static void main(String[] args) {
	   ThreadPoolExecutor threadPoolExecutor = 
			   new ThreadPoolExecutor(3, 6, 5, TimeUnit.SECONDS, new LinkedBlockingDeque<>(5));
	   ExecutorCompletionService<String> executorCompletionService = 
			   new ExecutorCompletionService<>(threadPoolExecutor);
       for (int i = 0; i < 20; i++) {
			try {
              executorCompletionService.submit(()-> {  
					try {  
						//System.out.println("---");  
						Thread.sleep(3000);  
					} catch (InterruptedException e) {  
						e.printStackTrace();  
					}  
				},"testtask"+i);
				
                 System.out.print(" New task: testtask" + i);
                 System.out.print(" ActiveCount: " + threadPoolExecutor.getActiveCount());
                 System.out.print(" poolSize: " + threadPoolExecutor.getPoolSize());
                 System.out.print(" queueSize: " + threadPoolExecutor.getQueue().size());
                 System.out.println(" taskCount: " + threadPoolExecutor.getTaskCount());
           } catch (RejectedExecutionException e) {
                 System.out.println("Reject:" + i);
           }
           try {
              Thread.sleep(200);
           } catch (InterruptedException e) {
              e.printStackTrace();
           }
        }
	   threadPoolExecutor.shutdown();
	}
}

4、Executor 框架的继承关系

Java中的线程池核心实现类是ThreadPoolExecutor,先通过JDK 1.8中ThreadPoolExecutor的 UML 类图,了解下ThreadPoolExecutor的继承关系。

img

ThreadPoolExecutor实现的顶层接口是Executor,顶层接口Executor提供了一种思想:将任务提交和任务执行进行解耦。用户无需关注如何创建线程,如何调度线程来执行任务,用户只需提供Runnable对象,将任务的运行逻辑提交到执行器(Executor)中,由Executor框架完成线程的调配和任务的执行部分。ExecutorService接口增加了一些能力:

  1. 扩充执行任务的能力,补充可以为一个或一批异步任务生成Future的方法;
  2. 提供了管控线程池的方法,比如停止线程池的运行。

AbstractExecutorService则是上层的抽象类,将执行任务的流程串联了起来,保证下层的实现只需关注一个执行任务的方法即可。最下层的实现类ThreadPoolExecutor实现最复杂的运行部分,ThreadPoolExecutor将会一方面维护自身的生命周期,另一方面同时管理线程和任务,使两者良好的结合从而执行并行任务。