Java并发编程系列-(6) Java线程池

2022-04-10 13:33:23

目前已经更新完《Java并发编程》,《Docker教程》和《JVM性能优化》，欢迎关注【后端精进之路】，轻松阅读全部文章。

Java并发编程：

Java并发编程系列-(1) 并发编程基础

Java并发编程系列-(2) 线程的并发工具类

Java并发编程系列-(3) 原子操作与CAS

Java并发编程系列-(4) 显式锁与AQS

Java并发编程系列-(5) Java并发容器

Java并发编程系列-(6) Java线程池

Java并发编程系列-(7) Java线程安全

Java并发编程系列-(8) JMM和底层实现原理

Java并发编程系列-(9) JDK 8/9/10中的并发

Docker教程:

Docker系列-(1) 原理与基本操作

Docker系列-(2) 镜像制作与发布

Docker系列-(3) Docker-compose使用与负载均衡

JVM性能优化:

JVM性能优化系列-(1) Java内存区域

JVM性能优化系列-(2) 垃圾收集器与内存分配策略

JVM性能优化系列-(3) 虚拟机执行子系统

JVM性能优化系列-(4) 编写高效Java程序

JVM性能优化系列-(5) 早期编译优化

JVM性能优化系列-(6) 晚期编译优化

JVM性能优化系列-(7) 深入了解性能优化

6. 线程池

6.1 基本概念

在web开发中，服务器需要接受并处理请求，所以会为一个请求来分配一个线程来进行处理。如果每次请求都新创建一个线程的话实现起来非常简便，但是存在一个问题：如果并发的请求数量非常多，但每个线程执行的时间很短，这样就会频繁的创建和销毁线程，如此一来会大大降低系统的效率。可能出现服务器在为每个请求创建新线程和销毁线程上花费的时间和消耗的系统资源要比处理实际的用户请求的时间和资源更多。

那么有没有一种办法使执行完一个任务，并不被销毁，而是可以继续执行其他的任务呢？这就是线程池的目的了。线程池为线程生命周期的开销和资源不足问题提供了解决方案。通过对多个任务重用线程，线程创建的开销被分摊到了多个任务上。

什么时候使用线程池？

单个任务处理时间比较短
需要处理的任务数量很大

使用线程池好处

降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
提高响应速度。当任务到达时，任务可以不需要的等到线程创建就能立即执行。
提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。

6.2 实现自己的线程池

实现的线程池需要满足以下基本条件：

1、线程必须在池子已经创建好了，并且可以保持住，要有容器保存多个线程；

2、线程还要能够接受外部的任务，运行这个任务。容器保持这个来不及运行的任务.

以下是线程池的具体实现：

线程池中实现了任务队列，用来保存所有的任务；工作线程，来执行具体的任务。

public class MyThreadPool2 {

    // 线程池中默认线程的个数为5

    private static int WORK_NUM = 5;

    // 队列默认任务个数为100

    private static int TASK_COUNT = 100;  

    // 用户在构造这个池，希望的启动的线程数

    private final int worker_num;

    // 工作线程组

    private WorkThread[] workThreads;

    // 任务队列，作为一个缓冲

    private final BlockingQueue<Runnable> taskQueue;

    // 创建具有默认线程个数的线程池

    public MyThreadPool2() {

        this(WORK_NUM,TASK_COUNT);

    }

    // 创建线程池,worker_num为线程池中工作线程的个数

    public MyThreadPool2(int worker_num,int taskCount) {

    	if (worker_num<=0) worker_num = WORK_NUM;

    	if(taskCount<=0) taskCount = TASK_COUNT;

        this.worker_num = worker_num;

        taskQueue = new ArrayBlockingQueue<>(taskCount);

        workThreads = new WorkThread[worker_num];

        for(int i=0;i<worker_num;i++) {

        	workThreads[i] = new WorkThread();

        	workThreads[i].start();

        }

    }

    // 执行任务,其实只是把任务加入任务队列，什么时候执行有线程池管理器决定

    public void execute(Runnable task) {

    	try {

			taskQueue.put(task);

		} catch (InterruptedException e) {

			e.printStackTrace();

		}

    }

    // 销毁线程池,该方法保证在所有任务都完成的情况下才销毁所有线程，否则等待任务完成才销毁

    public void destroy() {

        // 工作线程停止工作，且置为null

        System.out.println("ready close pool.....");

        for(int i=0;i<worker_num;i++) {

        	workThreads[i].stopWorker();

        	workThreads[i] = null;//help gc

        }

        taskQueue.clear();// 清空任务队列

    }

    // 覆盖toString方法，返回线程池信息：工作线程个数和已完成任务个数

    @Override

    public String toString() {

        return "WorkThread number:" + worker_num

                + "  wait task number:" + taskQueue.size();

    }

    /**

     * 内部类，工作线程

     */

    private class WorkThread extends Thread{

    	@Override

    	public void run(){

    		Runnable r = null;

    		try {

				while (!isInterrupted()) {

					r = taskQueue.take();

					if(r!=null) {

						System.out.println(getId()+" ready exec :"+r);

						r.run();

					}

					r = null;//help gc;

				}

			} catch (Exception e) {

				// TODO: handle exception

			}

    	}

    	public void stopWorker() {

    		interrupt();

    	}

    }

}

以下是测试程序：

分别创建多个任务，并放入线程池进行执行。

public class TestMyThreadPool {

    public static void main(String[] args) throws InterruptedException {

        // 创建3个线程的线程池

        MyThreadPool2 t = new MyThreadPool2(3,0);

        t.execute(new MyTask("testA"));

        t.execute(new MyTask("testB"));

        t.execute(new MyTask("testC"));

        t.execute(new MyTask("testD"));

        t.execute(new MyTask("testE"));

        t.execute(new MyTask("testF"));

        t.execute(new MyTask("testG"));

        t.execute(new MyTask("testH"));

        System.out.println(t);

        Thread.sleep(10000);

        t.destroy();// 所有线程都执行完成才destory

        System.out.println(t);

    }

    // 任务类

    static class MyTask implements Runnable {

        private String name;

        private Random r = new Random();

        public MyTask(String name) {

            this.name = name;

        }

        public String getName() {

            return name;

        }

        @Override

        public void run() {// 执行任务

            try {

                Thread.sleep(r.nextInt(1000)+2000);

            } catch (InterruptedException e) {

                System.out.println(Thread.currentThread().getId()+" sleep InterruptedException:"

                        +Thread.currentThread().isInterrupted());

            }

            System.out.println("任务 " + name + " 完成");

        }

    }

}

6.3 Executor框架

Executor框架是一个根据一组执行策略调用，调度，执行和控制的异步任务的框架，目的是提供一种将”任务提交”与”任务如何运行”分离开来的机制。

Executor框架的类继承关系如下图：

J.U.C中有三个Executor接口：

Executor：一个运行新任务的简单接口；
ExecutorService：扩展了Executor接口。添加了一些用来管理执行器生命周期和任务生命周期的方法；
ScheduledExecutorService：扩展了ExecutorService。支持Future和定期执行任务。

下面分别进行介绍：

1. Executor接口

Executor接口只有一个execute方法，用来替代通常创建或启动线程的方法。

public interface Executor {

    void execute(Runnable command);

}

Executor接口只有一个execute方法，用来替代通常创建或启动线程的方法。

executor.execute(new Thread())

对于不同的Executor实现，execute()方法可能是创建一个新线程并立即启动，也有可能是使用已有的工作线程来运行传入的任务，也可能是根据设置线程池的容量或者阻塞队列的容量来决定是否要将传入的线程放入阻塞队列中或者拒绝接收传入的线程。

2. ExecutorService接口

ExecutorService接口继承自Executor接口，提供了管理终止的方法，以及可为跟踪一个或多个异步任务执行状况而生成 Future 的方法。增加了shutDown()，shutDownNow()，invokeAll()，invokeAny()和submit()等方法。如果需要支持即时关闭，也就是shutDownNow()方法，则任务需要正确处理中断。

3. ScheduledExecutorService接口

ScheduledExecutorService扩展ExecutorService接口并增加了schedule方法。调用schedule方法可以在指定的延时后执行一个Runnable或者Callable任务。ScheduledExecutorService接口还定义了按照指定时间间隔定期执行任务的scheduleAtFixedRate()方法和scheduleWithFixedDelay()方法。

4. Executor框架基本使用流程

基本使用流程如下：

6.4 ThreadPoolExecutor分析

ThreadPoolExecutor继承自AbstractExecutorService，也实现了ExecutorService接口。JDK中的提供的内置线程池基本都基于ThreadPoolExecutor实现，后面会仔细介绍。

构造函数及参数意义

public ThreadPoolExecutor(int corePoolSize,

                          int maximumPoolSize,

                          long keepAliveTime,

                          TimeUnit unit,

                          BlockingQueue<Runnable> workQueue,

                          ThreadFactory threadFactory,

                          RejectedExecutionHandler handler) {

    if (corePoolSize < 0 ||

        maximumPoolSize <= 0 ||

        maximumPoolSize < corePoolSize ||

        keepAliveTime < 0)

        throw new IllegalArgumentException();

    if (workQueue == null || threadFactory == null || handler == null)

        throw new NullPointerException();

    this.corePoolSize = corePoolSize;

    this.maximumPoolSize = maximumPoolSize;

    this.workQueue = workQueue;

    this.keepAliveTime = unit.toNanos(keepAliveTime);

    this.threadFactory = threadFactory;

    this.handler = handler;

}

构造方法中的字段含义如下：

corePoolSize：线程池中核心线程数，运行的线程数<corePoolSize，就会创建新线程，>= corePoolSize，这个任务就会保存到BlockingQueue，如果调用prestartAllCoreThreads（）方法就会一次性的启动corePoolSize个数的线程。
maximumPoolSize: 允许的最大线程数，BlockingQueue也满了，< maximumPoolSize时候就会再次创建新的线程.
keepAliveTime: 线程空闲下来后，存活的时间，这个参数只在 >corePoolSize 才有用.
TimeUnit unit: 存活时间的单位值.
workQueue：保存等待执行的任务的阻塞队列，当提交一个新的任务到线程池以后, 线程池会根据当前线程池中正在运行着的线程的数量来决定对该任务的处理方式，主要有以下几种处理方式:

使用直接切换队列：这种方式常用的队列是SynchronousQueue.

使用*队列：一般使用基于链表的阻塞队列LinkedBlockingQueue。如果使用这种方式，那么线程池中能够创建的最大线程数就是corePoolSize，而maximumPoolSize就不会起作用了（后面也会说到）。当线程池中所有的核心线程都是RUNNING状态时，这时一个新的任务提交就会放入等待队列中。

使用有界队列：一般使用ArrayBlockingQueue。使用该方式可以将线程池的最大线程数量限制为maximumPoolSize，这样能够降低资源的消耗，但同时这种方式也使得线程池对线程的调度变得更困难，因为线程池和队列的容量都是有限的值，所以要想使线程池处理任务的吞吐率达到一个相对合理的范围，又想使线程调度相对简单，并且还要尽可能的降低线程池对资源的消耗，就需要合理的设置这两个数量。

threadFactory：它是ThreadFactory类型的变量，用来创建新线程。默认使用Executors.defaultThreadFactory() 来创建线程。使用默认的ThreadFactory来创建线程时，会使新创建的线程具有相同的NORM_PRIORITY优先级并且是非守护线程，同时也设置了线程的名称。
handler：它是RejectedExecutionHandler类型的变量，表示线程池的饱和策略。如果阻塞队列满了并且没有空闲的线程，这时如果继续提交任务，就需要采取一种策略处理该任务。

线程池提供了4种策略：

AbortPolicy：直接抛出异常，这是默认策略；

CallerRunsPolicy：用调用者所在的线程来执行任务；

DiscardOldestPolicy：丢弃阻塞队列中靠最前的任务，并执行当前任务；

DiscardPolicy：直接丢弃任务；

任务执行

提交任务执行，主要有execute和submit两种方式，主要区别是后者需要有返回值。

execute(Runnable command)
Future submit(Callable task)

下面主要介绍execute的流程：

简单来说，在执行execute()方法时且状态一直是RUNNING时，的执行过程如下：

如果workerCount < corePoolSize，则创建并启动一个线程来执行新提交的任务；
如果workerCount >= corePoolSize，且线程池内的阻塞队列未满，则将任务添加到该阻塞队列中；
如果workerCount >= corePoolSize && workerCount < maximumPoolSize，且线程池内的阻塞队列已满，则创建并启动一个线程来执行新提交的任务；
如果workerCount >= maximumPoolSize，并且线程池内的阻塞队列已满, 则根据拒绝策略来处理该任务, 默认的处理方式是直接抛异常。

整个流程可以用下图来总结：

接下来结合代码进行分析：

public void execute(Runnable command) {

    if (command == null)

        throw new NullPointerException();

    /*

     * clt记录着runState和workerCount

     */

    int c = ctl.get();

    /*

     * workerCountOf方法取出低29位的值，表示当前活动的线程数；

     * 如果当前活动线程数小于corePoolSize，则新建一个线程放入线程池中；

     * 并把任务添加到该线程中。

     */

    if (workerCountOf(c) < corePoolSize) {

        /*

         * addWorker中的第二个参数表示限制添加线程的数量是根据corePoolSize来判断还是maximumPoolSize来判断；

         * 如果为true，根据corePoolSize来判断；

         * 如果为false，则根据maximumPoolSize来判断

         */

        if (addWorker(command, true))

            return;

        /*

         * 如果添加失败，则重新获取ctl值

         */

        c = ctl.get();

    }

    /*

     * 如果当前线程池是运行状态并且任务添加到队列成功

     */

    if (isRunning(c) && workQueue.offer(command)) {

        // 重新获取ctl值

        int recheck = ctl.get();

        // 再次判断线程池的运行状态，如果不是运行状态，由于之前已经把command添加到workQueue中了，

        // 这时需要移除该command

        // 执行过后通过handler使用拒绝策略对该任务进行处理，整个方法返回

        if (! isRunning(recheck) && remove(command))

            reject(command);

        /*

         * 获取线程池中的有效线程数，如果数量是0，则执行addWorker方法

         * 这里传入的参数表示：

         * 1. 第一个参数为null，表示在线程池中创建一个线程，但不去启动；

         * 2. 第二个参数为false，将线程池的有限线程数量的上限设置为maximumPoolSize，添加线程时根据maximumPoolSize来判断；

         * 如果判断workerCount大于0，则直接返回，在workQueue中新增的command会在将来的某个时刻被执行。

         */

        else if (workerCountOf(recheck) == 0)

            addWorker(null, false);

    }

    /*

     * 如果执行到这里，有两种情况：

     * 1. 线程池已经不是RUNNING状态；

     * 2. 线程池是RUNNING状态，但workerCount >= corePoolSize并且workQueue已满。

     * 这时，再次调用addWorker方法，但第二个参数传入为false，将线程池的有限线程数量的上限设置为maximumPoolSize；

     * 如果失败则拒绝该任务

     */

    else if (!addWorker(command, false))

        reject(command);

}

addWorker方法的主要工作是在线程池中创建一个新的线程并执行，firstTask参数用于指定新增的线程执行的第一个任务，core参数为true表示在新增线程时会判断当前活动线程数是否少于corePoolSize，false表示新增线程前需要判断当前活动线程数是否少于maximumPoolSize，代码如下：

private boolean addWorker(Runnable firstTask, boolean core) {

    retry:

    for (;;) {

        int c = ctl.get();

        // 获取运行状态

        int rs = runStateOf(c);

        /*

         * 这个if判断

         * 如果rs >= SHUTDOWN，则表示此时不再接收新任务；

         * 接着判断以下3个条件，只要有1个不满足，则返回false：

         * 1. rs == SHUTDOWN，这时表示关闭状态，不再接受新提交的任务，但却可以继续处理阻塞队列中已保存的任务

         * 2. firsTask为空

         * 3. 阻塞队列不为空

         *

         * 首先考虑rs == SHUTDOWN的情况

         * 这种情况下不会接受新提交的任务，所以在firstTask不为空的时候会返回false；

         * 然后，如果firstTask为空，并且workQueue也为空，则返回false，

         * 因为队列中已经没有任务了，不需要再添加线程了

         */

        // Check if queue empty only if necessary.

        if (rs >= SHUTDOWN &&

            ! (rs == SHUTDOWN &&

               firstTask == null &&

               ! workQueue.isEmpty()))

            return false;

        for (;;) {

            // 获取线程数

            int wc = workerCountOf(c);

            // 如果wc超过CAPACITY，也就是ctl的低29位的最大值（二进制是29个1），返回false；

            // 这里的core是addWorker方法的第二个参数，如果为true表示根据corePoolSize来比较，

            // 如果为false则根据maximumPoolSize来比较。

            //

            if (wc >= CAPACITY ||

                wc >= (core ? corePoolSize : maximumPoolSize))

                return false;

            // 尝试增加workerCount，如果成功，则跳出第一个for循环

            if (compareAndIncrementWorkerCount(c))

                break retry;

            // 如果增加workerCount失败，则重新获取ctl的值

            c = ctl.get();  // Re-read ctl

            // 如果当前的运行状态不等于rs，说明状态已被改变，返回第一个for循环继续执行

            if (runStateOf(c) != rs)

                continue retry;

            // else CAS failed due to workerCount change; retry inner loop

        }

    }

    boolean workerStarted = false;

    boolean workerAdded = false;

    Worker w = null;

    try {

        // 根据firstTask来创建Worker对象

        w = new Worker(firstTask);

        // 每一个Worker对象都会创建一个线程

        final Thread t = w.thread;

        if (t != null) {

            final ReentrantLock mainLock = this.mainLock;

            mainLock.lock();

            try {

                // Recheck while holding lock.

                // Back out on ThreadFactory failure or if

                // shut down before lock acquired.

                int rs = runStateOf(ctl.get());

                // rs < SHUTDOWN表示是RUNNING状态；

                // 如果rs是RUNNING状态或者rs是SHUTDOWN状态并且firstTask为null，向线程池中添加线程。

                // 因为在SHUTDOWN时不会在添加新的任务，但还是会执行workQueue中的任务

                if (rs < SHUTDOWN ||

                    (rs == SHUTDOWN && firstTask == null)) {

                    if (t.isAlive()) // precheck that t is startable

                        throw new IllegalThreadStateException();

                    // workers是一个HashSet

                    workers.add(w);

                    int s = workers.size();

                    // largestPoolSize记录着线程池中出现过的最大线程数量

                    if (s > largestPoolSize)

                        largestPoolSize = s;

                    workerAdded = true;

                }

            } finally {

                mainLock.unlock();

            }

            if (workerAdded) {

                // 启动线程

                t.start();

                workerStarted = true;

            }

        }

    } finally {

        if (! workerStarted)

            addWorkerFailed(w);

    }

    return workerStarted;

}

关闭线程池

关闭线程池通常有如下两种方式：

shutdownNow():设置线程池的状态，还会尝试停止正在运行或者暂停任务的线程
shutdown()：设置线程池的状态，只会中断所有没有执行任务的线程

线程池的参数配置

通常来讲，根据任务的性质来分，可以划分为：计算密集型（CPU），IO密集型，混合型。

计算密集型：加密，大数分解，正则等，线程数适当小一点，最大推荐：机器的Cpu核心数+1，为什么+1，防止页缺失，(机器的Cpu核心=Runtime.getRuntime().availableProcessors()

码农公寓