Java多线程 - 线程池的七大参数?手写一个线程池?

线程池

调用逻辑

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get();
        if (workerCountOf(c) < corePoolSize) {   //步骤一:判断当前正在工作的线程是否比核心线程数量小
            if (addWorker(command, true))    // 以核心线程的身份,添加到工作集合
                return;
            c = ctl.get();
        }
         //步骤二:不满足步骤一,线程池还在RUNNING状态,阻塞队列也没满的情况下,把执行任务添加到阻塞队列workQueue。
        if (isRunning(c) && workQueue.offer(command)) {  
            int recheck = ctl.get();
            //来个double check ,检查线程池是否突然被关闭
            if (! isRunning(recheck) && remove(command))  
                reject(command);
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        //步骤三:如果阻塞队列也满了,执行任务以非核心线程的身份,添加到工作集合
        else if (!addWorker(command, false))
            reject(command);
    }

addWorker(command, false) 第二个参数控制,是否为核心线程,如果不是执行完成后要回收的。

2. 为什么要使用线程池

  1. 线程池做的工作主要是控制运行的线程的数量,处理过程中将任务放入队列,然后在线程创建后启动这些任务,如果线程数量超过了core数量,超出数量的线程排队等候,等其他线程执行完毕,再从队列中取出任务来执行, 一旦等待的线程数超过了 缓冲队列长度,小于max, 则开始新增临时线程执行,执行完成后回收该线程。
    Java多线程 - 线程池的七大参数?手写一个线程池?

  2. 减少创建和销毁线程上所花的时间以及系统资源的开销 => 减少内存开销,创建线程占用内存,创建线程需要时间,会延迟处理的请求;降低资源消耗,通过重复利用已创建的线程降低线程创建和销毁造成的消耗

  3. 提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行

  4. 线程复用、控制最大并发数、管理线程

  5. 线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控

3. 线程池如何使用?

实现有五种,Executors.newScheduledThreadPool()是带时间调度的,java8新推出
Executors.newWorkStealingPool(int),使用目前机器上可用的处理器作为他的并行度

  1. Executors.newFixedThreadPool(int)

创建一个定长线程池,可控制线程最大并发数,超出的线程在*队列中等待newFixedThreadPool创建的线程池corePoolSize和maximumPoolSize值是相等的,它使用的是 LinkedBlockingQueue,这是一个*队列, 意味着永远不会和max判断

源码:
Java多线程 - 线程池的七大参数?手写一个线程池?

  1. Executors.newSingleThreadExecutor()

创建一个单线程话的线程池,他只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序执行

newSingleThreadExecutor将corePoolSize和maximumPoolSize都设置为1,使用LinkedBlockingQueue

源码:
Java多线程 - 线程池的七大参数?手写一个线程池?

  1. Executors.newCachedThreadPool()

创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲县城,若无可回收,则新建线程

newCachedThreadPool将corePoolSize设置为0,将maximumPoolSize设置为Integer.MAX_VALUE,使用 的SynchronousQueue,也就是说来了任务就创建线程运行,当线程空闲超过60s,就销毁线程

源码:
Java多线程 - 线程池的七大参数?手写一个线程池?

在使用CachedThreadPool时,一定要注意控制任务的数量,否则,由于大量线程同时运行,很有会造成系统瘫痪。

  1. Executors.newScheduledThreadPool()

创建一个定长线程池,支持定时及周期性任务执行。

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
        return new ScheduledThreadPoolExecutor(corePoolSize);
}

在来看看ScheduledThreadPoolExecutor()的构造函数:

public ScheduledThreadPoolExecutor(int corePoolSize) {
 	super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
 	new DelayedWorkQueue());
 }

ScheduledThreadPoolExecutor的父类即ThreadPoolExecutor,因此这里各参数含义和上面一样。值得关心的是DelayedWorkQueue这个阻塞对列。

它作为静态内部类就在ScheduledThreadPoolExecutor中进行了实现。简单的说,DelayedWorkQueue是一个*队列,它能按一定的顺序对工作队列中的元素进行排列

总结

Java多线程 - 线程池的七大参数?手写一个线程池?

我们可以看到底层的代码都是由ThreadPoolExecutor这个类的构造方法创建的,只是传入的参数不同,那么研究一下这个类以及这些参数就很有必要,下节我们将介绍这些参数的使用

4. 线程池的几个重要参数

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler);

简单介绍一下:

  1. corePoolSize: 线程池中常驻核心线程数

在创建了线程池后,当有请求任务来之后,就会安排池中的线程去执行请求任务
当线程池的线程数达到corePoolSize后,就会把到达的任务放到缓存队列当中

  1. maximumPoolSize: 线程池能够容纳同时执行的最大线程数,必须大于等于1

  2. keepAliveTime: 多余的空闲线程的存活时间

当前线程池数量超过corePoolSize时,档口空闲时间达到keepAliveTime值时,多余空闲线程会被销毁到只剩下corePoolSize个线程为止, newCachedThreadPool

  1. unit: keepAliveTime的单位

  2. workQueue: 任务队列,被提交但尚未被执行的任务

任务队列底层是BlockingQueue阻塞队列!不清楚阻塞队列的参考这篇文章:用阻塞队列实现一个生产者消费者模型?

  1. threadFactory:表示生成线程池中工作线程的线程工厂,用于创建线程一般用默认的即可

  2. handler: 拒绝策略,表示当队列满了并且工作线程大于等于线程池的最大线程数(maximumPoolSize)时如 何来拒绝请求执行的runable的策略

  • 默认拒绝策略为AbortPolicy,即丢弃任务并抛出RejectedExecutionException异常
  • DiscardPolicy:丢弃任务,但是不抛出异常。
  • DiscardOldestPolicy:丢弃队列最前面的任务,然后重新提交被拒绝的任务
  • CallerRunsPolicy:由调用线程(提交任务的线程)处理该任务

5. 线程池的底层工作原理以及过程

Java多线程 - 线程池的七大参数?手写一个线程池?

6. 你在工作中单一的/固定数的/可变的三种创建线程池的方法,用哪个多?

回答:一个都不用,我们生产上只能使用自定义的!!!!

为什么?

线程池不允许使用Executors创建,试试通过spring的 ThreadPoolExecutor的方式,规避资源耗尽风险

阿里巴巴规范手册当中提到:

  1. FixedThreadPool和SingleThreadPool允许请求队列长度为Integer.MAX_VALUE,可能会堆积大量请求,导致OOM;

  2. CachedThreadPool和ScheduledThreadPool允许的创建线程数量为Integer.MAX_VALUE,可能会创建大量线程,导致OOM

工作中时如何使用线程池的

import java.util.concurrent.Executors;
import java.util.concurrent.LinkedBlockingQueue;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

public class MyThreadPoolDemo {
    public static void main(String[] args) {
        ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(
                //corePoolSize:常驻核心线程数
                2,
                //maximumPoolSize:最大的可容纳线程数
                5,
                //存活时间设置为1s
                1L,
                TimeUnit.SECONDS,
                //这里用LinkedBlockingQueue,且容量为3,意味着等候区最大容量三个任务
                new LinkedBlockingQueue<>(3),
                //默认的defaultThreadFactory即可
                Executors.defaultThreadFactory(),
                //丢弃方法使用AbortPolicy()
                new ThreadPoolExecutor.AbortPolicy());

        //这里用来做任务的处理执行
        for (int i = 0; i < 5; i++) {
            threadPoolExecutor.execute(()->{
                System.out.println(Thread.currentThread().getName()+"\t 办理业务;");
            });
        }
        threadPoolExecutor.shutdown();
    }
}

当任务数量变多或者任务变重时:如将我们的任务数量调整为20时,此时运行结果为:

pool-1-thread-1	 办理业务;
pool-1-thread-3	 办理业务;
pool-1-thread-2	 办理业务;
pool-1-thread-3	 办理业务;
pool-1-thread-1	 办理业务;
pool-1-thread-4	 办理业务;
pool-1-thread-1	 办理业务;
pool-1-thread-3	 办理业务;
pool-1-thread-2	 办理业务;
pool-1-thread-5	 办理业务;
pool-1-thread-4	 办理业务;
pool-1-thread-1	 办理业务;
pool-1-thread-3	 办理业务;
pool-1-thread-1	 办理业务;
pool-1-thread-2	 办理业务;
Exception in thread "main" java.util.concurrent.RejectedExecutionException: Task com.juc.threadPool.MyThreadPoolDemo$$Lambda$1/558638686@6d03e736 rejected from java.util.concurrent.ThreadPoolExecutor@568db2f2[Running, pool size = 5, active threads = 0, queued tasks = 0, completed tasks = 15]
	at java.util.concurrent.ThreadPoolExecutor$AbortPolicy.rejectedExecution(ThreadPoolExecutor.java:2063)
	at java.util.concurrent.ThreadPoolExecutor.reject(ThreadPoolExecutor.java:830)
	at java.util.concurrent.ThreadPoolExecutor.execute(ThreadPoolExecutor.java:1379)
	at com.juc.threadPool.MyThreadPoolDemo.main(MyThreadPoolDemo.java:27)

发生了异常,且任务只执行完了15个,我们可以看到其中active threads = 0, queued tasks = 0也就是说我的阻塞队列已经满了,且没有空闲的线程了,此时再申请任务我就会抛出异常,这是线程池handler参数的拒绝策略,当我们更改策略为ThreadPoolExecutor.CallerRunsPolicy()时,运行结果当中存在main 办理业务;语句,也就意味着线程池将某些任务回退到了调用者,另外的两个拒绝策略在此就不演示

7 合理配置线程池你是如何考虑的?

  1. CPU密集型:

CPU密集任务只有在真正多核CPU上才可能得到加速(通过多线程) 而在单核CPU上,无论你开几个模拟的多线程该任务都不可能得到加速,因为CPU总的运算能力就那些

一般公式:CPU核数+1个线程的线程池

  1. IO密集型

参考公式: 最大并行宽度即可

上一篇:基于博客标签的多标签分类器(multi-label classification)


下一篇:使用篇八,对象池