在Java中,使用线程来异步执行任务。Java线程的创建与销毁需要一定的开销,如果我们 为每一个任务创建一个新线程来执行,这些线程的创建与销毁将消耗大量的计算资源。同时,为每一个任务创建一个新线程来执行,这种策略可能会使处于高负荷状态的应用最终崩溃。
Java的线程既是工作单元,也是执行机制。从JDK5开始,把工作单元与执行机制分离开来。工作单元包括Runnable和Callable,而执行机制由Executor框架提供。
1. 框架简介
1.1 Executor框架的两级调度模型
Java线程(java.lang.Thread)被一对一映射为本地操作系统线程。Java线程启动时会创建一个本地操作系统线程;当该Java线程终止时,这个操作系统线程 也会被回收。操作系统会调度所有线程并将它们分配给可用的CPU。 在上层,Java多线程程序通常把应用分解为若干个任务,然后使用用户级的调度器 (Executor框架)将这些任务映射为固定数量的线程;在底层,操作系统内核将这些线程映射到 硬件处理器上。应用程序通过Executor框架控制上层的调度;而下层的调度由操作系统 内核控制,下层的调度不受应用程序的控制。
1.2 Executor框架的结构与成员
1.Executor框架的结构
(1)任务。包括被执行任务需要实现的接口:Runnable接口或Callable接口。
(2)任务的执行。包括任务执行机制的核心接口Executor,以及继承自Executor的 ExecutorService接口。Executor框架有两个关键类实现了ExecutorService接口(ThreadPoolExecutor和ScheduledThreadPoolExecutor)。
(3)异步计算的结果。包括接口Future和实现Future接口的FutureTask类。
2.Executor框架包含的主要的类与接口
(1)Executor是一个接口,它是Executor框架的基础,它将任务的提交与任务的执行分离开来。
(2)ThreadPoolExecutor是线程池的核心实现类,用来执行被提交的任务。
(3)ScheduledThreadPoolExecutor是一个实现类,可以在给定的延迟后运行命令,或者定期执 行命令。ScheduledThreadPoolExecutor比Timer更灵活,功能更强大。
(4)Future接口和实现Future接口的FutureTask类,代表异步计算的结果。
(5)Runnable接口和Callable接口的实现类
3.Executor框架的使用:
(1)首先要创建实现Runnable或者Callable接口的任务对象。工具类Executors可以把一 个Runnable对象封装为一个Callable对象(Executors.callable(Runnable task)或 Executors.callable(Runnable task,Object resule))。
(2)然后可以把Runnable对象直接交给ExecutorService执行(ExecutorService.execute(Runnable command));或者也可以把Runnable对象或Callable对象提交给ExecutorService执行(ExecutorService.submit(Runnable task)或ExecutorService.submit(Callabletask))。
(3)如果执行ExecutorService.submit(…),ExecutorService将返回一个实现Future接口的对象 (到目前为止的JDK中,返回的是FutureTask对象)。由于FutureTask实现了Runnable,程序员也可以创建FutureTask,然后直接交给ExecutorService执行。
(4)最后,主线程可以执行FutureTask.get()方法来等待任务执行完成。主线程也可以执行 FutureTask.cancel(boolean mayInterruptIfRunning)来取消此任务的执行。
4. Executor框架的成员
Executor框架的主要成员:ThreadPoolExecutor、ScheduledThreadPoolExecutor、 Future接口、Runnable接口、Callable接口和Executors。
(1)ThreadPoolExecutor:ThreadPoolExecutor可以使用工厂类Executors来创建。Executors可以创建3种类型的 ThreadPoolExecutor:SingleThreadExecutor、FixedThreadPool和CachedThreadPool。或者也可以自己创建。详解SingleThreadExecutor、FixedThreadPool和CachedThreadPool。
- FixedThreadPool:创建使用固定线程数的FixedThreadPool的 API,适用于为了满足资源管理的需求,而需要限制当前线程数量的应用场 景,它适用于负载比较重的服务器。
- SingleThreadExecutor:创建使用单个线程的SingleThreadExecutor的API,适用于需要保证顺序地执行各个任务;并且在任意时间点,不会有多 个线程是活动的应用场景。
- CachedThreadPool:创建一个会根据需要创建新线程的 CachedThreadPool的API,是大小*的线程池,适用于执行很多的短期异步任务的小程序,或者是负载较轻的服务器。
(2)ScheduledThreadPoolExecutor:通常使用工厂类Executors来创建。Executors可以创建2种类 型的ScheduledThreadPoolExecutor,包括
- ScheduledThreadPoolExecutor:包含若干个线程的ScheduledThreadPoolExecutor。ScheduledThreadPoolExecutor适用于需要多个后台线程执行周期任务,同时为了满足资源 管理的需求而需要限制后台线程的数量的应用场景。
- SingleThreadScheduledExecutor:只包含一个线程的ScheduledThreadPoolExecutor。SingleThreadScheduledExecutor适用于需要单个后台线程执行周期任务,同时需要保证顺 序地执行各个任务的应用场景。
(3)Future接口:Future接口和实现Future接口的FutureTask类用来表示异步计算的结果。当我们把Runnable 接口或Callable接口的实现类提交(submit)给ThreadPoolExecutor或 ScheduledThreadPoolExecutor时,ThreadPoolExecutor或ScheduledThreadPoolExecutor会向我们 返回一个FutureTask对象。但是,在API中返回的是一个 FutureTask对象,Java仅仅保证返回的是一个实现了Future接口的对象。在将来的JDK实现中,返回的可能不一定是FutureTask。
(4)Runnable接口和Callable接口:Runnable接口和Callable接口的实现类,都可以被ThreadPoolExecutor或ScheduledThreadPoolExecutor执行。它们之间的区别是Runnable不会返回结果,而Callable可以返回结 果。 除了可以自己创建实现Callable接口的对象外,还可以使用工厂类Executors的方法来把一个 Runnable包装成一个Callable。
//把一个Runnable包装成一个Callable
public static Callable<Object> callable(Runnable task) {
if (task == null)
throw new NullPointerException();
return new RunnableAdapter<Object>(task, null);
}
//一个Runnable和一个待返回的结果包装成一个Callable
public static <T> Callable<T> callable(Runnable task, T result) {
if (task == null)
throw new NullPointerException();
return new RunnableAdapter<T>(task, result);
}
2. ThreadPoolExecutor三种扩展类详解
关于ThreadPoolExecutor详细参考https://my.oschina.net/u/3352298/blog/1811255
2.1 FixedThreadPool详解
FixedThreadPool被称为可重用固定线程数的线程池。下面是FixedThreadPool的源代码实现。
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
FixedThreadPool的corePoolSize和maximumPoolSize都被设置为创建FixedThreadPool时指定的参数nThreads。 当线程池中的线程数大于corePoolSize时,keepAliveTime为多余的空闲线程等待新任务的最长时间,超过这个时间后多余的线程将被终止。这里把keepAliveTime设置为0L,意味着多余的空闲线程会被立即终止。
execute方法执行流程为:
1)如果当前运行的线程数少于corePoolSize,则创建新线程来执行任务。
2)当前运行的线程数等于或大于corePoolSize时,将任务加入 LinkedBlockingQueue。
3)线程执行完1中的任务后,会在循环中反复从LinkedBlockingQueue获取任务来执行。 FixedThreadPool使用*队列LinkedBlockingQueue作为线程池的工作队列(队列的容量为 Integer.MAX_VALUE)。
如果使用*队列会带来如下影响:
1)当线程池中的线程数达到corePoolSize后,新任务将在*队列中等待,因此线程池中的线程数不会超过corePoolSize。
2)由于1,使用*队列时maximumPoolSize将是一个无效参数。
3)由于1和2,使用*队列时keepAliveTime将是一个无效参数。
4)由于使用*队列,运行中的FixedThreadPool(未执行方法shutdown()或 shutdownNow())不会拒绝任务(不会调用RejectedExecutionHandler.rejectedExecution方法)。
2.2 SingleThreadExecutor详解
SingleThreadExecutor是使用单个worker线程的Executor。下面是SingleThreadExecutor的源代码实现。
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
SingleThreadExecutor的corePoolSize和maximumPoolSize被设置为1。其他参数与 FixedThreadPool相同。SingleThreadExecutor使用*队列LinkedBlockingQueue作为线程池的工 作队列(队列的容量为Integer.MAX_VALUE)。SingleThreadExecutor使用*队列作为工作队列 对线程池带来的影响与FixedThreadPool相同。
2.3 CachedThreadPool详解
CachedThreadPool是一个会根据需要创建新线程的线程池。下面是创建CachedThreadPool的源代码。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
CachedThreadPool的corePoolSize被设置为0,即corePool为空;maximumPoolSize被设置为 Integer.MAX_VALUE,即maximumPool是*的。这里把keepAliveTime设置为60L,意味着 CachedThreadPool中的空闲线程等待新任务的最长时间为60秒,空闲线程超过60秒后将会被 终止。
CachedThreadPool使用没有容量的SynchronousQueue作为线程池的工作队列,但
CachedThreadPool的maximumPool是*的。这意味着,如果主线程提交任务的速度高于
maximumPool中线程处理任务的速度时,CachedThreadPool会不断创建新线程。极端情况下,
CachedThreadPool会因为创建过多线程而耗尽CPU和内存资源。
执行流程:
- 首先执行SynchronousQueue.offer(Runnable task)。如果当前maximumPool中有空闲线程 正在执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS),那么主线程执行 offer操作与空闲线程执行的poll操作配对成功,主线程把任务交给空闲线程执行,execute()方 法执行完成;否则执行下面的步骤2)。
- 当初始maximumPool为空,或者maximumPool中当前没有空闲线程时,将没有线程执行 SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS)。这种情况下,步骤1)将失 败。此时CachedThreadPool会创建一个新线程执行任务,execute()方法执行完成。
- 在步骤2)中新创建的线程将任务执行完后,会执行 SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS)。这个poll操作会让空闲线 程最多在SynchronousQueue中等待60秒钟。如果60秒钟内主线程提交了一个新任务(主线程执 行步骤1)),那么这个空闲线程将执行主线程提交的新任务;否则,这个空闲线程将终止。由于 空闲60秒的空闲线程会被终止,因此长时间保持空闲的CachedThreadPool不会使用任何资源。
前面提到过,SynchronousQueue是一个没有容量的阻塞队列。每个插入操作必须等待另一 个线程的对应移除操作,反之亦然。CachedThreadPool使用SynchronousQueue,把主线程提交的 任务传递给空闲线程执行。
3. ScheduledThreadPoolExecutor详解
ScheduledThreadPoolExecutor继承自ThreadPoolExecutor。它主要用来在给定的延迟之后运 行任务,或者定期执行任务。ScheduledThreadPoolExecutor的功能与Timer类似,但 ScheduledThreadPoolExecutor功能更强大、更灵活。Timer对应的是单个后台线程,而 ScheduledThreadPoolExecutor可以在构造函数中指定多个对应的后台线程数。
3.1运行机制
ScheduledThreadPoolExecutor的执行主要分为两大部分。 首先调用ScheduledThreadPoolExecutor的scheduleAtFixedRate()方法或者scheduleWithFixedDelay()方法时,会向ScheduledThreadPoolExecutor的DelayQueue添加一个实现了 RunnableScheduledFutur接口的ScheduledFutureTask。接着线程池中的线程从DelayQueue中获取ScheduledFutureTask,然后执行任务。
ScheduledThreadPoolExecutor为了实现周期性的执行任务,对ThreadPoolExecutor做了一些修改。
- 使用DelayQueue作为任务队列。
- 获取任务的方式不同。
- 执行周期任务后,增加了额外的处理
3.2 ScheduledThreadPoolExecutor的实现
1.ScheduledThreadPoolExecutor会把待调度的任务(ScheduledFutureTask) 放到一个DelayQueue中。而ScheduledFutureTask主要包含3个成员变量,long型成员变量time,表示这个任务将要被执行的具体时间。long型成员变量sequenceNumber,表示这个任务被添加到ScheduledThreadPoolExecutor中 的序号。long型成员变量period,表示任务执行的间隔周期。
2.DelayQueue封装了一个PriorityQueue,这个PriorityQueue会对队列中的ScheduledFutureTask进行排序。排序时,time小的排在前面(时间早的任务将被先执行)。如果两个 ScheduledFutureTask的time相同,就比较sequenceNumber,sequenceNumber小的排在前面(也就 是说,如果两个任务的执行时间相同,那么先提交的任务将被先执行)。
3.ScheduledThreadPoolExecutor中的线程执行周期任务的过程:
(1)线程1从DelayQueue中获取已到期的ScheduledFutureTask(DelayQueue.take())。到期任务 是指ScheduledFutureTask的time大于等于当前时间。
(2)线程1执行这个ScheduledFutureTask。
(3)线程1修改ScheduledFutureTask的time变量为下次将要被执行的时间。
(4)线程1把这个修改time之后的ScheduledFutureTask放回DelayQueue中(DelayQueue.add())。
4.DelayQueue.take()的执行步骤:
public RunnableScheduledFuture<?> take() throws InterruptedException {
final ReentrantLock lock = this.lock;
lock.lockInterruptibly();
try {
for (;;) {
RunnableScheduledFuture<?> first = queue[0];
if (first == null)
available.await();
else {
long delay = first.getDelay(NANOSECONDS);
if (delay <= 0)
return finishPoll(first);
first = null; // don't retain ref while waiting
if (leader != null)
available.await();
else {
Thread thisThread = Thread.currentThread();
leader = thisThread;
try {
available.awaitNanos(delay);
} finally {
if (leader == thisThread)
leader = null;
}
}
}
}
} finally {
if (leader == null && queue[0] != null)
available.signal();
lock.unlock();
}
}
(1)获取lock锁
(2)获取周期任务。这一步包括
- 如果PriorityQueue为空,当前线程到Condition中等待;否则执行下一步
- 如果PriorityQueue的头元素的time时间比当前时间大,到Condition中等待到time时间;否则执行下一步
- 获取PriorityQueue的头元素;如果PriorityQueue不为空,则唤醒在Condition中等待 的所有线程
(3)释放Lock。
ScheduledThreadPoolExecutor在一个循环中执行步骤2,直到线程从PriorityQueue获取到一 个元素之后,才会退出无限循环(结束步骤2)。
5.DelayQueue.add()的执行步骤:
//add方法中调用offer方法
public boolean offer(Runnable x) {
if (x == null)
throw new NullPointerException();
RunnableScheduledFuture<?> e = (RunnableScheduledFuture<?>)x;
final ReentrantLock lock = this.lock;
lock.lock();
try {
int i = size;
if (i >= queue.length)
grow();
size = i + 1;
if (i == 0) {
queue[0] = e;
setIndex(e, 0);
} else {
siftUp(i, e);
}
if (queue[0] == e) {
leader = null;
available.signal();
}
} finally {
lock.unlock();
}
return true;
}
添加任务分为3大步骤:
(1)获取Lock。
(2)添加任务。
- 向PriorityQueue添加任务。
- 如果添加的任务是PriorityQueue的头元素,唤醒在Condition中等待的所有线 程。
3)释放Lock。
4. FutureTask详解
4.1 FutureTask简介
Future接口和实现Future接口的FutureTask类,代表异步计算的结果。FutureTask除了实现Future接口外,还实现了Runnable接口。因此,FutureTask可以交给 Executor执行,也可以由调用线程直接执行(FutureTask.run())。根据FutureTask.run()方法被执行 的时机,FutureTask处于下面3种状态。
- 未启动:FutureTask.run()方法还没有被执行之前,FutureTask处于未启动状态。当创建一 个FutureTask,且没有执行FutureTask.run()方法之前,这个FutureTask处于未启动状态。
- 已启动(正在运行中)。FutureTask.run()方法被执行的过程中,FutureTask处于已启动状态。
- 已完成。FutureTask.run()方法执行完后正常结束,或被取消(FutureTask.cancel(…)),或 执行FutureTask.run()方法时抛出异常而异常结束,FutureTask处于已完成状态。
//jdk1.8 源码细分为以下7中状态
private volatile int state;
private static final int NEW = 0;
private static final int COMPLETING = 1;
private static final int NORMAL = 2;
private static final int EXCEPTIONAL = 3;
private static final int CANCELLED = 4;
private static final int INTERRUPTING = 5;
private static final int INTERRUPTED = 6;
当FutureTask处于未启动或已启动状态时,执行FutureTask.get()方法将导致调用线程阻塞;
当FutureTask处于已完成状态时,执行FutureTask.get()方法将导致调用线程立即返回结果或抛出异常。
当FutureTask处于未启动状态时,执行FutureTask.cancel()方法将导致此任务永远不会被执 行;
当FutureTask处于已启动状态时,执行FutureTask.cancel(true)方法将以中断执行此任务线程 的方式来试图停止任务;
当FutureTask处于已启动状态时,执行FutureTask.cancel(false)方法将 不会对正在执行此任务的线程产生影响(让正在执行的任务运行完成);
当FutureTask处于已完 成状态时,执行FutureTask.cancel(…)方法将返回false。
4.2 FutureTask的使用
可以把FutureTask交给Executor执行;也可以通过ExecutorService.submit(…)方法返回一个 FutureTask,然后执行FutureTask.get()方法或FutureTask.cancel(…)方法。除此以外,还可以单独使用FutureTask,注意利用其run方法和get方法的特性,只有一个FutureTask对象run方法执行完毕后get方法才能返回,否则将会阻塞,利用这一点可以实现与等待/通知机制相同的作用。
4.3 FutureTask的底层实现
FutureTask的实现基于抽象类AbstractQueuedSynchronizer(以下简称为AQS)。java.util.concurrent中的很多可阻塞类(比如ReentrantLock)都是基于AQS来实现的。AQS是一个同步框架,它提供通用机制来原子性管理同步状态、阻塞和唤醒线程,以及维护被阻塞线程的队列。JDK 6中AQS 被广泛使用,基于AQS实现的同步器包括:ReentrantLock、Semaphore、ReentrantReadWriteLock、CountDownLatch和FutureTask。
每一个基于AQS实现的同步器都会包含两种类型的操作:
- 至少一个acquire操作。这个操作阻塞调用线程,除非/直到AQS的状态允许这个线程继续 执行。FutureTask的acquire操作为get()/get(long timeout,TimeUnit unit)方法调用。
- 至少一个release操作。这个操作改变AQS的状态,改变后的状态可允许一个或多个阻塞 线程被解除阻塞。FutureTask的release操作包括run()方法和cancel(…)方法。
注意:《Java并发编程的艺术》这里所说并不能用于所有jdk版本,我在查看jdk1.8源码发现 FutureTask的实现并没有基于抽象类AbstractQueuedSynchronizer,而是基于LockSupport中的park()与unpark()方法实现的,并且通过一个内置的链表类WaitNode来存储管理所有被get()方法阻塞的线程。因此,我在这里便仅对jdk1.8的实现进行一些分析。而基于抽象类AbstractQueuedSynchronizer可自行参考Semaphore类中的源码,在此不再进行赘述。
1.首先是保存管理所有被get方法阻塞的线程,通过链表结构来管理。
static final class WaitNode {
volatile Thread thread;
volatile WaitNode next;
WaitNode() { thread = Thread.currentThread(); }
}
/** 阻塞线程链表,或者说是一个栈,遵循先进后出 */
private volatile WaitNode waiters;
2.接下来我们查看get方法的源码,查看其如何实现阻塞
public V get() throws InterruptedException, ExecutionException {
int s = state;
if (s <= COMPLETING)
s = awaitDone(false, 0L);
return report(s);
}
public V get(long timeout, TimeUnit unit)
throws InterruptedException, ExecutionException, TimeoutException {
if (unit == null)
throw new NullPointerException();
int s = state;
if (s <= COMPLETING &&
(s = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING)
throw new TimeoutException();
return report(s);
}
private int awaitDone(boolean timed, long nanos)
throws InterruptedException {
final long deadline = timed ? System.nanoTime() + nanos : 0L;
WaitNode q = null;
boolean queued = false;
for (;;) {
if (Thread.interrupted()) {
removeWaiter(q);
throw new InterruptedException();
}
int s = state;
if (s > COMPLETING) {
if (q != null)
q.thread = null;
return s;
}
else if (s == COMPLETING) // cannot time out yet
Thread.yield();
else if (q == null)
q = new WaitNode();
else if (!queued)
queued = UNSAFE.compareAndSwapObject(this, waitersOffset,
q.next = waiters, q);
else if (timed) {
nanos = deadline - System.nanoTime();
if (nanos <= 0L) {
removeWaiter(q);
return state;
}
LockSupport.parkNanos(this, nanos);
}
else
LockSupport.park(this);
}
}
get方法实现的执行步骤为:
(1)首先判断当前FutureTask是否处于运行中或未运行状态时,是则调用awaitDone方法进行阻塞进行下一步。否则返回任务计算结果。
(2)awaitDone方法中首先判断当前线程是否被中断,是则抛出异常返回,awaitDone方法停止阻塞。否则进行下一步。
(3)判断FutureTask任务是否处于完成状态,如果处于完成状态且在上一次循环中给与阻塞线程节点q赋予对象时,则将q引用置为null,且返回当前状态值s,awaitDone方法停止阻塞。否则进行下一步。
(4)是否FutureTask任务处于运行状态,是则继续阻塞。否则进行下一步。
(5)如果阻塞线程节点对象为null,则对引用q赋予阻塞线程节点对象。否则进行下一步
(6)是否将当前被阻塞线程加入到链表中,如果没有则加入链表并返回给queued为true,如果已经加入则执行下一步。
(7)调用park(Object)方法阻塞当前线程,直到unpark(Thread t)方法来解除阻塞。或使用parkNanos(Object blocker, long nanos)来进行超时阻塞,超过规定时间则返回state或调用unpark(Thread t)方法解除阻塞。
(8)重复2-7步,直到该方法return 解除阻塞
3.run方法与cancle方法则要简单许多,run方法执行完毕后或cancle方法中断当前线程后,都会调用finishCompletion()方法。finishCompletion()方法会遍历阻塞线程链表,删除所有节点并且解除所有节点中的线程的阻塞状态然后返回。