Java编程的逻辑 (77) - 异步任务执行服务

2023-01-12 17:10:35

本系列文章经补充和完善，已修订整理成书《Java编程的逻辑》，由机械工业出版社华章分社出版，于2018年1月上市热销，读者好评如潮！各大网店和书店有售，欢迎购买，京东自营链接：http://item.jd.com/12299018.html

Java并发包提供了一套框架，大大简化了执行异步任务所需的开发，本节我们就来初步探讨这套框架。

在之前的介绍中，线程Thread既表示要执行的任务，又表示执行的机制，而这套框架引入了一个"执行服务"的概念，它将"任务的提交"和"任务的执行"相分离，"执行服务"封装了任务执行的细节，对于任务提交者而言，它可以关注于任务本身，如提交任务、获取结果、取消任务，而不需要关注任务执行的细节，如线程创建、任务调度、线程关闭等。

以上描述可能比较抽象，接下来，我们会一步步具体阐述。

基本接口

首先，我们来看任务执行服务涉及的基本接口：

Runnable和Callable：表示要执行的异步任务
Executor和ExecutorService：表示执行服务
Future：表示异步任务的结果

Runnable和Callable

关于Runnable和Callable，我们在前面几节都已经了解了，都表示任务，Runnable没有返回结果，而Callable有，Runnable不会抛出异常，而Callable会。

Executor和ExecutorService

Executor表示最简单的执行服务，其定义为：

public interface Executor {

    void execute(Runnable command);

}

就是可以执行一个Runnable，没有返回结果。接口没有限定任务如何执行，可能是创建一个新线程，可能是复用线程池中的某个线程，也可能是在调用者线程中执行。

ExecutorService扩展了Executor，定义了更多服务，基本方法有：

public interface ExecutorService extends Executor {

    <T> Future<T> submit(Callable<T> task);

    <T> Future<T> submit(Runnable task, T result);

    Future<?> submit(Runnable task);

    //... 其他方法

}

这三个submit都表示提交一个任务，返回值类型都是Future，返回后，只是表示任务已提交，不代表已执行，通过Future可以查询异步任务的状态、获取最终结果、取消任务等。我们知道，对于Callable，任务最终有个返回值，而对于Runnable是没有返回值的，第二个提交Runnable的方法可以同时提供一个结果，在异步任务结束时返回，而对于第三个方法，异步任务的最终返回值为null。

Future

我们来看Future接口的定义：

public interface Future<V> {

    boolean cancel(boolean mayInterruptIfRunning);

    boolean isCancelled();

    boolean isDone();

    V get() throws InterruptedException, ExecutionException;

    V get(long timeout, TimeUnit unit) throws InterruptedException,

        ExecutionException, TimeoutException;

}

get用于返回异步任务最终的结果，如果任务还未执行完成，会阻塞等待，另一个get方法可以限定阻塞等待的时间，如果超时任务还未结束，会抛出TimeoutException。

cancel用于取消异步任务，如果任务已完成、或已经取消、或由于某种原因不能取消，cancel返回false，否则返回true。如果任务还未开始，则不再运行。但如果任务已经在运行，则不一定能取消，参数mayInterruptIfRunning表示，如果任务正在执行，是否调用interrupt方法中断线程，如果为false就不会，如果为true，就会尝试中断线程，但我们从69节知道，中断不一定能取消线程。

isDone和isCancelled用于查询任务状态。isCancelled表示任务是否被取消，只要cancel方法返回了true，随后的isCancelled方法都会返回true，即使执行任务的线程还未真正结束。isDone表示任务是否结束，不管什么原因都算，可能是任务正常结束、可能是任务抛出了异常、也可能是任务被取消。

我们再来看下get方法，任务最终大概有三个结果：

正常完成，get方法会返回其执行结果，如果任务是Runnable且没有提供结果，返回null
任务执行抛出了异常，get方法会将异常包装为ExecutionException重新抛出，通过异常的getCause方法可以获取原异常
任务被取消了，get方法会抛出异常CancellationException

如果调用get方法的线程被中断了，get方法会抛出InterruptedException。

Future是一个重要的概念，是实现"任务的提交"与"任务的执行"相分离的关键，是其中的"纽带"，任务提交者和任务执行服务通过它隔离各自的关注点，同时进行协作。

基本用法

基本示例

说了这么多接口，具体怎么用呢？我们看个简单的例子：

public class BasicDemo {

    static class Task implements Callable<Integer> {

        @Override

        public Integer call() throws Exception {

            int sleepSeconds = new Random().nextInt(1000);

            Thread.sleep(sleepSeconds);

            return sleepSeconds;

        }

    }

    public static void main(String[] args) throws InterruptedException {

        ExecutorService executor = Executors.newSingleThreadExecutor();

        Future<Integer> future = executor.submit(new Task());

        // 模拟执行其他任务

        Thread.sleep(100);

        try {

            System.out.println(future.get());

        } catch (ExecutionException e) {

            e.printStackTrace();

        }

        executor.shutdown();

    }

}

我们使用了工厂类Executors创建了一个任务执行服务，Executors有多个静态方法，可以用来创建ExecutorService，这里使用的是：

public static ExecutorService newSingleThreadExecutor()

表示使用一个线程执行所有服务，后续我们会详细介绍Executors，注意与Executor相区别，后者是单数，是接口。

不管ExecutorService是如何创建的，对使用者而言，用法都一样，例子提交了一个任务，提交后，可以继续执行其他事情，随后可以通过Future获取最终结果或处理任务执行的异常。

最后，我们调用了ExecutorService的shutdown方法，它会关闭任务执行服务。

ExecutorService的更多方法

前面我们只是介绍了ExecutorService的三个submit方法，其实它还有如下方法：

public interface ExecutorService extends Executor {

    void shutdown();

    List<Runnable> shutdownNow();

    boolean isShutdown();

    boolean isTerminated();

    boolean awaitTermination(long timeout, TimeUnit unit)

        throws InterruptedException;

    <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks)

        throws InterruptedException;

    <T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks,

                                  long timeout, TimeUnit unit)

        throws InterruptedException;

    <T> T invokeAny(Collection<? extends Callable<T>> tasks)

        throws InterruptedException, ExecutionException;

    <T> T invokeAny(Collection<? extends Callable<T>> tasks,

                    long timeout, TimeUnit unit)

        throws InterruptedException, ExecutionException, TimeoutException;

}

有两个关闭方法，shutdown和shutdownNow，区别是，shutdown表示不再接受新任务，但已提交的任务会继续执行，即使任务还未开始执行，shutdownNow不仅不接受新任务，已提交但尚未执行的任务会被终止，对于正在执行的任务，一般会调用线程的interrupt方法尝试中断，不过，线程可能不响应中断，shutdownNow会返回已提交但尚未执行的任务列表。

shutdown和shutdownNow不会阻塞等待，它们返回后不代表所有任务都已结束，不过isShutdown方法会返回true。调用者可以通过awaitTermination等待所有任务结束，它可以限定等待的时间，如果超时前所有任务都结束了，即isTerminated方法返回true，则返回true，否则返回false。

ExecutorService有两组批量提交任务的方法，invokeAll和invokeAny，它们都有两个版本，其中一个限定等待时间。

invokeAll等待所有任务完成，返回的Future列表中，每个Future的isDone方法都返回true，不过isDone为true不代表任务就执行成功了，可能是被取消了，invokeAll可以指定等待时间，如果超时后有的任务没完成，就会被取消。

而对于invokeAny，只要有一个任务在限时内成功返回了，它就会返回该任务的结果，其他任务会被取消，如果没有任务能在限时内成功返回，抛出TimeoutException，如果限时内所有任务都结束了，但都发生了异常，抛出ExecutionException。

ExecutorService的invokeAll示例

我们在64节介绍过使用jsoup下载和分析HTML，我们使用它看一个invokeAll的例子，同时下载并分析两个URL的标题，输出标题内容，代码为：

public class InvokeAllDemo {

    static class UrlTitleParser implements Callable<String> {

        private String url;

        public UrlTitleParser(String url) {

            this.url = url;

        }

        @Override

        public String call() throws Exception {

            Document doc = Jsoup.connect(url).get();

            Elements elements = doc.select("head title");

            if (elements.size() > 0) {

                return elements.get(0).text();

            }

            return null;

        }

    }

    public static void main(String[] args) {

        ExecutorService executor = Executors.newFixedThreadPool(10);

        String url1 = "http://www.cnblogs.com/swiftma/p/5396551.html";

        String url2 = "http://www.cnblogs.com/swiftma/p/5399315.html";

        Collection<UrlTitleParser> tasks = Arrays.asList(new UrlTitleParser[] {

                new UrlTitleParser(url1), new UrlTitleParser(url2) });

        try {

            List<Future<String>> results = executor.invokeAll(tasks, 10,

                    TimeUnit.SECONDS);

            for (Future<String> result : results) {

                try {

                    System.out.println(result.get());

                } catch (ExecutionException e) {

                    e.printStackTrace();

                }

            }

        } catch (InterruptedException e) {

            e.printStackTrace();

        }

        executor.shutdown();

    }

}

这里，使用了Executors的另一个工厂方法newFixedThreadPool创建了一个线程池，这样使得多个任务可以并发执行，关于线程池，我们下节介绍。

其它代码比较简单，我们就不解释了。使用ExecutorService，编写并发异步任务的代码就像写顺序程序一样，不用关心线程的创建和协调，只需要提交任务、处理结果就可以了，大大简化了开发工作。

基本实现原理

了解了ExecutorService和Future的基本用法，我们来看下它们的基本实现原理。

ExecutorService的主要实现类是ThreadPoolExecutor，它是基于线程池实现的，关于线程池我们下节再介绍。ExecutorService有一个抽象实现类AbstractExecutorService，本节，我们简要分析其原理，并基于它实现一个简单的ExecutorService，Future的主要实现类是FutureTask，我们也会简要探讨其原理。

AbstractExecutorService

AbstractExecutorService提供了submit, invokeAll和invokeAny的默认实现，子类只需要实现如下方法：

public void shutdown()

public List<Runnable> shutdownNow()

public boolean isShutdown()

public boolean isTerminated()

public boolean awaitTermination(long timeout, TimeUnit unit)

        throws InterruptedException

public void execute(Runnable command)

除了execute，其他方法都与执行服务的生命周期管理有关，简化起见，我们忽略其实现，主要考虑execute。

submit/invokeAll/invokeAny最终都会调用execute，execute决定了到底如何执行任务，简化起见，我们为每个任务创建一个线程，一个完整的最简单的ExecutorService实现类如下：

public class SimpleExecutorService extends AbstractExecutorService {

    @Override

    public void shutdown() {

    }

    @Override

    public List<Runnable> shutdownNow() {

        return null;

    }

    @Override

    public boolean isShutdown() {

        return false;

    }

    @Override

    public boolean isTerminated() {

        return false;

    }

    @Override

    public boolean awaitTermination(long timeout, TimeUnit unit)

            throws InterruptedException {

        return false;

    }

    @Override

    public void execute(Runnable command) {

        new Thread(command).start();

    }

}

对于前面的例子，创建ExecutorService的代码可以替换为：

ExecutorService executor = new SimpleExecutorService();

可以实现相同的效果。

ExecutorService最基本的方法是submit，它是如何实现的呢？我们来看AbstractExecutorService的代码：

public <T> Future<T> submit(Callable<T> task) {

    if (task == null) throw new NullPointerException();

    RunnableFuture<T> ftask = newTaskFor(task);

    execute(ftask);

    return ftask;

}

它调用newTaskFor生成了一个RunnableFuture，RunnableFuture是一个接口，既扩展了Runnable，又扩展了Future，没有定义新方法，作为Runnable，它表示要执行的任务，传递给execute方法进行执行，作为Future，它又表示任务执行的异步结果。这可能令人混淆，我们来看具体代码：

protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {

    return new FutureTask<T>(callable);

}

就是创建了一个FutureTask对象，FutureTask实现了RunnableFuture接口。它是怎么实现的呢？

FutureTask

它有一个成员变量表示待执行的任务，声明为：

private Callable<V> callable;

有个整数变量state表示状态，声明为：

private volatile int state;

取值可能为：

NEW          = 0; //刚开始的状态，或任务在运行

COMPLETING   = 1; //临时状态，任务即将结束，在设置结果

NORMAL       = 2; //任务正常执行完成

EXCEPTIONAL  = 3; //任务执行抛出异常结束

CANCELLED    = 4; //任务被取消

INTERRUPTING = 5; //任务在被中断

INTERRUPTED  = 6; //任务被中断

有个变量表示最终的执行结果或异常，声明为：

private Object outcome;

有个变量表示运行任务的线程：

private volatile Thread runner;

还有个单向链表表示等待任务执行结果的线程：

private volatile WaitNode waiters;

FutureTask的构造方法会初始化callable和状态，如果FutureTask接受的是一个Runnable对象，它会调用Executors.callable转换为Callable对象，如下所示：

public FutureTask(Runnable runnable, V result) {

    this.callable = Executors.callable(runnable, result);

    this.state = NEW;       // ensure visibility of callable

}

任务执行服务会使用一个线程执行FutureTask的run方法，run()代码为：

public void run() {

    if (state != NEW ||

        !UNSAFE.compareAndSwapObject(this, runnerOffset,

                                     null, Thread.currentThread()))

        return;

    try {

        Callable<V> c = callable;

        if (c != null && state == NEW) {

            V result;

            boolean ran;

            try {

                result = c.call();

                ran = true;

            } catch (Throwable ex) {

                result = null;

                ran = false;

                setException(ex);

            }

            if (ran)

                set(result);

        }

    } finally {

        // runner must be non-null until state is settled to

        // prevent concurrent calls to run()

        runner = null;

        // state must be re-read after nulling runner to prevent

        // leaked interrupts

        int s = state;

        if (s >= INTERRUPTING)

            handlePossibleCancellationInterrupt(s);

    }

}

其基本逻辑是：

调用callable的call方法，捕获任何异常
如果正常执行完成，调用set设置结果，保存到outcome
如果执行过程发生异常，调用setException设置异常，异常也是保存到outcome，但状态不一样
set和setException除了设置结果，修改状态外，还会调用finishCompletion，它会唤醒所有等待结果的线程

对于任务提交者，它通过get方法获取结果，限时get方法的代码为：

public V get(long timeout, TimeUnit unit)

    throws InterruptedException, ExecutionException, TimeoutException {

    if (unit == null)

        throw new NullPointerException();

    int s = state;

    if (s <= COMPLETING &&

        (s = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING)

        throw new TimeoutException();

    return report(s);

}

其基本逻辑是，如果任务还未执行完毕，就等待，最后调用report报告结果, report根据状态返回结果或抛出异常，代码为：

private V report(int s) throws ExecutionException {

    Object x = outcome;

    if (s == NORMAL)

        return (V)x;

    if (s >= CANCELLED)

        throw new CancellationException();

    throw new ExecutionException((Throwable)x);

}

cancel方法的代码为：

public boolean cancel(boolean mayInterruptIfRunning) {

    if (state != NEW)

        return false;

    if (mayInterruptIfRunning) {

        if (!UNSAFE.compareAndSwapInt(this, stateOffset, NEW, INTERRUPTING))

            return false;

        Thread t = runner;

        if (t != null)

            t.interrupt();

        UNSAFE.putOrderedInt(this, stateOffset, INTERRUPTED); // final state

    }

    else if (!UNSAFE.compareAndSwapInt(this, stateOffset, NEW, CANCELLED))

        return false;

    finishCompletion();

    return true;

}

其基本逻辑为：

如果任务已结束或取消，返回false
如果mayInterruptIfRunning为true，调用interrupt中断线程，设置状态为INTERRUPTED
如果mayInterruptIfRunning为false，设置状态为CANCELLED
调用finishCompletion唤醒所有等待结果的线程

invokeAll和invokeAny

理解了FutureTask，我们再来看AbstractExecutorService的其他方法，invokeAll的基本逻辑很简单，对每个任务，创建一个FutureTask，并调用execute执行，然后等待所有任务结束。

invokeAny的实现稍微复杂些，它利用了ExecutorCompletionService，关于这个类及invokeAny的实现，我们后续章节再介绍。

小结

本节介绍了Java并发包中任务执行服务的基本概念和原理，该服务体现了并发异步开发中"关注点分离"的思想，使用者只需要通过ExecutorService提交任务，通过Future操作任务和结果即可，不需要关注线程创建和协调的细节。

本节主要介绍了AbstractExecutorService和FutureTask的基本原理，实现了一个最简单的执行服务SimpleExecutorService，对每个任务创建一个单独的线程。实际中，最经常使用的执行服务是基于线程池实现的ThreadPoolExecutor，线程池是并发程序中一个非常重要的概念和技术，让我们下一节来探讨。

(与其他章节一样，本节所有代码位于 https://github.com/swiftma/program-logic)

----------------

未完待续，查看最新文章，敬请关注微信公众号“老马说编程”(扫描下方二维码)，从入门到高级，深入浅出，老马和你一起探索Java编程及计算机技术的本质。用心原创，保留所有版权。

码农公寓

相关文章