并行设计模式（二）-- Master-Worker模式

2022-08-17 17:35:16

　　Java多线程编程中，常用的多线程设计模式包括：Future模式、Master-Worker模式、Guarded Suspeionsion模式、不变模式和生产者-消费者模式等。这篇文章主要讲述Master-Worker模式，关于其他多线程设计模式的地址如下：
　　关于Future模式的详解：并行设计模式（一）-- Future模式
　　关于Guarded Suspeionsion模式的详解：并行设计模式（三）-- Guarded Suspeionsion模式
　　关于不变模式的详解：并行设计模式（四）-- 不变模式
　　关于生产者-消费者模式的详解：并行设计模式（五）-- 生产者-消费者模式

1. Master-Worker模式

　　Master-Worker模式是常用的并行模式之一，它的核心思想是：系统由两类进程协同工作，即Master进程和Worker进程，Master负责接收和分配任务，Wroker负责处理子任务。当各个Worker进程将子任务处理完成后，将结果返回给Master进程，由Master进程进行汇总，从而得到最终的结果，其具体处理过程如下图所示。

　　Master-Worker 模式的好处，它能够将一个大任务分解成若干个小任务并行执行，从而提高系统的吞吐量。而对于系统请求者 Client 来说，任务一旦提交，Master进程会分配任务并立即返回，并不会等待系统全部处理完成后再返回，其处理过程是异步的。因此，Client 不会出现等待现象。

2. Master-Worker模式结构

　　Master-Worker 模式的结构相对比较简单，Master 进程为主要进程，它维护了一个Worker 进程队列、子任务队列和子结果集、Worker 进程队列中的 Worker 进程，不停地从任务队列中提取要处理的子任务，并将子任务的处理结果写入结果集。具体的结构图如下所示：

注意：Master-Worker 模式是一种使用多线程进行数据处理的结构。多个 Worker 进程协作处理用户请求，Master 进程负责维护 Worker 进程，并整合最终处理结果。

3. 代码实现

　　Master-Worker 主要角色分配如下所示：

角色	作用
Worker	用于实际处理一个任务
Master	用于任务的分配和最终结果的合成
Main	启动系统，调用开启Master

下面是一个简易版的 Master-Worker 框架 Java 代码实现

1. Master 部分源码实现：

 import java.util.HashMap;

 import java.util.Map;

 import java.util.Queue;

 import java.util.concurrent.ConcurrentHashMap;

 import java.util.concurrent.ConcurrentLinkedQueue;

 public class Master {

     // 任务队列

     protected Queue<Object> workQueue = new ConcurrentLinkedQueue<Object>();

     // Worker进程队列

     protected Map<String, Thread> threadMap = new HashMap<String, Thread>();

     // 子任务处理结果集

     protected Map<String, Object> resultMap = new ConcurrentHashMap<String, Object>();

     // 构造函数

     public Master(Worker worker, int countWorker) {

         worker.setWorkQueue(workQueue); //添加任务队列

         worker.setResultMap(resultMap); //添加计算结果集合

         for(int i=0; i<countWorker; i++) {

             threadMap.put(Integer.toString(i), new Thread(worker, Integer.toString(i))); //循环添加任务进程

         }

     }

     //是否所有的子任务都结束了

     public boolean isComplete() {

         for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {

             if(entry.getValue().getState() != Thread.State.TERMINATED)

                 return false; //存在未完成的任务

         }

         return true;

     }

     //提交一个子任务

     public void submit(Object job) {

         workQueue.add(job);

     }

     //返回子任务结果集

     public Map<String, Object> getResultMap() {

         return resultMap;

     }

     //执行所有Worker进程，进行处理

     public void execute() {

         for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {

             entry.getValue().start();

         }

     }

 }

2. Worker 进程的源代码实现

 import java.util.Map;

 import java.util.Queue;

 public class Worker  implements Runnable{

     //任务队列，用于取得子任务

     protected Queue<Object> workQueue;

     //子任务处理结果集

     protected Map<String ,Object> resultMap;

     public void setWorkQueue(Queue<Object> workQueue){

         this.workQueue= workQueue;

     }

     public void setResultMap(Map<String ,Object> resultMap){

         this.resultMap=resultMap;

     }

     //子任务处理的逻辑，在子类中实现具体逻辑
public Object handle(Object input){
         return input;
     }


     @Override

     public void run() {

         while(true){

             //获取子任务
Object input= workQueue.poll();
             if(input==null){

                 break;

             }

             //处理子任务

             Object re = handle(input);

             resultMap.put(Integer.toString(input.hashCode()), re);

         }

     }

 }

　　以上两段代码已经展示了 Master-Worker 框架的全貌。应用程序中通过重载Worker.handle()方法实现应用层逻辑。

注意：Master-Worker 模式是一种将串行任务并行化的方法，被分解的子任务在系统中可以被并行处理。同时，如果有需要，Master 进程不需要等待所有子任务都完成计算，就可以根据已有的部分结果集计算最终结果。

　　现应用这个 Master-Worker 框架，实现一个计算立方和的应用，并计算 1 ~~ 100 的立方和，即 1³ + 2³ + 3³ + ... + 100³。

　　计算任务可被分解为 100 个子任务，每个子任务仅用于计算单独的立方和。Master 产生固定个数的 Worker 来处理所有这些子任务。Worker 不断地从任务集合中取得这些计算立方和的子任务，并将计算结果返回给 Master。Master 负责将所有 Worker 的任务结果进行累加，从而产生最终的立方和。在整个计算过程中，Master 与 Worker 的运行也是完全异步的，Master 不必等到所有的 Worker 都执行完成后，就可以进行求和操作。即，Master 在获得部分子任务结果集时，就已经可以开始对最终结果进行计算，从而进一步提高系统的并行度和吞吐量。具体的任务分解如下图所示：

3.子任务 PlusWork 源码实现

　　计算任务被划分成100个子任务，每个任务仅仅用于计算单独的立方和，对应的 PlusWork 源码如下：

public class PlusWorker extends Worker { //求立方和

    @Override

    public Object handle(Object input) {

        int i = (Integer)input;

        return i * i * i;

    }

}

4. 进行计算的 Main 函数

　　运行的调用函数如下。在主函数中首先通过Master类创建5个Worker工作进程和Worker工作实例PlusWorker。在提交了100个子任务后，边开始子任务的计算。这些子任务中由这5个进程共同完成。Master不用等待所有Worker计算完成才开始汇总，而是子任务在计算的过程中，Master就开始汇总了。

 import java.util.Map;

 import java.util.Set;

 public class Application {

     public static void main(String[] args) {

         //固定使用5个Workde

         Master master = new Master(new PlusWorker(), 5);

         for(int i=1; i<=100; i++) //提交100个子任务

             master.submit(i);

         master.execute(); //开始计算

         int re = 0;  //最终计算结果保存在此

         Map<String, Object> resultMap = master.getResultMap();

         while(true) {//不需要等待所有Worker都执行完成，即可开始计算最终结果

             Set<String> keys = resultMap.keySet();  //开始计算最终结果

             String key = null;

             for(String k : keys) {

                 key = k;

                 break;

             }

             Integer i = null;

             if(key != null)

                 i = (Integer)resultMap.get(key);

             if(i != null)

                 re += i; //最终结果

             if(key != null)

                 resultMap.remove(key); //移除已被计算过的项目

             if(master.isComplete() && resultMap.size()==0)

                 break;

         }

         System.out.println(re);

     }

 }

运行结果：

25502500

总结：

　　重要的事情说三遍，Master-Worker 模式是一种将串行任务并行化的方案，被分解的子任务在系统中可以被并行处理，同时，如果有需要，Master进程不需要等待所有子任务都完成计算，就可以根据已有的部分结果集计算最终结果集。

码农公寓

相关文章