并行及分布式框架 -- MPI/NCCL/OPENMP技术

初稿未完成

摘要

  1. 经典并行计算方案介绍。
  2. OPENMP技术详细介绍。
  3. MPI技术详细介绍。
  4. NV集合通信NCCL 技术介绍。
  5. 结合上述三个技术实战案例分享
经典并行计算方案介绍

简要介绍一下Hadoop、Spark、MPI三种计算框架的特点以及分别适用什么样的场景?

  • Hadoop:基于分布式文件系统HDFS的分布式批处理计算框架,适用于数据量大、SPMD(单程序多数据)的应用
  • Spark:基于内存计算的并行计算框架,适用于需要迭代多轮计算的应用
  • MPI:基于消息传递的并行计算框架,适用于各种复杂应用的并行计算,支持MPMD(多程序多数据),开发复杂度高。
MPI

MPI简介

  • MPI是一个消息传递接口标准;
  • MPI提供一个可移植、高效、灵活的消息传递接口;
  • MPI以语言独立的形式存在,可运行在不同的操作系统和硬件平台上;
  • MPI提供与C\C++和Fortran语言的保定。

MPI(MPI是一个标准,有不同的具体实现,比如MPICH等)是多主机联网协作进行并行计算的工具,当然也可以用于单主机上多核/多CPU的并行计算,不过效率低。它能协调多台主机间的并行计算,因此并行规模上的可伸缩性很强,能在从个人电脑到世界TOP10的超级计算机上使用。缺点是使用进程间通信的方式协调并行计算,这导致并行效率较低

上一篇:勒索病毒一周记:它让我们得到了什么经验教训?


下一篇:Python Qt GUI设计:QCalendar日历类和QDateTimeEdit时间类(基础篇—20)