初稿未完成
摘要
- 经典并行计算方案介绍。
- OPENMP技术详细介绍。
- MPI技术详细介绍。
- NV集合通信NCCL 技术介绍。
- 结合上述三个技术实战案例分享
简要介绍一下Hadoop、Spark、MPI三种计算框架的特点以及分别适用什么样的场景?
- Hadoop:基于分布式文件系统HDFS的分布式批处理计算框架,适用于数据量大、SPMD(单程序多数据)的应用
- Spark:基于内存计算的并行计算框架,适用于需要迭代多轮计算的应用
- MPI:基于消息传递的并行计算框架,适用于各种复杂应用的并行计算,支持MPMD(多程序多数据),开发复杂度高。
MPI简介
- MPI是一个消息传递接口标准;
- MPI提供一个可移植、高效、灵活的消息传递接口;
- MPI以语言独立的形式存在,可运行在不同的操作系统和硬件平台上;
- MPI提供与C\C++和Fortran语言的保定。
MPI(MPI是一个标准,有不同的具体实现,比如MPICH等)是多主机联网协作进行并行计算的工具,当然也可以用于单主机上多核/多CPU的并行计算,不过效率低。它能协调多台主机间的并行计算,因此并行规模上的可伸缩性很强,能在从个人电脑到世界TOP10的超级计算机上使用。缺点是使用进程间通信的方式协调并行计算,这导致并行效率较低