Apache Spark的工作原理
1
Why Apache Spark2
关于Apache Spark3
如何安装Apache Spark4
Apache Spark的工作原理5
spark弹性分布式数据集6
RDD持久性7
spark共享变量8
Spark SQL9
Spark Streaming
Spark引擎提供了一种在一组机器上分布式内存中处理数据的方法。图7显示了典型的Spark作业如何处理信息的逻辑图。
主控制如何分割数据,并利用数据位置,同时跟踪从机上的所有分布式数据计算。如果某台从机不可用,该机器上的数据将在其他可用的机器上重建。“大师”目前是一个单一的失败点,但将在即将发布的版本中修复。
公众号:it全能程序猿