spark学习记录-2

spark编程模型

======

spark如何工作的?

1、user应用产生RDD,操作变形,运行action操作

2、操作的结果在有向无环图DAG中

3、DAG被编译到stages阶段中

4、每一阶段作为任务的一部分被执行(一个task对应一个partition分块)

========

narrow transformation和wide transformation

1, narrow transformation, 

map()   filter()

2,wide transformation

groupByKey()

reduceByKey()

=============

 

上一篇:如何用 pycharm 调试 airflow


下一篇:崛起的DAG新秀——SmartX白皮书解读