086-Spark-RDD-任务(task)划分

RDD任务切分中间分为:Application、Job、Stage和Task
Application:初始化一个SparkContext即生成一个Application;
Job:一个Action算子就会生成一个Job;
Stage:Stage等于宽依赖(ShuffleDependency)的个数加1;
Task:一个Stage阶段中,最后一个RDD的分区个数就是Task的个数。
注意:Application->Job->Stage->Task每一层都是1对n的关系。
086-Spark-RDD-任务(task)划分
086-Spark-RDD-任务(task)划分

上一篇:babel配置解析, 以及babel6和babel7的区别


下一篇:流水线