RDD任务切分中间分为:Application、Job、Stage和Task
Application:初始化一个SparkContext即生成一个Application;
Job:一个Action算子就会生成一个Job;
Stage:Stage等于宽依赖(ShuffleDependency)的个数加1;
Task:一个Stage阶段中,最后一个RDD的分区个数就是Task的个数。
注意:Application->Job->Stage->Task每一层都是1对n的关系。
相关文章
- 10-18swoole中使用task进程异步的处理耗时任务
- 10-18Swoole 快速起步:Task任务机制的使用
- 10-18深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)
- 10-18celery task异步任务
- 10-18任务取消TASK
- 10-18spring定时任务轮询(spring Task)
- 10-18SQL训练营任务学习打卡-task-02
- 10-18activiti任务TASK
- 10-1810.任务门(Task Gate)
- 10-18任务中如何确定spark分区数、task数目、core个数、worker节点个数、executor数量