Spark分区2023-10-16 16:17:58 默认采用的是Hash分区 缺点:可能导致每个分区中数据量的不均匀,极端情况下会导致某些分区拥有RDD的全部数据 Ranger分区 要求RDD中的KEY类型必须可以排序 自定义分区 根据需求,自定义分区 上一篇:springboot整合quartz,实现数据库方式执行定时任务下一篇:Spark基本概念