Apache Spark 社区作为全球最大的开源社区,也是Apache基金会旗下最流行的开源分布式内存式大数据处理引擎。他快速、易于使用的框架,允许你解决各种复杂的数据问题,无论是半结构化、结构化、流式,或机器学习、数据科学。即使拥有来自250多个组织的超过1000个贡献者,以及遍布全球570多个地方的超过30万个Spark Meetup社区成员,作为一名国内的Spark小白,我相信大家都有一个共同的痛点,就是国内Spark
相关资料过少。为此我们筹办了一系列针对国内Spark开发者的活动,指路回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束(附PPT下载)
作为普惠Spark中华小当家系列活动的第二站,我们隆重推出第一期Spark学习训练营。由Spark 中文社区联合阿里云开发者社区联合打造,持续定期更新。第一期训练营邀请到了全 Apache Spark contributer 阵容,经过半个月对课程的精心打磨今天正式上线!限时免费抢报,速速来看→
训练营时间
2020年7月20日-25日
开营名额
1500人,报满即止
报名截止时间
2020年7月19日18:00
报名要求
希望你有一定的开发基础,对 Spark感兴趣想进一步深入了解
https://developer.aliyun.com/topic/trainingcamp/spark01
5天训练营你将收获
实战视角下对 Spark 底层架构、核心功能模块、社区生态等全方位解析,帮你建立对 Spark 应用场景与功能实现的系统认知。社区大佬们手把手实操演示,“家教”级辅导,社群答疑。 收获Spark 生产环境开发的基础技能,完成理论到实操的跨越,全程免费学 每天打卡成功,还能意外收获老师的“加餐”课程,还可以免费获得大礼包:包括 Spark summit 中文材料、电子书、实战精选案例等。 丰富多样的社区周边免费送,并有机会成为训练营志愿者,获得更多训练营直通车,坚持 5 天学习打卡还会获得Spark 定制马克杯哦~
注:具体内容以报名页面信息为准
5天训练营课程表
DAY1第 1 讲:Apache Spark入门
简要介绍Apache Spark架构、DataFrames API等,涵盖Apache Spark框架的基本原理。
主讲嘉宾 周康,阿里巴巴技术专家, Apache Spark/Hadoop/Parquet contributor
DAY2 第2讲 Spark SQL 介绍与实战
主要介绍Spark SQL的基本架构,主要模块和重要特性,常见的SQL性能问题与优化手段。
主讲嘉宾 李呈祥,阿里巴巴高级技术专家,Apache Hive Committer, Apache Flink Committer
DAY3第 3 讲:Spark for ETL and Data Science
主要介绍如何用Spark来做ETL以及交互式数据分析的最佳实践,
主讲嘉宾 章剑锋,阿里巴巴高级技术专家, Apache Tez、Livy 、Zeppelin PMC ,Apache Pig Committer
DAY4 第4讲 Using Delta lake
介绍Delta Lake的用户场景,如何创建、追加和更新数据到数据湖,如何使用 Delta Lake 构建一个数据分析管道等内容。
主讲嘉宾 辛现银,阿里巴巴技术专家。
DAY5 第5讲 Spark tuning and Best Practices
学生将在本节课中进行实操练习。
主讲嘉宾 王宇,阿里巴巴达摩院高级算法专家
点击页面报名。报名截止日期:7月19日18:00
无论你是在校同学还在一线开发,我们期望永远保持好奇、保持天真、拥有学习的热情和活力。欢迎更多的开发者和Spark爱好者加入到Spark训练营*同成长。
报名链接:
https://developer.aliyun.com/topic/trainingcamp/spark01