开发者社区精选直播合集 | Spark最佳实践

往期精选合集包(戳我前往)

囊括了:AI、架构师、 Serverless 、AIoT、DevOps、容器化、机器学习、云计算、K8s、微服务、云原生、视觉AI、大数据、小程序、物联网等各种主题直播合集。

开发者社区精选直播合集 | Spark最佳实践

Spark SQL模型变为在线服务

开发者社区精选直播合集 | Spark最佳实践
讲师:王太泽,第四范式特征工程数据库负责人
推荐理由:SparkSQ在机器学习场景中应用模型从批量到实时面临的问题诸如SparkSQL转换成实时执行成本高、离线特征和在线特征保持一致困难、离线效果与在线效果差距大等如何解?本视频一直致力于解决机器学习模型从离线到在线特征一致性问题和性能问题的第四范式特征工程数据库负责人王太泽给你分享经验,并用SparkSQL实时上线demo给你分析他们与传统实现方式的优势。戳我观看

基于 Spark 打造高效云原生数据分析引擎

开发者社区精选直播合集 | Spark最佳实践

讲师:辛庸,阿里巴巴计算平台事业部 EMR 技术专家
推荐理由:由阿里巴巴 EMR 团队提交的 TPC-DS 成绩如何能在九月份的榜单中取得了排名第一的成绩?本视频阿里巴巴计算平台事业部 EMR 技术专家选取一些有代表性的优化点,深入到技术细节做详细介绍,带你了解动态过滤、CBO增强、TopK排序等等,给你展示这个成绩背后EMR 团队对 Spark 执行引擎持续不断的优化成果。戳我观看

Tblestore结合Spark的云上流批一体大数据架构

开发者社区精选直播合集 | Spark最佳实践

讲师:王卓然, 花名琸然 阿里云存储服务技术专家
推荐理由:传统Lambda架构组件多运维复杂,如何使用一套存储和一套计算来实现流批架构充分享受技术红利?以Delta Lake为代表的新型数据湖方案越来越流行,传统的Lambda架构如何向数据湖架构进行扩展?以及结构化数据结合Delta Lake的最佳解决方案是什么。本视频阿里云存储服务技术专家琸然结合理论讲解和实际场景为你一一解答。戳我观看

基于Spark与TensorFlow的机器学习实践

开发者社区精选直播合集 | Spark最佳实践

讲师:吴威(无谓), 阿里巴巴高级技术专家
推荐理由:Apache Spark是目前最火热的计算框架, TensorFlow是目前最火热的机器学习框架,两者个碰撞到一起会产生什么巨大的火花?本视频通过EMR和PAI在这个上面的实践给你展示。戳我观看

Spark Relational Cache实现亚秒级响应的交互式分析

开发者社区精选直播合集 | Spark最佳实践

讲师:王道远(健身),阿里云EMR技术专家
推荐理由:Apache Spark被广泛用于超大规模的数据分析处理,在交互式分析等时间敏感的场景中,超大规模数据量的处理时间可能无法满足用户快速响应的需求怎么办?本视频阿里云EMR技术专家王道远通过Spark Relational Cache的实现原理和使用场景,带你了解如何通过数据的预组织和预计算,将频繁访问的数据和计算提前执行并保存在Relational Cache中,优化后续特定模式的查询,显著提高查询速度,实现亚秒级的响应。戳我观看

上一篇:阿里云开发者 DevUP 沙龙 -上海站 -平头哥语音智能 Workshop 邀你参加啦


下一篇:云栖大会offer来啦之“火箭面试卡”活动规则