Presto全网最佳学习资料汇总

Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto的优点

如何说服你的老板使用Presto?

Presto本身很优秀: 首先Presto是一个全内存计算引擎,使得其速度特别的快;其次是它的灵活的插件机制,使得理论上可以从Presto联邦查询任意数据源,而社区默认的版本也已经自带了足够丰富的数据源,用户如果有自研的数据源,也可以开发相应的Connector进行链接;再者Presto实现的是完整的SQL语义,你不用担心某种语义是它不支持的,或者性能特别差,在SQL语义方面Presto是全能发展,而不是只专注一个方向(比如只专注单表查询性能);最后Presto有着活跃发展的社区,现在Presto有两个分支PrestoDB和PrestoSQL,两个分支都在活跃的发展带来了一些让人心动的新特性,比如对于TableScan的大幅度(Project Aria)。

Presto引擎设计符合大数据发展的趋势: 随着云计算的普及,网络带宽的持续加大,计算和存储分离的架构逐渐成为趋势,过去计算和存储一定要绑定在一起才能实现的查询性能现在计算和存储分离的架构下也是可以实现了,而Presto则是计算和存储分离的典型代表: Presto做计算,存储则是下面的各种Connector。这种架构演变的趋势让Presto得到越来越多的关注。

各大公司的实践

大家都在用。

书籍文献

在学术上Presto也是很牛的。

必读文章

来,先读点大家都爱看的。

资料网站

Presto的相关资料很多。

  • Presto官方网站

    • PrestoDB: 托管在Linux Fundation之下,Facebook、Twitter、阿里巴巴等等是其中的成员。因为大公司的场景锤炼,会有一些比较大的特性的规划和开发。
    • PrestoSQL: Starburst主导之下的一个分支,活跃度相对高一些。
  • Facebook Enginerring网站: Facebook关于Presto的一些开发进展在这个网站会有公布。
  • Presto中国知乎社区: 阿里云数据湖分析团队维护的Presto中国知乎社区,上面有大量的Presto源码分析文章。
  • Presto News公众号: 阿里云数据湖分析团队维护的Presto公众号,分享最新的Presto新闻、进展。

Presto全网最佳学习资料汇总

聊天群

进来聊聊吧,快速入门、解惑。

Presto全网最佳学习资料汇总

  • Presto China User Group(微信): 易观维护的一个微信群。

    • 很可惜,没有二维码,只可以邀请进群。

Presto as a Service

自己不想搭Presto? 可以直接用云服务。

Youtube频道

英文不错的、懂得**的可以看一看。

总结

这些资料是笔者整理,以供有Adhoc/BI报表/轻量级ETL需求的用户及Presto爱好者学习交流,以帮助大家更好的学习掌握这个引擎,大家如果有相关资料补充欢迎评论给我。

上一篇:这可能是大型复杂项目下数据流的最佳实践


下一篇:10倍性能提升!DLA SQL推出基于Alluxio的数据湖分析加速功能