Apache Kylin 是什么?

前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见1000个问题搞定大数据技术体系

正文

Apache Kylin 是什么?

Apache Kylin 是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。
——来自 Apache Kylin 官网

Apache Kylin是 Hadoop大数据平台上的一个开源OLAP引擎。

关于 OLAP 请参考我的博客——OLTP和OLAP的区别?

它采用 Cube 预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。

关于 Cube 请参考我的博客——Cube技术是什么?

相对于之前的分钟乃至小时级别的査询速度,亚秒级别速度是百倍到千倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大门。

Apache Kylin也是中国人主导的、唯一的 Apache *开源项目,在开源社区有世界级的影响力。

【注】参考《Apache Kylin 权威指南》

上一篇:Python+Spark2.0+hadoop学习笔记——pyspark基础


下一篇:尚硅谷Kylin视频教程发布!