Apache Kylin 是什么？

2023-12-30 08:43:04

前言

本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和文献引用请见1000个问题搞定大数据技术体系

Apache Kylin 是一个开源的、分布式的分析型数据仓库，提供Hadoop/Spark 之上的 SQL 查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。
——来自 Apache Kylin 官网

Apache Kylin是 Hadoop大数据平台上的一个开源OLAP引擎。

关于 OLAP 请参考我的博客——OLTP和OLAP的区别？

它采用 Cube 预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。

关于 Cube 请参考我的博客——Cube技术是什么？

相对于之前的分钟乃至小时级别的査询速度,亚秒级别速度是百倍到千倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大门。

Apache Kylin也是中国人主导的、唯一的 Apache *开源项目,在开源社区有世界级的影响力。

【注】参考《Apache Kylin 权威指南》