大数据查询引擎的选型,画了几张架构图,和一些对比分析:
一、Presto
二、Impala
三、HAWQ
四、总体比较:
1)都是MPP架构,且没有明显性能差距
2)HAWQ的功能、特性较Presto和Impala更全面,同时带来系统配置复杂,学习维护成本高的风险
3)Presto与Impala都有各自明显的优势:
1,Presto可以通过Connector接入多种数据源,灵活性高,而Impala只支持有限的数据源类型
2,Impala天然支持Coordinator高可用,Presto的Coordinator存在单点故障,需人工参与恢复
3,Impala更容易在现有CDH环境部署、集成
目前使用Hive痛点问题是慢
在满足速度快的条件下,替代方案的稳定性、易用性、易维护性优先考虑,