Druid/Impala/Presto/Spark SQL/Kylin/Elasticsearch功能对比

Druid/Impala/Presto/Spark SQL/Kylin/Elasticsearch功能对比
Druid
Druid:是一个实时处理时序数据的OLAP数据库，因为它的索引首先按照时间分片，查询的时候也是按照时间―去路由索引。
Kylin
kylin:核心是Cube，Cube是一种预计算技术，基本思路是预先对数据作多维索引，查询时只扫描索引而不访问原始数据从而提速。
Presto
Presto:它没有使用MapReduce，大部分场景下比Hive快一个数量级，其中的关键是所有的处理都在内存中完成。
lmpala
lmpala:基于内存运算，速度快，支持的数据源没有Presto多。
Spark SQL
Spark SQL:基于Spark平台上的一个OLAP框架，基本思路是增加机器来并行计算，从而提高查询速度。
ES
ES:最大的特点是使用了倒排索引解决索引问题。根据研究，ES在数据获取和聚集用的资源比在Druid高。
框架选型:
(1）从超大数据的查询效率来看:
Druid > Kylin > Presto > Spark SQL
(2）从支持的数据源种类来讲:
Presto > Spark SQL > Kylin > Druid

Druid/Impala/Presto/Spark SQL/Kylin/Elasticsearch功能对比

相关推荐