Apache Kylin 概念

Kylin对比

Hive的性能比较慢,支持SQL灵活查询,特别慢
HBase的性能快,原生不支持SQL
Phoenix:可以写sql语句来查询hbase!!
Kylin是将先将数据进行预处理,将预处理的结果放在HBase中。查询效率很高

Kylin应用场景

  • 用户数据存在于Hadoop HDFS中,利用Hive将HDFS文件数据以关系数据方式存取,数据量巨大,在500G以上
  • 每天有数G甚至数十G的数据增量导入
  • 有10个以内较为固定的分析维度
  • Kylin 的核心思想是利用空间换时间,在数据 ETL 导入 OLAP 引擎时提前计算各维度的聚合结果并持久化保存

Kylin优点

Kylin 是一个 Hadoop 生态圈下的 MOLAP 系统,是 ebay 大数据部门从2014 年开始研发的支持 TB 到 PB 级别数据量的分布式 Olap 分析引擎。其特点包括:

  • 可扩展的超快的 OLAP 引擎
  • 提供 ANSI-SQL 接口
  • 交互式查询能力
  • MOLAP Cube 的概念
  • 与 BI 工具可无缝整合

Kylin总体架构

Kylin 依赖于 Hadoop、Hive、Zookeeper 和 Hbase。
Apache Kylin 概念