Druid实时大数据笔记02 -架构
一,Druid架构预览
1)实时节点 (realtime node): 实时摄入实时数据,以及生成Segment数据文件。
2) 历史节点(Historical node): 加载已生成好的数据文件,以供数据查询。
3) 查询节点 (broker node) : 对外提供数据查询服务,并同时从实时节点与历史节点查询数据,合并后返回给调用方。
4)协调节点(Coordinator node): 负责历史节点的数据负载均衡,以及通过规则管理数据的生命周期。
同时集群需要以下三类的依赖:
元数据库:存储Druid集群的原数据信息,以及Segment的相关信息 一般用mysql 或 PostgreSQL
备注,知识点:
1) 二叉查找树
2)二叉平衡树
3) B+树
B+树也是有缺点的:
最后出现了LSM-tree,Hbase就是使用的LMS-tree:
Druid的架构特点:
所以Druid的架构特点带来的显著优势:
Segment 是数据的实际屋里存储,是按时间范围去存储的,所以查询按时间查询是非常快的。
Druid的扩展: