Druid实时大数据笔记02 -架构

一，Druid架构预览

1）实时节点 (realtime node): 实时摄入实时数据，以及生成Segment数据文件。

2) 历史节点（Historical node）: 加载已生成好的数据文件，以供数据查询。

3) 查询节点 (broker node) : 对外提供数据查询服务，并同时从实时节点与历史节点查询数据，合并后返回给调用方。

4）协调节点(Coordinator node): 负责历史节点的数据负载均衡，以及通过规则管理数据的生命周期。

Druid实时大数据笔记02 -架构

同时集群需要以下三类的依赖：

元数据库：存储Druid集群的原数据信息，以及Segment的相关信息一般用mysql 或 PostgreSQL

Druid实时大数据笔记02 -架构

备注，知识点：

1）二叉查找树

Druid实时大数据笔记02 -架构

2）二叉平衡树

Druid实时大数据笔记02 -架构

3) B+树

Druid实时大数据笔记02 -架构

B+树也是有缺点的：

Druid实时大数据笔记02 -架构

最后出现了LSM-tree,Hbase就是使用的LMS-tree:

Druid实时大数据笔记02 -架构

Druid的架构特点：

Druid实时大数据笔记02 -架构

所以Druid的架构特点带来的显著优势：

Druid实时大数据笔记02 -架构

Segment 是数据的实际屋里存储，是按时间范围去存储的，所以查询按时间查询是非常快的。

Druid实时大数据笔记02 -架构

Druid的扩展：

Druid实时大数据笔记02 -架构