ElasticSearch20:document内部查询原理图解

1.查询请求的原理

1)首先客户端选择任意一个节点,发送请求get document id=1,P1

2)发送到node1上时,node1就是协调节点(coordinate node),coordinate node对document进行路由,路由之后,就知道在哪个primary shard上面了。

3)前面的过程和增删改是一样的,后面有点不同了。coordinate node知道在哪个primary shard上面后,不一定直接发送到对应的primary shard上,也可以发送到replica shard上。

4)coordinate node采取round-robin随机轮训算法,日不说coordinate node,接收到了对一个document的4次查询后,就会使用算法,将2次查询请求转发给P1,将2次请求转发给R1,尽量让primary shard和所有的replica shard均匀的服务读请求,得到负载均衡的效果。

ElasticSearch20:document内部查询原理图解

最后,coordinate node将查询到的结果数据返回给客户端。

但是如果P1新建好数据,R1正在建立索引,那么此时发送请求时,如果coordinate node节点将请求转发到了replica shard上时,这个时候就会返回找不到数据。

当建立索引完成后,primary shard和replica shard上数据就齐全了。