solr集群结构图解析

最近做一个练手项目,里面要搭建一个solr集群,在文档里面看到一张集群架构图不错分享大家
这图其实有很多博客上都有,只不过他们的解析是在看不懂,所以就写一个博客,来谈谈我个人对这张图的理解:

solr集群结构图解析
自己对此图的理解:

把这张图分为两块,一块是可以用肉眼看到的物理结果,一个是看不到的逻辑结构。

物理:一个solr集群由三个服务器(tomcat)组成,每台服务器上都有两个(可多个)core(一个独立的索引库),每个core之间数据不一定相同,互相独立。

逻辑:把所有的数据放到一个索引库中,collection代表一个完整索引库,它包含了所有的数据,然后将collection分为两份,即分片,每个分片都存放collection的数据,但每个分片的数据都不相同,所有分片加起来是一个collection,然后将分片的所有数据放到三个站点上去(每个站点数据一样,高可用),站点中有一个是主站点,其他是副站点(主站点挂了,副站点接替主站点工作),然后每个站点就可以对应物理结构上的core,也就是说每个站点都部署到不同服务器上去

这样做的好处:
解决高并发(以上图为例,三台服务器呐,来个负载均衡。。。),高可用(三台服务器呐,一台挂了,还有其他的),易扩展(容量不够,再加个分片)