solrcloud索引不更新--zk服务器磁盘使用100%

问题描述:

同事说solr的数据没有更新

问题分析:

1、检查solr cloud的管理后台http://IP:8983/solr/#/~cloud,查看集群情况,发现节点情况展示不出来

2、从管理后台查看下日志情况

solrcloud索引不更新--zk服务器磁盘使用100%

判断 zk出了问题

3、查下 某个zk的状态
[[email protected] conf]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Client port found: 2181. Client address: localhost.
Error contacting service. It is probably not running.

4、查看zk的日志

solrcloud索引不更新--zk服务器磁盘使用100%定位到是该IP的zk连不上的问题

5、进入该IP重启zk

solrcloud索引不更新--zk服务器磁盘使用100%

定位该服务器没有磁盘空间了

solrcloud索引不更新--zk服务器磁盘使用100%

6、查看总占用空间也不大,也就3G左右,怎么会使用100%

solrcloud索引不更新--zk服务器磁盘使用100%

7、查看实际占用情况

solrcloud索引不更新--zk服务器磁盘使用100%

8、根据网上搜索方案,可能是文件删除被占用,用lsof命令,如果没有该命令需要安装

solrcloud索引不更新--zk服务器磁盘使用100%

9、直接kill掉zk进程,再得重启,磁盘空间降下来了

solrcloud索引不更新--zk服务器磁盘使用100%

我装了4台zk(正常是3台,出于特殊原因),理论上这一台访问不了也不影响正常工作,猜测这台可能是leader节点,或者在每次同步集群文件时锁死资源