(Solr 二)配置solr的中文分词器(centos)

如果没有安装solr服务,请参考(Solr 一)搭建单机版solr服务器(centos)

solr自带的中文分词器是单字分词,效果如下:

(Solr 二)配置solr的中文分词器(centos)

在这里,为solr配置一个第三方的中文分词器,IK-analyzer

1.解压jar包   unzip IKAnalyzer2012FF_hf1.zip -d IK

(Solr 二)配置solr的中文分词器(centos)

2.将jar包,核心配置文件和停用词字典拷贝至solr服务中

(Solr 二)配置solr的中文分词器(centos)

(Solr 二)配置solr的中文分词器(centos)

3.将中文分词器配置到索引库

(Solr 二)配置solr的中文分词器(centos)

4.vim schema.xml,添加如下

(Solr 二)配置solr的中文分词器(centos)

5.配置完成,启动solr服务

(Solr 二)配置solr的中文分词器(centos)

6.页面访问

(Solr 二)配置solr的中文分词器(centos)

7.配置扩展词字典和停用词字典,改善分词效果

(Solr 二)配置solr的中文分词器(centos)

在IKAnalyzer.cfg.xml文件中配置扩展词字典和停用词字典

(Solr 二)配置solr的中文分词器(centos)

8.配置扩展词汇

例如"黄金剩女",IK分词器分词效果

(Solr 二)配置solr的中文分词器(centos)

在扩展词字典中加入剩女,在停用词字典中加入我,是

(Solr 二)配置solr的中文分词器(centos)

9.中文分词器配置完毕