solr和IK中文分词器的简介

一.solr是什么?
Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。
二.solr的安装
1:安装 Tomcat,解压缩即可。
2:解压 solr。
3:把 solr 下的dist目录solr-4.10.3.war部署到 Tomcat\webapps下(去掉版本号)。
4:启动 Tomcat解压缩 war 包
5:把solr下example/lib/ext 目录下的所有的 jar 包,添加到 solr 的工程中(\WEB-INF\lib目录下)。
6:创建一个 solrhome 。solr 下的/example/solr 目录就是一个 solrhome。复制此目录到D盘改名为solrhome
7:关联 solr 及 solrhome。需要修改 solr 工程的 web.xml 文件。

solr/home
solrhome的位置
java.lang.String

8:启动 Tomcat
http://IP:8080/solr/
solr和IK中文分词器的简介这是solr的界面,显示这个solr就已经安装完了
三.中文分析器IK Analyzer是什么?
K Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。
四.IK的配置
1、把IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下
2、创建WEB-INF/classes文件夹 把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。
3、修改 Solrhome 的 schema.xml 文件,配置一个 FieldType,使用 IKAnalyzer

solr和IK中文分词器的简介这是在solr里插入IK的配置

五.
域相当于数据库的表字段,用户存放数据,因此用户根据业务需要去定义相关的Field(域),一般来说,每一种对应着一种数据,用户对同一种数据进行相同的操作。
域的常用属性:
1.name:指定域的名称
2.type:指定域的类型
3.indexed:是否索引
4.stored:是否存储
5.required:是否必须
6.multiValued:是否多值
域一般分为三种,动态域,普通域,复制域
都是在schema.xml文件中进行配置你所需要的分词
动态域格式:
solr和IK中文分词器的简介
普通域格式:
solr和IK中文分词器的简介
复制域格式:
solr和IK中文分词器的简介
solr和IK中文分词器的简介这样配置就完成了