Solr搜索引擎详细搭建过程
1.什么是solr
Solr 是一个开源搜索平台,用于构建搜索应用程序。 它建立在 Lucene(全文搜索引擎)之上。 Solr 是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。
Solr 是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。
2.Solr安装
solr下载地址:http://archive.apache.org/dist/lucene/solr
tomcat下载地址:https://archive.apache.org/dist/tomcat
- 安装 Tomcat,直接解压即可(为了区分:名称apache-tomcat-7.0.52改为apache-tomcat-solr)
- 解压solr
- 将solr中 dist 目录下的 solr-4.10.3.war 部署到 apache-tomcat-solr\webapps 下(去掉版本号:便于后期好操作)。
- 启动 Tomcat 解压缩 war 包(双击apache-tomcat-solr目录下bin中的startup.bat)
- 将solr下example/lib/ext目录下的所有的 jar 包,添加到 solr 的工程中(\WEB-INF\lib目录下)。
- 创建一个 solrhome 。solr 下的/example/solr 目录就是一个 solrhome。复制此目录到 E:\develop\solr 改名为 solrhome
- 关联 solr 及 solrhome。需要修改 solr 工程\webapps\solr\WEB-INF下的 web.xml 文件。
- 启动 Tomcat(双击apache-tomcat-solr目录下bin中的startup.bat),并校验是否搭建成功
- 浏览器地址栏输入:http://localhost:8080/solr
3.中文分词器
下载地址:https://www.lanzous.com/i7wkwpg
未分词查询:
IK Analyzer 配置:
- 把 IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下
- 创建 WEB-INF/classes 文件夹把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。
- mydict中添加分词词语
- 修改 solrhome 目录中collection1\conf中的schema.xml 文件,配置一个 FieldType,使用用 IKAnalyzer
- 重启solr工程,测试带分词的搜索
整个工程目录: