solr下配置安装中文分词器和批量导入数据

相关软件：链接：http://pan.baidu.com/s/1qYqMrzI 密码：zib7

1.配置中文分析器

1）Schema.xml

schema.xml，在SolrCore的conf目录下，它是Solr数据表配置文件，它定义了加入索引的数据的数据类型的。主要包括FieldTypes、Fields和其他的一些缺省设置。

2）安装中文分词器
使用IKAnalyzer中文分析器。

第一步：把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下。
第二步：复制IKAnalyzer的配置文件和自定义词典和停用词词典到solr的classpath下。
即在solr/WEB-INF/创建classes文件夹，把内容放入。
第三步：在schema.xml中添加一个自定义的fieldType，使用中文分析器。

<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

第四步：定义field，指定field的type属性为text_ik

<field name="title_ik" type="text_ik" indexed="true" stored="true" />
<field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

第五步：重启tomcat

测试：

2.批量导入数据
使用dataimport插件批量导入数据。
第一步：把dataimport插件依赖的jar包添加到solrcore（collection1\lib）中

solr下配置安装中文分词器和批量导入数据

还需要mysql的数据库驱动。
第二步：配置solrconfig.xml文件，添加一个requestHandler。

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>

第三步：创建一个data-config.xml，保存到collection1\conf\目录下

<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/lucene"
user="root"
password="root"/>
<document>
<entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products ">
<field column="pid" name="id"/>
<field column="name" name="product_name"/>
<field column="catalog_name" name="product_catalog_name"/>
<field column="price" name="product_price"/>
<field column="description" name="product_description"/>
<field column="picture" name="product_picture"/>
</entity>
</document>
</dataConfig>

第四步：重启tomcat

solr下配置安装中文分词器和批量导入数据

第五步：点击“execute”按钮导入数据

solr下配置安装中文分词器和批量导入数据

相关推荐