在Apache Solr中搜索书籍

在Apache Solr中搜索书籍

问题描述:

我对Solr很新,我正在评估它。我的任务是在一本书的语料库中查找单词,并在小范围内将它们返回。到目前为止,我将书籍存储在按段落分割的数据库中(我通过换行符对书籍进行切片),然后执行全文搜索并返回该行。在Apache Solr中搜索书籍

在Solr中,我需要做同样的事情,还是可以添加整本书(采用.txt格式),并且每当找到匹配项时,都会返回类似于匹配的内容加上前100个单词和后100个单词类似的东西?谢谢

突出显示将做你的出价。 http://wiki.apache.org/solr/HighlightingParameters

以下是相关选项供您:

hl.snippets 

The maximum number of highlighted snippets to generate per field..... 

hl.fragsize 

The size, in characters, of the snippets (aka fragments) created by the highlighter..... 
The default value is "100". 

hl.mergeContiguous 

Collapse contiguous fragments into a single fragment.... 

对于你的描述,将其设置为返回5(或任何人可以三立处理)从text场片段与hl.fl;每个片段的长度在单词/短语周围400个字符(我近似为100个单词)。

另请参阅hl.regex.slop用于构建短语周围的片段和hl.simple.pre/hl.simple.post用于标记。