使用Solr的语义分析

问题描述:

我正在考虑将语义分析添加到我的Solr安装中,但我不知道从哪里开始。使用Solr的语义分析

基本上,我希望Solr能够找到“相似”的单词(取自索引文档的正文)。例如,如果我搜索“音乐”,我应该能够查询语义引擎并获得“摇滚”,“流行”等等(当然,如果这些词在某些索引文档中出现在音乐附近) 。

我发现这个项目,但我不知道这是否是开始正确的位置: http://code.google.com/p/semanticvectors/

您可以使用Lucene Wordnet contrib package寻找同义词。

Optimizing Findability in Lucene and Solr给出了其他方法来扩展查询。

语义索引是一个很好的开始。然而,根据我的经验,这些技术在实践中并不适用。你经常会得到非常奇怪的结果。此外,由于Google的缘故,人们对关键字搜索应如何运作有一定的期待 - 即您的搜索字词应出现在匹配的文档中。