用句子找关键词

问题描述:

我正试图用两种语言来测量相似度。如果我有某种扩大的句子表达形式,我认为这会有所帮助。用句子找关键词

我们可以通过google/bing搜索得到这个扩展的表示,但是将整个句子作为关键字并不会给出好的结果,尤其是如果句子很长。所以我认为在一个句子中找到关键词并将它们用作搜索词可以改善我们的结果。

任何人都知道在一个句子中查找关键字的算法?

谢谢!

+1

我很困惑:你是在寻找**字符串相似度量还是**关键字提取算法**? – MarcoS 2011-05-18 14:05:27

+0

你是否正在寻找正则表达式? http://en.wikipedia.org/wiki/Regular_expressions – NWS 2011-05-18 15:19:50

+0

我正在寻找关键字提取算法。 – 2011-05-18 16:23:50

Lucene可以处理提取以及比较。

+0

我现在使用Lucenes StandardAnalyzer去除(英文)停用词并标记句子。然后,我从令牌列表中提取名词并将它们用作搜索查询。 – 2011-05-19 11:29:43

+0

@genesiss很高兴我可以帮助:) – kostja 2011-05-19 11:45:45