【搜索技术 倒排索引】倒排索引例子介绍
为什么搜索引擎的查询速度这么快? 说明白了很简单,核心技术就是 “倒排索引”。
“倒排索引”这个名词很唬人,其实原理很简单。
假设有3篇文章,file1,file2,file3,文件内容如下:
file1 (单词1,单词2,单词3,单词4….)
file2 (单词a,单词b,单词c,单词d….)
file3 (单词1,单词a,单词3,单词d….)
建立的倒排索引就是这个样子:
单词1 (file1,file3)
单词2 (file1)
单词3 (file1,file3)
单词a (file2, file3)
这就是倒排索引,很简单吧。
其中,倒排索引技术在当前大多数的信息检索系统中得到了广泛的应用,它对于关键词的搜索非常有效,在Lucene中也是使用的这种技术。
由item查询key的过程,是倒排索引。
举例: