Trie树:实现搜索引擎的搜索关键词提示功能

Trie树:实现搜索引擎的搜索关键词提示功能
快速查找某个字符串的功能。
比如,我们有6个字符串,它们分别是:how,hi,her,hello,so,see。我们希望在里面多次查找某个字符是否存在。我们可以先对这6个字符串做一下预处理,组织成Trie树的结构,之后每次查找,都是在Trie树中进行匹配查找。
Trie树的本质,就是利用字符串之间的公共前缀,将重复的前缀合并在一起。
Trie树:实现搜索引擎的搜索关键词提示功能
其中,根节点不包含任何信息。每个节点表示一个字符串中的字符,从根节点到红色节点的一条路径表示一个字符串(注意:红色节点并不都是叶子节点)。
Trie树构造的分解过程如下图所示。
Trie树:实现搜索引擎的搜索关键词提示功能
Trie树:实现搜索引擎的搜索关键词提示功能
构造过程的每一步,都相当于往Trie树中插入一个字符串。当所有字符串都插入完成之后,Trie树就构造好了。
当我们在Trie树中查找一个字符串的时候,比如查找字符串“her”,那我们将要查找的字符串分割成单个的字符h,e,r,然后从Trie树的根节点开始匹配。如下图所示,绿色的路径就是Trie树中匹配的路径。
Trie树:实现搜索引擎的搜索关键词提示功能
构建好Trie树后,在其中查找字符串的时间复杂度是O(k),k表示要查找的字符串的长度。
如果用来构建Trie树的这一组字符串中,前缀重复的情况不是很多,那Trie树这种数据结构总体上来讲是比较费内存的,属于空间换时间的解决思路。
实际上,Trie树不适合精确匹配查找,这种问题更适合用散列表或者红黑树来解决。Trie树比较适合的是查找前缀匹配的字符串。