FP-growth算法

FP-growth算法简介及特点

这个算法只进行2次数据库扫描。
它不使用侯选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。
算法的最大特点是不需要产生候选项集,大大提高了挖掘效率。

FP-growth算法的基本思路

FP-growth算法

FP树构造

FP-growth算法

为了方便遍历FP树,为FP树创建一个项头表,项头表中每一行表示一个1-频繁项,并有一个指针指向它在FP树中的结点。
 FP树中所有相同频繁项的结点通过指针连成一个链表。
 从FP树可以看出,包含某个1-频繁项的所有可能的频繁项集可以通过这个链表搜索到。

实例

FP-growth算法
FP-growth算法
FP-growth算法
FP-growth算法
FP-growth算法
FP-growth算法