Apriori算法

Apriori算法介绍

Apriori算法是挖掘布尔关联规则频繁项集的算法,它采用逐层搜索策略(层次搜索策略)产生所有的频繁项集。

Apriori算法利用的是Apriori性质:频繁项集的所有非空子集也必须是频繁的。
Apriori算法 模式不可能比A更频繁的出现
Apriori算法是反单调的,即一个集合如果不能通过测试,则该集合的所有超集也不能通过相同的测试。
Apriori性质通过减少搜索空间,来提高频繁项集逐层产生的效率

Apriori算法利用频繁项集性质的先验知识(prior knowledge),通过逐层搜索的迭代方法,即将k-项集用于探察(k+1)-项集,来穷尽数据集中的所有频繁项集。
例:先找到频繁1-项集集合L1,然后用L1找到频繁2-项集集合L2,接着用L2找L3,直到找不到频繁k-项集,找每个Lk需要一次数据库扫描

Apriori算法步骤

Apriori算法由连接和剪枝两个步骤组成。
Apriori算法

Apriori算法

上述算法需要解决以下问题:
Apriori算法
Apriori算法
Apriori算法
Apriori算法
Apriori算法

由频繁项集产生关联规则

Apriori算法
Apriori算法
Apriori算法