关联规则挖掘算法-Apriori算法

Apriori算法:

Apriori算法命名源于算法使用了频繁项集性质的先验(Prior)知识。
Apriori算法将发现关联规则的过程分为两个步骤:通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;利用频繁项集构造出满足用户最小信任度的规则。
挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。

Apriori的性质:

性质1:频繁项集的所有非空子集必为频繁项集。
性质2:非频繁项集的超集一定是非频繁的。

算法流程:

关联规则挖掘算法-Apriori算法

下面介绍一下此算法具体实例:

关联规则挖掘算法-Apriori算法

在这里求得到的支持度,例如在k=1时,{A}的支持度就是出现A的交易号比上总的交易号:2/4=50%,其他的按照此种方法求得支持度。

关联规则挖掘算法-Apriori算法

关联规则挖掘算法-Apriori算法