Weka机器学习-06-关联

关联规则反映了一个对象与其他对象之间的相互依赖关系,如果多个对象之间存在一定的关联关系,那么,其中一个对象就能够通过其他对象进行预测。
关联规则通常需要根据覆盖率和准确率进行修剪。覆盖率也称为支持度,支持度计数是应用规则后预测正确的实例的数量,支持度是支持度计数与实例总数的比值。准确率也成为置信度,表示支持度计数与应用规则的实例数量的比值。
由于仅对高覆盖量的关联规则感兴趣,因此关联只寻找能够达到预定的最小覆盖量的属性值对组合,这些组合称为项集,其中的人一个属性值对称为一个项。
Weka使用Associate(关联)标签页来处理关联问题。
Weka机器学习-06-关联
(1)Apriori关联规则
运行结果:
Weka机器学习-06-关联
对于天气数据集,利用Apriori关联规则,输出结果为10条规则
规则采用“前件num.1==>结论num.2”的形式表示,前件后面的数字表示有多少个实例满足前件,结论后面的数字表示有多少个实例满足整个规则,这就是规则的支持度。
因为在所有10个规则中,这两个数相等,所有每个规则的置信度都正好是1.
Weka机器学习-06-关联
这部分表示,算法的最小置信度为0.9,这是默认值,在输出中已经显示未Minimum metric:0.9。输出中还显示Number of cycles performed(执行的次数)为17,该值表明Apriori算法实际运行17次以产生这些规则。Minimum support(最小支持度),所生成的输出值为0.15(对应于0.15*14=2实例)