数据挖掘学习笔记(一)
由于疫情原因我们学校开展了网课教学,总溜号,课下补回来叭。
第六章前半部
-
关联规则
支持度:牛奶和面包“同时”购买的事物。占所有事物的2%
置信度:在所有购买牛奶的事物中,购买面包的占比60% -
频繁项集
关联规则的挖掘过程
找出所有的频繁项集→产生强关联规则。
有趣的关联规则(强规则):设定支持度和 置信度的最小阈值。 -
频繁项集发现的算法–Apriori算法(先验算法)
应用范畴:布尔型关联规则。
集合的反单调性:若一个集合不能通过测试,则它所有的超集都不能通过测试。超集概念
先验性质:某项集不是频繁得→其所有超集都不是频繁的
某项集是频繁的→其所有非空项集一定是频繁的 -
生成强规则
若满足,则输出一个强规则:s→(l-s)。