数据挖掘学习笔记(一)

由于疫情原因我们学校开展了网课教学,总溜号,课下补回来叭。
第六章前半部

  1. 关联规则
    数据挖掘学习笔记(一)
    支持度:牛奶和面包“同时”购买的事物。占所有事物的2%
    置信度:在所有购买牛奶的事物中,购买面包的占比60%
    数据挖掘学习笔记(一)
    数据挖掘学习笔记(一)

  2. 频繁项集
    数据挖掘学习笔记(一)
    关联规则的挖掘过程
    找出所有的频繁项集→产生强关联规则。
    有趣的关联规则(强规则):设定支持度和 置信度的最小阈值。

  3. 频繁项集发现的算法–Apriori算法(先验算法)
    应用范畴:布尔型关联规则。
    集合的反单调性:若一个集合不能通过测试,则它所有的超集都不能通过测试。超集概念
    先验性质:某项集不是频繁得→其所有超集都不是频繁的
    某项集是频繁的→其所有非空项集一定是频繁的
    数据挖掘学习笔记(一)

  4. 生成强规则
    数据挖掘学习笔记(一)
    数据挖掘学习笔记(一)
    若满足,则输出一个强规则:s→(l-s)。