数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案

第六章答案


该答案为重庆大学计算机学院Jack Channy所作,由于本人水平有限,难免有错误和不当之处,如有意见请评论或者发邮件至[email protected]
6.1 假设有数据集D上所有闭频繁项集C,以及每个闭频繁项集的支持度计数。给出一个算法,确定给定的项集是否频繁,如果频繁的话,给出X的支持度。
对于该题目的解答,本文给出算法流程图,如下图所示。

数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案

6.3 Aprior算法使用子集支持度性质的先验知识
(a).证明频繁项集的所有非空子集也一定是频繁的。

数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案

(b).证明项集s的任意非空子集s的支持度至少与s的支持度一样大。

数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案

(c).给定频繁项集ll的子集s,证明规则s=>l(s)的置信度不可能大于s=>l(s)的置信度。其中,ss的子集。

数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案

(d).Aprior算法的一种变形将事务数据库D中的事务划分成n个不重叠的分区。证明在D中频繁的项集至少在D的一个分区中是频繁的。

数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案
还会更新的……