概述
关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。
一般来说,关联分析可以有两种数据形式:表格格式和事务格式
关联分析(百度百科)
基本概念
一个关联规则的形式:
其中,X称为前项,Y称为后项。
关联规则
要想生成真正有效的关联规则,主要需要解决以下两个问题。
- 关联规则的有效性,尽管我们生成了很多关联规则,但是这些规则并不总是有效的,我们需要一些测量指标来评价规则的有效性。
- 对于大型数据集,要计算可能的关联规则数量,需要大量的计算资源。因此,我们需要更加高效的算法。