关联分析

概述

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。

一般来说,关联分析可以有两种数据形式:表格格式和事务格式

关联分析(百度百科)

基本概念

一个关联规则的形式:
关联分析
其中,X称为前项,Y称为后项。

关联规则

要想生成真正有效的关联规则,主要需要解决以下两个问题。

  1. 关联规则的有效性,尽管我们生成了很多关联规则,但是这些规则并不总是有效的,我们需要一些测量指标来评价规则的有效性。
    关联分析
    关联分析
    关联分析
    关联分析
  2. 对于大型数据集,要计算可能的关联规则数量,需要大量的计算资源。因此,我们需要更加高效的算法。