数据挖掘学习笔记

数据挖掘是从大量数据中挖掘有趣模式和知识的过程。

数据的最基本形式是数据库数据、数据仓库数据、事务数据。

数据挖掘功能:1、特征化与区分。2、频繁模式。3、关联和相关性挖掘。4、分类与回归。5、聚类分析。6、离群点分析。

数据挖掘任务:描述性、预测性。

buys(X,"computer")=>buys(X,"software")[support=1%,confidence=50%]

其中:X为变量,代表顾客,support支持度,表示所有事务的1%显示计算机与软件一起被购买,confidence置信度,表示若一位顾客买了电脑,则购买软件的可能性是50%。

数据挖掘使用的技术

 数据挖掘学习笔记