1.1 什么是数据挖掘
数据挖掘是 在大型数据库中,自动地发现有用信息的过程(信息发现任务)。
数据挖掘与知识发现:
数据挖掘是知识发现KDD不可缺少的一部分。
![一 数据挖掘绪论 一 数据挖掘绪论](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzk2My9jYmNjZmZmZmE5YWE3MmY5ODQ0ZDY2MmI0ODllYzhjMy5wbmc=)
1.2 数据挖掘要解决的问题
可伸缩性(算法角度)
高维性(数据)
异种数据和复杂数据(数据)
数据的所有权与分步(分布式数据挖掘)
非传统分析(非假设检验)
1.3 数据挖掘的起源
挖掘思想和支持技术
![一 数据挖掘绪论 一 数据挖掘绪论](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzEwNi9lZTdkZDgzZDVmMmJiNGM5ZGZhNGQ5MDBmMGE5YzcwYS5wbmc=)
1.4 数据挖掘的任务
预测任务
描述任务(数据潜在关系)
![一 数据挖掘绪论 一 数据挖掘绪论](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzQ0MS82ZjVkMTdhNWM0YzU5M2VmOTlhMWVhOWJmODM1M2ZjMS5wbmc=)
预测建模:函数;预测建模任务:分类,回归
关联分析:强关联特征,蕴含规则
聚类分析:紧密相关的观测值族群
异常检测:特征显著不同