1.2数据挖掘流程分析及应用软件
一、挖掘过程分析
知识发现(KDD)是从数据中发现有用知识的整个过程
个过程定义:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的。
知识发现主要步骤(如图1.3):
1)数据清洗:清除数据噪声和无关数据
2)数据集成:将来自多数据源中的数据集合到一起
3)数据转换:将数据转换为易于进行数据挖掘的数据存储形式
4)数据挖掘:利用智能方法挖掘数据模式或规律知识
5)模式评估:根据一定评估标准从挖掘结果中筛选出有意义的知识
6)知识表示:利用可视化和知识表达的技术,向用户展示所挖掘的相关知识
数据挖掘过程步骤(如图1.4):
1)数据收集
2)知识提取
3)知识辅助决策
二、相关应用软件
商用软件:SPSS Clementine、SAS Enterprise Mining、Oracle DM、IBM Intelligent Miner、Microsoft SQL2005 Data Mining、MATLAB、XLMiner
开源软件:Weka、RapidMiner、ARMiner
——感谢广州市智宇科技有限责任公司提供知识分享