数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

数据挖掘实践

本次跟随Datawhale组织的数据挖掘实践组队学习,希望能有所收获。Datawhale是一个很好的开源组织,会组织很多优质、开源的系列学习。

附上本次组队学习的计划和教程资料以及比赛地址,即使没有当时加入组队学习,有兴趣的话从现在开始学习也不晚哦~

现在学习喜欢用脑图的方式,知识点清晰明了,易于查找和复习,希望也可以帮助大家梳理知识脉络,同时欢迎补充。

强烈建议PPT与jupyter结合一起看,否则可能会对分析有点不明所以。

Task01:数据探索与分析

大致做了一下脑图,只能说有一点用吧。。。
数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

一、赛题介绍

挑一些ppt上的重点。。。

1、赛题背景介绍

数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

2、赛题任务和评估指标

数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

3、赛题方案解析

数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

二、数据探索与分析

1、数据探索和准备步骤

1.1 时间序列图

数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

1.2 数据分布可视化
  • 直方图
  • 密度曲线图
  • 箱型图
    数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
  • 小提琴图
    数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
1.3 变量相关性分析和独立性分析
  • 相关性分析
    数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
  • 独立性分析/检验
    数据挖掘实践(资金流入流出预测)Task01:数据探索与分析
    数据挖掘实践(资金流入流出预测)Task01:数据探索与分析

2、资金流入流出预测的数据探索

内容有点多,不再展示,建议PPT与jupyter结合一起看,否则会对分析有点不明所以。