私记
数据分析是一个探索、展示、理解的交互过程。也就是说这三个方面是交叉进行的,无所谓先后,接触数据的那一刻便开始了,随着过程的深入,三者相得益彰,促使你获得更加清晰的洞察。
典型的数据分析全流程流水:
(1)获取数据(从各种数据源将数据导入程序);
(2)整理数据(编码缺失值、修复或删除错误数据、将变量转换成更方便的格式);
(3)注释数据(以记住每段数据的含义);
(4)总结数据(通过描述性统计量了解数据的概况);
(5)数据可视化(一图胜千言);
(6)数据建模(解释数据间的关系,检验假设);
(7)整理结果(创建具有出版水平的表格和图形)
典型的数据分析循环操作步骤:
注意:不能做出预测的分析不是一个好的分析