数据分析 流程

数据分析 流程
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程,可帮助人们作出判断,以便采取适当行动。
流程划分:
数据分析 流程
一、
确定分析的问题是什么?你想得出哪些结论?梳理分析思路,把分析目的分解成若干个不同的分析要点,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标常需搭配使用)。
二、

  • 公司数据库业务数据
  • 第三方机构数据集
  • 权威统计部门官网
  • 网络爬虫等

三、

  • 重复值处理:从数据集剔除;添加字段统计出现次数
  • 缺失值处理:从数据集中剔除;采用中位数、众数、均值填充;用贝叶斯估计、极大似然的方法估计等方法估测。
  • 异常数据:箱线图或散点图查看,从数据集中剔除或者备份
  • 规范化数据格式:对于数据源中时间、数值、字符等数据
  • 验证数据正确性:与事实不符的数据,逻辑错误等
  • 数据抽样分层、拆分/组合数据、简单计算等

四、
数据分析法指具体的分析方法,例如常使用的对比分析、交叉分析、相关分析、回归分析、聚类分析等。常用的营销理论模型有4P、用户使用行为、STP理论、SWOT等,而管理理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。

五、
可视化设计就是要做到让数据说话。说客户关注的信息,说令客户印象深刻的话。

  • 明确数据可视化的目的:要呈现的是什么样的数据、这些数据是被谁使用的、需要起到什么样的作用和效果、想要看到什么样的结果。
  • 注重数据的比较:想要数据反映出问题,就必须要有所比较,可以看到问题所在。
  • 建立数据指标:建立数据指标才会有对比性,才知道对比的标准在哪里,也可更好地知道问题所在。
  • 定义用户体验:数据可视化结果所面对的读者不是数据分析师,很可能是对数据分析技术一窍不通的人,将复杂的数据进行简化、将零散的信息变得易于理解、提供更加人性化的信息是数据可视化的目标。
  • 色彩的选取

忌整个页面都是图,虽然页面很漂亮。但看的人很费力、需要思考。
忌整个页面都是表,表可以有很明显的对比,但表格在表现趋势方面比较弱。
忌整个页面都是字,页面密密麻麻让人反感,需要大量思考获得信息。