大数据分析的四步过程模型

大数据这个词近些年非常火,其实在很多年前大家就开始利用大数据的一些方法和过程了。

 

大数据分析的四步过程模型

 

耳熟能详的“决策支持系统”,“应急预案系统”,“舆情监测系统”等等,早在2005年前后就如雨后春笋般冒出来了。

 

最近听了Coursera的一个关于Data Analystics的课程,其中将大数据分析的过程分成四个步骤。

 在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程

大数据分析的四步过程模型

 

而翻阅了一些相关的书籍和资料发现不论是《大数据分析》的6步过程模型,还是其他文章提到的5个阶段,归纳起来都是这四个步骤。

 

1

发现

从应用目标出发,确定所需的数据。

这里面包括定义问题,找出干系人的期望和顾虑;提出假设“可能会发生什么事情?”;收集数据并进行一些处理和分析。

 

问题的定义非常重要。

我们都知道,如果方向错了,那么做得再多不仅会事倍功半,甚至会产生负面的效果。

 

以前在做决策支持相关功能和系统的时候,发现很多时候用户描述的问题都是表象。

大部分会集中在沟通效率低,工作效率低,成本不断上升。

 

但是根本的问题到底在哪里?

这是需要我们去进行挖掘的,不能简单的把用户给你的信息当做金科玉律。

因为很多时候用户也不知道根本的问题是什么。

立场不同,角度不同,对问题的描述都会不同。

 

2

分析

对数据进行处理和建模,看看这些数据如何来支撑之前的假设。

我们经常听说的自我学习体系,也是在这个过程中建立的。

 

在《大数据分析》以及其他一些书籍中,对于这个部分会讲述的比较详细。

包括算法、建模、模型优化和分析等等。

 

3

解释

根据上一步的分析结果对过去进行解释,并对未来进行预测。

将分析结果与一些财务、运营指标进行关联,用以支撑决策。

对于下一步的行动给出建议和评价。

 

这个步骤其实挺有意思的。

要知道同一份数据,可以根据不同的目的有不同的解释。

桌子上放了半杯水,你可以说,只剩下半杯就没有了。

你也可以说,看,桌子上还有半杯水呢!

 

数据是死的,就看你怎么看,怎么用了。

所以说,不管是大数据还是小数据,对于决策都是辅助的。

真正做解释和决策的其实还是人。

 在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程

4

输出

根据解释和建议,制定详细的步骤或者路线图,并且提交给相关关系人。

对照业务目标,跟踪实施的效果。