数据驱动的复杂系统分析-4 对大数据的一些见解
对大数据的一些见解
velocity:高速性可以理解为数据时时刻刻都在更新。
value:大数据的价值密度很低,很多都难以提炼出来。
老师认为:抽样是统计学中最核心的概念。
大数定律和中心极限定理是统计学的基础。
大数据的思维方式
(这三种思维方式并不是大数据所独有的;而且是不严谨的、武断的)
-
N=ALL
有了大数据之后不需要抽样了,直接看总体就可以了
(但现实数据是有系统偏差的,需要找到并进行纠正。大数据通常得到的是一个大量但是有偏的估计。) -
关联而非因果
不关心这两件事为什么连着出现,而只关心他们之间的关联性。
(老师认为这种想法是反智的) -
不依赖先验知识
(做实证研究是由思维构建——证据)
而大数据认为有很多数据,所以不需要先验知识。eg.路灯下找钥匙大数据的意义在于:
大数据在客观上促进了数据的推动,虽然没有挖到金子,但是推动了别的东西的发展。