数据驱动的复杂系统分析-4 对大数据的一些见解

对大数据的一些见解

数据驱动的复杂系统分析-4 对大数据的一些见解
velocity:高速性可以理解为数据时时刻刻都在更新。
value:大数据的价值密度很低,很多都难以提炼出来。

老师认为:抽样是统计学中最核心的概念。
大数定律和中心极限定理是统计学的基础。

大数据的思维方式
(这三种思维方式并不是大数据所独有的;而且是不严谨的、武断的)

  • N=ALL
    有了大数据之后不需要抽样了,直接看总体就可以了
    (但现实数据是有系统偏差的,需要找到并进行纠正。大数据通常得到的是一个大量但是有偏的估计。)

  • 关联而非因果
    不关心这两件事为什么连着出现,而只关心他们之间的关联性。
    (老师认为这种想法是反智的)

  • 不依赖先验知识
    (做实证研究是由思维构建——证据)
    而大数据认为有很多数据,所以不需要先验知识。eg.路灯下找钥匙数据驱动的复杂系统分析-4 对大数据的一些见解

    大数据的意义在于:
    大数据在客观上促进了数据的推动,虽然没有挖到金子,但是推动了别的东西的发展。