漫谈大数据




中国最了解百姓消费习惯的,并不是什么机构或是什么协会,而是淘宝京东;

中国最了解百姓个人信用信息的,并不是什么银行,而是支付宝。

今天我们能看到,许多企业,都在争先恐后进行大数据的布局,为什么大家都有对数据的需求呢?我阅读了《大数据时代》这本书,今天我来与您分享一下我的读书笔记以及我对大数据的思考。




—— 大数据是什么? ——


首先,我们必须来认识认识大数据,它究竟是什么?其实很容易就能从字面上理解,就是大量、海量的数据。那么它为什么会出现呢?现在我们一起来想想,在过去,我们都用什么东西来存储数据呢?在计算机还没出现之前,我们是用纸。后来,我们有了光盘、软盘,随着科技的发展,我们又有了硬盘、SD卡等介质,它们的容量也在不断的上升。过去的人,能下载一两首音乐,就已经十分满足了,而今天我们的MP3、手机、电脑随随便便就能存储几G的音乐。随着科技的发展,你看,我们对数据存储的容量越来越大了,这是其中一点。另外一点,我们都发现,无论是手机还是计算机,它们的运算速度都越来越快了。人类存储信息量的增长速度比世界经济的增长速度还要快上4倍,而计算机数据处理能力的增长速度则比世界经济的增长快了9倍。所以,大数据其实是计算机存储能力和运算能力发展到一定程度的必然产物。


漫谈大数据


美国在1880年进行人口普查的时候,花了8年左右的时间,而1890年,预计要花13年的时间来汇总数据。你想想,当他们汇总这些数据的时候,都已经过了这么多年,数据还有准确性吗?当他们被数据淹没的时候,已有的数据处理工具已经难以应付了。


 使用抽样调查的方法来做某种统计工作,例如说统计一个地区对某某事件是支持还是不支持,我们并不会说去挨家挨户找人问,而是随机抽取其中的一部分人来问。然后根据这些人的回答,来对整体进行估计、推断。但是,在随机抽取的过程中,是存在偶然性的。例如说在美国做一个调查选民的意愿的调查,如果你抽取的10个选民的意愿都是同样的,那么是不是就表明选民的意愿是100%了呢?


在过去,我们没办法存储大量的数据,所以我们只能挑出那些比较重要的数据,然后舍弃掉那些看起来并不是很重要的数据。即使不舍弃掉这些数据,我们也没办法利用它们创造出价值,因为我们并没有对大量数据进行分析、运算的能力。而如今,我们已经具备了这些能力,我们已经有能力挖掘出数据的真正价值,所以我们的思维也要跟着改变了。量变引起质变,拥有海量的数据时,我们就能从不同的角度,更细致的观察,并且研究某个问题的方方面面。


漫谈大数据

有一点我们需要清楚,拥有了大量的数据或是所有的数据,并不是说这些数据就是绝对精确的,我们容许有一些数据是错误的,允许一小部分数据的不精确,这些少量的数据并不会对整体。我们可以用大数据来观察趋势,预测某件事的概率,用概率说话。

读完以上的内容,你或许已经知道什么是大数据,以及,大数据对我们的思维进行了怎样的颠覆。小生写这篇文章,主要目的并不是科普大数据,如果大家想了解更多,可以阅读相关的书籍。接下来我们来看看,大数据都是怎样被利用的。





—— 大数据有什么应用? ——



 数据无处不在,我们本身也是可以被分成许多不同数据的,兴趣爱好、社交状态、身体状况、收入状况等等,我们本身就是多种数据的集合。在大数据时代,大数据甚至比你还要了解你自己,你的行为,都可以被量化成数据。


 大数据的应用很广。例如说有些商家会根据你的消费行为,来推断你的兴趣爱好,给你推荐产品。在医疗方面,会根据你的医疗信息,来推测你的身体状况,给你推荐一些健康建议或是医疗产品。亚马逊就是这样,他们从每一个客户上获取大量的数据,例如说,用户都买了些什么书,哪些书他们只浏览了但是没有买,浏览了多久呢。然后,亚马逊就可以通过这些信息,给其他类似的客户推荐相关的书籍。现在这种模式,不只有亚马逊在进行了,在淘宝、当当上我们都能找到影子。


漫谈大数据


在之前的两会,百度李彦宏就提出,要使用大数据来解决儿童走失的问题,利用大量的人脸识别,提升图像侦查效率,尽早锁定失踪儿童或涉案人员。大量的人脸识别能够实现海量人脸数据的跨年龄比对,帮助侦破儿童走失积案。第二点,他还提出,要建设只能交通信号灯,这个其实在之前就有人提出来了,通过大数据,来分析每个红绿灯路口的每个时间段的通行数据,根据这些来改变红绿灯的时长,解决交通拥堵的问题。





—— 大数据=新土壤、新石油 ——


当一种优势,大家都有了,那就不是优势了。当时互联网刚出来的时候,谁先融入互联网,拥抱互联网,谁就拥有优势。现在我们看互联网已经成为了一种基础设施,大家都有了,那就不是优势了。所以,现在商家们都纷纷瞄准了下一个目标——数据。谁先掌握大量的数据,谁就更有优势了,一家拥有用户大量消费数据的企业,和一家没有用户数据的企业,谁更有优势呢?拥有用户大量消费数据的企业,可以智能的给用户推荐商品,用户会更喜欢那些了解他们需求的产品。


在我们的脑海中,我们总认为阿里巴巴是一家做电子商务的企业。但换个角度来说,其实阿里巴巴,已经是一家大数据企业了。就像我开头说,它拥有大量用户的消费信息、信用信息。


今天我还看了一篇特别有意思的文章,文章是有关于共享单车的博弈,为什么马云、马化腾都要来争这一块钱的生意呢?其中一个盈利点,就是超级大数据。你看腾讯选择摩拜,可针对单车内的精细化GPS数据,结合腾讯地图做深度挖掘啊。这背后还有海量的出行数据,都可以利用从而创造巨大价值的。


漫谈大数据


过去,我们能看到许多企业都在围绕入口进行竞争,而今天,我们能到许许多多的企业,都在布局大数据,制定并实行自己的大数据战略。也有很多企业,开始向大数据企业转型。数据已经成为互联网商业竞争的石油资源,谁先占用它们,谁就有更大的优势。


2016年1月19日,罗辑思惟正式在天猫开店。罗振宇在跨年演讲上表示,“数据是土壤,下一代生意都在数据的基础上生长起来。开天猫店不是为了做多大的生意,而是如饥似渴的需要数据,需要跟最早进的基础设施在一块儿。”


你看,大数据即使新石油资源,同时也是未来商业的土壤啊。


  关于  

    各位小伙伴们,我是云都小生,一名正在摸石头过河的青年。为什么这么说呢?因为我跟卢梭差不多,都是在探索一条属于自己的生路。如果你仔细观察,你会发现,其实我们生来都是一团泥,我们能被捏成什么样,大多数时候都不是我们自己决定,而是许多双看不见的手在改变我们的模样。我刚好是一个不喜欢约束的人,又发现没有一条路是我喜欢的,所以我就自己开辟一条路、


    有许多的阳关大道,你会发现,人潮汹涌,好多人挤得头破血流还想往里面走。在这个时候,经常都只有极少数人能走到对岸。我个人最喜欢的方式,也是我觉得最适合的方式,就是种树、然后砍树,做一条属于自己的独木桥,通往属于自己的诗和远方。


    感谢您的支持与关注,我还会持续为大家服务,持续帮助大家进行自我升级,让我们一同成长。扫描二维码,关注我哦~


    

漫谈大数据