大数据的疑虑
据说我们已进入大数据时代。但是,现实中人,又有几个真能理解这个大数据意味着什么?前几天和一位已过耳顺之年的历史学家聊天,他不无忧虑地对我说,不出五十年,可能三十年吧,我们现在所使用的研究历史的通常方法,因为大数据的缘故,会变得完全无效,不仅历史学,包括人文学科各个方面的研究,都因为大数据而面临着重大挑战。我听着,觉得有点危言耸听,于是问,此话怎讲?历史学家说,研究上世纪六、七十年代的历史,可以通过收集当年书信、日记、草稿、文件等,然后分门别类,统计的统计,归纳的归纳,证伪的证伪,以图还原其中的真实。可是,再过半个世纪,那时的人们要来研究今天的日常状况,他们上哪里去寻找书写性的文字?要想研究,就只能到数据库去检索,整理海量的信息,通过特定的编程,让信息按研究需求而呈现自身。首先要懂编程,其次要理解信息排列的特征,否则,大数据不能使用,又何来研究?只是,这样一来,还叫历史研究吗?
我听了无语。想来也是,今天除了年长者偶尔还写字寄信外,年轻一辈,有谁会用传统方式联系?玩手机成迷,脸贴在屏幕上,形影不离。光看那样子,就知道每个人每天不知要发多少电子信息。众人集合起来,组成偌大的社会,其中信息量之大,让人惊异。后来者面对这样的信息,还能像传统那样去“阅读”吗?恐怕真的只能通过编程去**信息,从而让历史也跟着重新活起来。大数据干掉传统之研究方法,看来并不虚无,而是一件很真切的事。
本文转自d1net(转载)