原创 | 大数据时代,应让“抗疫”更科学

原创 | 大数据时代,应让“抗疫”更科学

今年2月,国家提出“要鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。”

从专业角度看,大数据应用本身具有很强的时效性和场景特征,这使其能够在此次举国“抗疫”行动中尽展所长,在疫情监测分析、病毒溯源、防控救治、资源调配等多环节、多时段,通过数据筛查、挖掘、整合与分析,多点发力。例如,在当下的疫情防控中,大数据的应用较好地做到了:

  • 舆情数据分析有所作为,助使公共管理者及时了解舆情和民意诉愿;

  • 与时间轴并行的人流迁徙数据为预判疫情发展提供了重要的预警信息;

  • 面向疫情的数据可视化分析与模拟趋势为疫情防控的精准施策提供了重要的决策依据;

原创 | 大数据时代,应让“抗疫”更科学

目前,国内有很多专业团队在做基于流行病学调查的疫情趋势预测,这项工作需要用到人流迁移数据,需要将疫情状况的时间序列数据整理成此类研究的基础数据。就目前已经发布的一些数据分析结果来看,在此次“抗疫”行动中,追踪移动轨迹、建立个体关系图谱,定位疫情传播路径,防控疫情扩散等技术和方法的应用,都是大数据在此次疫情防控中有所作为的具体体现。


一月底至今,*部门、BAT、网易、各名牌大学、甚至是个人爱好者,可谓是全民参与解析战疫情趋势走向。各自为战的炫耀式科技力量还衍生出了查询14天内日是否到达过疫情严重地区的行程查询助手,还有面向机场、铁路、车站、医院、学校、商务办公等公共场合下对异常情况进行实时告警提示的工具(甚至包括口罩佩戴、人流监测、物资分发、粮油食品库存)等热点应用。不言而喻,这些数据技术的开发和应用,必须恪守尊重用户隐私、获得必要的用户授权等法治原则。国家网信办也曾特地发文,强调在大数据支持联防联控工作的过程中,一定要做好个人信息保护利用的工作。但是,就观察到的情况看,现在数据应用开发者们在获取的数据质量、数据透明度和信息保护意识等方面,还有诸多有待改进和完善之处。

值得注意的是,早在今年一月,基于我国学者发表的基础数据,一些国际学者就在第一时间构建了新冠肺炎的传染模型,事实上证明,该类模型与我国疫情随后发展的实际情况基本契合。而国内在这个方向并未展现出信息科学技术与流行病学的融合分析能力,就在人家公布疫情传染预测模型的时候,我们还在线上做调查问卷和新冠病毒的科普知识。作为可能是疫情始发地的我们甚至连疫情趋势分析和评价、传染病分析与预测等方面的分析也是在国外给出模型之后才被发布出来。其实,我国从事传染病与流行病学研究的专家群体具有相当的规模,但研究方法往往都受到缺少实战数据的制约,所以我国流行病学研究几十年来都是基于国外模型发展而来,缺少适合我国人群的技术模型。

原创 | 大数据时代,应让“抗疫”更科学

今年2月27日,钟南山院士曾在接受采访时提到:“我们也做了预测模型,估计2月中或下旬,疫情到达高峰,预计确诊患者会达到6至7万人。投到国外权威期刊,被退了回来。”

原创 | 大数据时代,应让“抗疫”更科学

对此,个人看法是国外对于中国的报道的认知还比较多的停留在有限、有偏倚的层面,当然也包括国外流行病学专家的预设立场。这里的预设立场就是中国*报告的数字是不是实际存在的感染者数字。所以,权威期刊的审稿人,决定投稿来的论文能不能被录用的人,本身就是带有这种预设立场或者被这种立场感染的人。一篇文章如果想要发表,它符合大部分审稿人的共识,还是与大部分审稿人的共识相冲突,就是它能否被发表的关键。钟院士团队的论文,如果有类似新冠肺炎患者数字和中国*数字相符这样的假设的字样,那很有可能会被国外专家认为是不符合事实,除非来稿已经提供了足够充分、可信的证据证明其数字的准确性等一系列问题。因此,我们这段时间看到的新冠患者感染数字有特别震慑力的文章,或许也是这么迅速见刊的,比如下图中提到的模型预测的数字:

原创 | 大数据时代,应让“抗疫”更科学

近年来,“大数据、智慧城市、人工智能”等概念在国内的火热程度是空前的。如果一个科技公司或者一个研究机构的工作脱离这几个炙手可热的词条,可能都不好意思说自己懂技术。也正因为如此,但凡立个牌子的企业,为表明其紧跟时代的步伐,往往宣称其开发了所谓的“大数据”平台。事实上,公众对于大数据技术无所不能的期待,往往超过了大数据应用现状的所能施为。

新冠肺炎疫情暴发,让我们在“大数据时代”还在依靠最原始的全社会动员方式来做着各种防控工作。最终形成几万人感染、十几亿人被物理隔离的空前的局面。如果后续有可追溯性回顾研究,那么以大数据为资源链的新兴技术未能及时发挥应有作用,导致疫情防控的精准施策缺少技术抓手,也是原因。大数据技术作为工具型技术本该在这样的场景下发挥更及时掌控的作用。

如果国家能够建立起可与个人电子病历对接的全国统一标准接口的个人健康档案系统,营建普遍可及的公共在线医学知识库,为群众提供健康状态实时管理与追踪系统,那么基于移动终端与传感技术,这种全国统一标准接口的个人健康档案系统便可用于高效、迅捷地布局疫情信息早期采集、疫情智能分析和自动预警,为疫情早发现、早隔离、早治疗提供科学决策的重要参考和依据。同时,个人健康档案系统与民政、*等政务数据对接,会更好的对受传染病影响人员进行精准追踪,更精准的将防控措施落实到位。

依托大数据与人工智能等新技术,大数据平台就能够融合跨平台、多维度的公共数据资源,实时在线分析健康信息。从而有序调度相应的物资,管控人流、物流等,成为国家治理现代化的组成部分。就目前,大数据的技术应用需要完善的部分还有很多,如数据的来源、透明度、质量、安全以及国家对数据平台的集中治理等方面,都有待我们积极地改进和开发。

(声明:本文仅代表作者观点,不代表“数据派”立场。)

主要参考资料:

《网络信息内容生态治理规定》. 国家互联网信息办公室

《疫情推动大数据三级跳》. 新浪专栏创事记

北大学者:大数据技术群在抗疫中不合时宜地缺位 .《中国科学报》

e-works许之颖. 《疫情袭来的背后是对数据能力的拷问!》. 大横琴科技


如您想与我们保持交流探讨、持续获得数据科学领域相关动态,包括大数据技术类、行业前沿应用、讲座论坛活动信息、各种活动福利等内容,敬请扫码加入数据派THU粉丝交流群,红数点恭候各位。

原创 | 大数据时代,应让“抗疫”更科学

编辑:文婧

校对:林亦霖原创 | 大数据时代,应让“抗疫”更科学