在疫情那段时期,有一个由美国大学所发布的疫情数据网站这一存在,它变成了全球范围内媒体以及公众去获取信息的关键来源之处。可是呢,这个看起来好像具有权威性的数据源,却在2020年4月14日这一天闹出了一桩很大的乌龙事件,进而引发了人们对于数据准确性以及统计方式的全面思考与普遍质疑。
数据乌龙的来龙去脉
在北京时间2020年4月14日的早上时分,众多对疫情予以关注的人察觉到了一个令人震惊的数字,美国约翰斯·霍普金斯大学所展示的疫情地图表明,美国累计确诊病例在一个多小时的时间框架内剧增了超过10万例,与此同时全球确诊病例也随同突破了200万的大门关卡,这一突变瞬间被包含美国国家广播公司(NBC)在内的多家国际媒体引用进而进行报道。
然而,这不是疫情真正的暴发情况。霍普金斯大学很快发表声明进行澄清,缘由是其数据团队在处理美国佛罗里达州的数据之际发现了异常状况。是一个错误致使该州奥卡鲁萨县的数据从19,985例被错误地记录成了123,019例,从而造成了全球数据的瞬间急剧飙升。错误被快速修正之后,全球确诊病例数出现回落,并没有真正突破200万。
为何是大学在发布数据
在全球性公共卫生事件情形之下,数据发布一般是从各国政府卫生部门或者像世界卫生组织这般的国际机构来主导的。然而在美国,人们察觉到主流媒体以及机构引用约翰斯·霍普金斯大学的数据更为频繁。在这背后存在着一个直接的缘由:美国疾病控制与预防中心,即在2020年3月3日宣称,停止作出全国性的检测人数这类数据的发布。
疾控中心的解释表明,因各个州独立开展检测,全国汇总起来的数据就不再具备代表性了。这一官方信息出现了缺位状况,进而创造出了一个权威数据的真空地带。霍普金斯大学及时推出的、可视化程度较高的全球疫情地图,于是顺势变成了从美国有线电视新闻网到《纽约时报》等美国主流媒体甚至全球媒体的可靠替代信源。
项目背后的研发团队
关乎全球的疫情数据项目,并非出自庞大的政府机构予以开发,而是起始于学术研究。项目核心推动者是约翰斯·霍普金斯大学土木工程系的劳伦·加德纳副教授,还有她的两位身为中国籍的博士生,分别是董恩盛以及杜鸿儒。
原本,这个可视化地图仅是团队内部拿来跟踪疫情的一项研究工具,随着疫情于全球范围扩散,他们作出决定把数据予以公开,并且持续去完善数据抓取以及呈现方式,这个由小型学术团队所发起的项目,因自身数据相对及时、透明且易于获取,出人意料地发展成了一个具备全球影响力的公共信息平台。
数据来源的广泛性
霍普金斯大学数据具有广泛性,这是其与世界卫生组织数据存有差异的重要缘故之一,该团队的数据采集并非依靠单一渠道,而是架构起一个多渠道的信息网络,其核心数据源自世界卫生组织、美国疾控中心、中国疾控中心以及欧洲疾控中心等官方公共卫生机构。
同时,为了能尽可能及时地将数据予以更新,团队会主动去收集各个国家或者各个地区卫生部门的直接通报。此外,他们还会去参考可靠的地方媒体所发布的新闻报道以及其他民间数据追踪平台的相关信息,借助交叉验证的方式来对数据库进行补充以及更新,力求达成覆盖更多角落的目的。
与世卫组织数据的差异
细心留意观察的人会发觉,霍普金斯大学所公布出来的全球累计确诊病例信息数量,时常会比世界卫生组织同一时间段公布出来的数据显高。比如说,在2020年4月13那个日期,霍普金斯大学所展现的数据表明全球确诊已经超过190万例情形,然而世卫组织在11小时之后发布的数字大约是177万例情况,这两个数据之间相差超过10万例数量。
这般差异并非差错,主要是由于两者不一样的数据汇总以及发布机制致使的。世卫组织的数据依靠其194个会员国经由官方渠道逐层上报,此过程需要一定时间去审核与汇总,所以存在天然的延迟。霍普金斯大学的团队运用自动化与手动相结合的方式,直接从各地源头抓取数据,更新频率更高,有时能更迅速地反映新增病例。
乌龙事件的启示与思考
此次数据乌龙事件发生在2020年4月14日,它虽很快就被纠正了,然而它恰似一面镜子呀展现出全球公共卫生数据领域的复杂性以及脆弱性。它给我们提了个醒,哪怕是那被广泛信赖的数据源,其背后是有着人工操作和复杂算法的,存在着出错的可能性。
在信息时代里,数据的及时性跟准确性常常是一对矛盾。公众以及媒体于依赖任何单一数据源时,都应当保持一份审慎,最好是能够进行多方对比。这一次事件也突显了在重大全球危机当中,建立一套更统一些、更透明些、更抗差错的数据共享与核对机制的必要性。
于疫情这般的全球事件里,及时且准确的数据相当重要。您觉得,为了提高未来应对公共卫生危机的能力,国际社会该如何去构建更可靠的数据协作体系呢?欢迎在评论区把您的看法分享出来,要是认为本文有价值,那就请点赞并且分享给更多的朋友。



