在新冠疫情刚开始在全球大肆蔓延,处于一片混乱的时期,有一个数据平台,它是完全靠着志愿者搭建起来的,然后悄无声息地就上线了,最后变成了全球疫情追踪方面非常重要的基础支撑,它所产生的影响力远远超过了最开始人们的想象。
草创团队的初心
2020年1月底,那时疫情信息还不透明,全球都陷入了数据焦虑之中,有一群散居在北美的华人工程师、学者以及留学生,他们开始自发地行动起来。他们最开始的想法是很简单的,那就是给身边焦虑的亲友以及社区提供一份可靠且及时的北美疫情信息。团队的发起人郭昱,当时是旧金山Uber公司的一名高级工程经理,他利用自己的业余时间,凭借技术专长,搭建了平台最初的框架。
这一举动并非源于任何机构所下达的指令而是完全由志愿者精神所驱动产生的互助性质的行为,他们借助时差方面的优势,展开轮流值班状态来确保在24小时的时间段内始终都有人进行监控以及更新数据,从最开始的时候,该团队的目标并非是去做一个单纯简单的信息聚合器,而是致力于要搭建构建一个能够经受得住专业检验的数据库。
如何确保数据精准
平台的生命线是数据准确性,为此团队建立了一套多层次的数据核查机制,他们优先采用市、郡等基层卫生部门发布的最新数据,因为州或国家层面的统计数据往往存在发布延迟,当发现确诊数字出现异常波动或累计数下降等不合理情况时,他们会对比多个信源进行交叉验证。
对于显著的异常数据,会有特定的志愿者开展人工核查。团队甚至于在网站的前端、后端设置了数据变化的阈值,以此防止处于更新核验进程中的中间数据被错误地发布至前端网页。这般对数据质量近乎偏执的追求,是平台获取专业机构信任的关键所在。
与众包模式的结合
平台除了有主动抓取以及人工核实之外,还创新性地将“用户反馈”众包模式引进。网站设有专门的反馈用的入口,世界各地的那些用户,可以经由这个入口去报告当地的最新疫情动态或者新闻线索。这些源自一线的信息做了啥呢,成为了志愿者团队重要的数据补充的来源呀。
数目众多的用户所提供的汇报,极为显著地提升了数据的即时性以及覆盖范畴。好些地方性领域、范围局限的疫情突发消息,起初借助这个途径得以被捕捉,接着经由志愿者团队开展官方信息源头的核查以及录入工作。这样的互动方式使得数据搜集演变成一场全球性的协同合作!
成为权威数据源的过程
CovidNet这个平台,因其数据具备实时性,还有地理颗粒度特性以及准确性,从而渐渐获得了权威机构的认可。它先是成为了约翰斯·霍普金斯大学疫情仪表板的重要数据来源当中的一个,之后又被美国疾控中心也就是CDC参考使用。维基百科的新冠大流行页面同样把它列为北美地区的主要数据引用源。
在相关论文发布之际,该平台已然覆盖了全球数目众多的国家以及地区,当中北美地区的数据细致到了3169个市与郡,记录下了确诊、死亡、检测、住院等多项关键指标,平台累计的访问量超出了2.25亿次,被全球522个组织或者机构所使用。
志愿者的多元构成
那个庞大工程得以被支撑起来,依靠的是一支志愿者队伍,这支队伍人数超过50人,且背景高度多元。核心成员涵盖了在美的有着华人身份的软件工程师、数据科学家、医学方面的研究者以及大学教授。众多中国留学生也在课余之时参与到数据整理以及核查之中。
着实令人动容啊,团队成员里存在着正在备孕的准妈妈,有工作繁忙的医生,还包括科研机构的工作人员。他们每一个人皆是凭借自身的业余时间去开展无偿工作,在那长达数月的疫情高峰期阶段,好多人天天都得投入数小时,以此维系着这个数据灯塔能够正常运行。
留下的技术与精神遗产
除了那个实时数据网站之外,团队另外开发了完整的API接口,还开发了一系列交互式数据可视化工具,这些都免费提供给全球范围内的研究机构、学校以及公司去使用。这些工具涵盖了精细到郡级的病例分布地图,还有多区域疫情趋势横向对比动态图,以及全景时间序列折线图。
有着这样一支致力于志愿服务的队伍,凭借自身实际行动证实了,于重大公共危机现身之际,技术能够摇身一变成为连通善意以及现实的一座桥梁。他们所开展的工作,不但给予了至关重要的信息,而且还彰显出一种跨越国界、不谋求回报之情的协作精神。存在着这样一种基于个人专业方面能力以及公民自身责任发起的组织,为往后的公共数据服务奉献出了极具价值的一种范式。
处在当下这个数据到处都有但真假难以分辨清楚的时代里,您觉得这种靠着志愿者推动的、开放且透明的数据协作方式,能不能给解决别的全球性难题(像是气候变化、公共卫生方面)提供全新的思考方向呢?欢迎在评论区域分享您的想法,要是本文对您有所启发,也请点赞给予支持。









