“你在南方的艳阳里大雪纷飞我在北方的寒夜里四季如春”正如歌词,这是南方北方暖气差异冬天的真实写照。北方的冬天,家家都是暖气,天气干燥加之连续几个月没有下雪,每天起床嗓子都是干干的,好多人都出现上火/咳嗽,加上室内室外温差较大,普遍出现感冒/发烧的也不在少数。
各个医院也人满为患,尤其是儿童医院,有些特效药出现了短缺,那这些一切的背后能否有效机制预警流感的爆发呢,好让医院和机构有相应的准备和应对措施?
其实这些都是有先例的
2008年,谷歌推出了一款名为“谷歌流感趋势”(GoogleFlu Trends)的产品。工程师们假定:一旦人们患上流感,就可能会在搜索引擎上输入特定的检索词条以获得与流感相关的信息。通过汇总和分析这些检索词条,谷歌就能预测流感将在何时何地爆发。2009年,这款产品在甲型H1N1流感爆发几周前成功预测了其在全美范围的传播,反响巨大!一时间,有关大数据开启公共卫生变革的观点接踵而来。
但人们有所不知的是,“谷歌流感趋势”之后的表现并不尽如人意。在2011年至2013年间,该项目多数高估了类流感发病率。在最近一次预测流感爆发趋势时,谷歌所预测的流感病例数目几乎是美国疾病控制与预防中心统计数据的两倍。
其实主要是两个方面造成流感预测失败,一个是搜索关键词和疾病爆发即使有相关性,也没有什么因果性,一个人搜索感冒,也不一定就是病了,也学就是随便搜索玩玩。这种预测有很大的偏差,因为公众并不了解疾病和症状的对应情况。比如搜索感冒,但很可能得了非典,关键词和疾病的对应关系无法建立。
另一个就是在数据分析方面存在欠缺。哈佛大学教授GaryKing的研究就指出了谷歌项目在分析上的不足。首先,这个项目没有尽可能利用传统的统计分析手段来剔除系统误差,比如残差的自相关性和季节性;其次,“谷歌流感趋势”忽略了其他数据的作用。
有网友讲了个笑话,有机构监测到某地在某一段短时间内突然爆发了很大的流感相关名词的搜索量,于是很紧张地通知了疾病防控中心。等疾病防控中心的人去调查,发现那里平安无事,只不过是有两个大的医学院,而那段时间正值期末考试。
虽是笑话,也侧面反映出大数据给出决策前,不仅要采纳数据广泛性,也要注意采纳数据的严谨性,才能提高数据结果的准确性,不至于出现大的决策偏差。
尽管这些项目还存在缺陷,但这并不足以否定大数据对国民健康的潜在贡献。
随着信息技术的发展和相关软硬件性价比的提高,相当多的数据服务商和地区医疗服务网络已开始利用大数据,寻找最有效和最具成本效益的医学、预防和干预手段。
相信在不远的将来,大数据预测疾病将成为一个大趋势。大数据结合国家疾病预防控制中心观测点的数据,可提供更多更全面的原始信息。如果配合严谨的分析,这有可能开辟疾病监测防控的新天地。
虽然在探索时期的预测总会有给公众不准确的印象,但我们应该给出足够的耐心,就好比现在的天气预报比10年前更准确一样。
领取专属 10元无门槛券
私享最新 技术干货