首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

有了UK Biobank的引领,是否可能会有CHN Biobank?

UK Biobank,这个生物样本库的业界大佬,想必大家都不会陌生。他们的数据自2006年就已经开始收集了,17年之前,开放了大于10万人的数据;17年之后,开放了全部50万人的数据。目前,很多工作还在进行中:

全外显子组(whole exome sequencing,WES):预计2019年全部 完成,2018年底完成15万人。

全基因组(whole genome sequencing,WGS):今年8月就开始测第一 批5万样本,打算在4-5年50万样本全测完。

还有大量的imaging的数据(核磁共振成像,MRI),包括脑,心脏,骨骼等。

自2012年开放申请以来,目前使用UK Biobank数据的课题已经批准7千多,在审核的还有1千4百多。已经发表的科学论文已经大于400篇,接近4千篇的引用。

在资源丰富的中国,能否建立起像英国生物样本库一样开放共享的生物样本库平台呢?

现在看来,主要有以下几个关键点。

1.样本归属

通常我们理解的样本库,往往对应的是样本实体库。这些库,通常都是由科室、医院或者组织机构根据自己所需建立,自己采集,自己使用。到后来,规模渐渐大了,主管领导就会小范围搭建一个使用平台,供大家使用。到此为止,样本库有了实体库和数据库。但是要使样本真正扩大适用范围,还是有很大困难。当下,样本库的所有使用权掌握在各家医院手中,而不同医院并没有共享样本库的主动性和驱动力,除非是在合作研究项目中互换。更有甚者同一家医院的不同科室样本的使用还需要层层审核。这种现象也无可厚非,毕竟样本的收集也是有颇多阻碍,不仅耗费物力人力,得到回报也是需要相当长的时间,巨大的科研投入,任谁也不会轻易拱手让出。

2.数据归属

样本库在采集捐赠者样本时,不仅是体液、组织等生物样本,还囊括临床数据、个人信息、家庭信息、生活方式等信息,对于遗传病来说,更会采集整个家族相关人员的各类信息。样本入库需签署知情同意,但是方方面面的样本数据呢?那么这些信息是归属个人,还是归属保存单位,还是国家呢?正因为缺乏了立法依据,第一手获得信息的医院就不敢在数据上多做文章,而数据的共享更是无稽之谈。

3.数据共享方式

做好生物资源的利用,离不开临床数据。每家医院都有自己的HIS系统和LIS系统,同样的HIS厂家可能在定义数据格式上也存在差异,所以要做好多中心的样本共享就要做好多中心的数据共享,数据共享就涉及到了数据标准,不同的厂家很难做到统一标准,这时候数据清洗(ETL)就成了关键,如何做好不同参与单位的数据标准就是数据共享的核心内容。

生物样本库的真正价值在于数据,开放可以让本来没有发挥其最大价值的数据,在开放的过程当中快速的膨胀,迭代式的新的数据的产生,全球的科学家只是把这些数据进行不断地刷新,最终形成一个科研的大数据,这就是她真正的价值。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181010G0DK2C00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券