经过第一周的lncRNA概述,我们对其作用有所了解,目前lncRNA的研究重点主要包括:lncRNA的分类以及lncRNA的识别和鉴定,以及lncRNA和其他生物元素的相互作用的系统生物学研究,除此之外,还有lncRNA在重大疾病发生发展中的作用,lncRNA作为疾病分子标记物和药物靶点的潜力研究。那么从哪获得这些lncRNA的详细信息呢?自然是相关数据库啦,也就有了这周的专题lncRNA数据库了。
前几节已经讲了NONCODE, LncRNAdb, LncRNome, StarBase等数据库常见的lncRNA相关数据库,有表达数据库、序列和功能、细胞定位等。今天要介绍的数据库LncRNAdisease则是基于疾病互作的角度,主要收录了有实验支持的lncRNA和疾病的关系,便于biomarker的寻找和疾病机制研究。2017年数据库更新后,有2947个lncRNA-disease对。该数据库提供的主要功能是疾病与lncRNA映射关系,可以查询预测和lncRNA存在相互作用关系的其它分子和疾病,并集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。
原文对功能的描述如下:
experimentally supported lncRNA–disease association data
experimentally supported lncRNA interaction data
predicted lncRNA–disease association data
Moreover, a bioinformatic method to predict potential-associated disease for a novel lncRNA based on its genomic context and integrated this method into LncRNADisease.
数据库构建过程
数据库构建流程大致就是从pubmed查询下载,手工整合,对各种lncRNA做了物种归类、系统命名,和疾病的关系(图A)以及在疾病中的失调状态(比如表达异常、DNA甲基化异常等等,图B)。
pieChartlncRNA-疾病互作对的预测
基于遗传物质的组成相似性,lncRNA可能会对它所在的基因组位置附近的基因产生一定的影响,这类基因就被定义为“邻居基因”。根据这一原理,可以找到蛋白编码基因和miRNA相关的基因
数据库使用简介和扩展
简单使用其实在文章里说得挺明白,首先选择lncRNA或disease:
“Browse”的返回结果:对应项目的详细描述
“Fuzzy search”:就是模糊匹配全名或者alias(case-sensitive)
结合更多功能分析或许可以根据互作基因的功能进行拓展延伸,由于笔者在这方面的知识相对不够深入,盼和大家共同交流~
本文作者:王HH
还有更多文章,请移步公众号阅读
领取专属 10元无门槛券
私享最新 技术干货