首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人类长非编码RNA表达数据库,整合9种重要生物学场景(发育、癌症、病毒侵染等)

近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线。该研究成果以`LncExpDB: an expression database of human long non-coding RNAs`为题在国际学术期刊《核酸研究》(`Nucleic Acids Research`)在线发表。 `LncRNA`通过复杂多样的分子机制发挥重要调控功能,在多个生物学过程以及疾病发生发展中均发挥重要作用。目前,人类基因组中已鉴定出十万多个lncRNA基因,但有功能研究的仅有数千条,因此全面注释lncRNA功能是人类基因组研究的重要内容和巨大挑战。近年来,高通量测序技术的迅速发展促进了正常组织、疾病、胚胎发育、器官分化、病毒侵染、亚细胞区室等多种生物学场景的研究,积累了丰富的组学数据,尤其是转录组测序数据,为从多角度发现和研究lncRNA的生物学功能提供了重要的数据基础与研究思路。 LncExpDB数据库致力于提供多生物学场景的lncRNA表达谱,鉴定具有潜在功能的lncRNA,促进lncRNA的功能实验研究。在LncBook数据库构建的人类lncRNA数据集基础上,研究人员整合CHESS、RefLnc、FANTOM等10余个专业数据库鉴定的lncRNA,基于严格审编标准,获得全面的高质量人类lncRNA参考数据集,包含101,293个基因/33,1244个转录本。LncExpDB数据库进一步整合9种重要生物学场景(正常组织/细胞系、器官发育、植入前胚胎发育、细胞分化、亚细胞定位、外泌体、癌症细胞系、病毒侵染、昼夜节律)的1,977个样本的转录组数据,通过标准化的转录组数据分析流程,系统分析并鉴定每种生物学场景的特征基因(管家基因/组织特异性基因、差异表达基因、节律基因、动态表达基因、亚细胞区室富集基因)集合,共计25,191个特征lncRNA基因和28,443,865对相关的lncRNA-mRNA共表达关系。此外,LncExpDB鉴定了具有表达证据支持的92,016个lncRNA基因,评估了lncRNA的表达水平与表达潜力。

01
您找到你想要的搜索结果了吗?
是的
没有找到

NAR | 董波/王师/李语丽合作建立首个横跨动物界的进化发育组学数据库平台

进化发育生物学(EvoDevo)是近年来国际上迅速崛起的新兴前沿交叉学科,旨在通过研究生物界高度多样化的发育过程,从而深刻归纳阐释发育过程背后隐藏的进化驱动机制和规律,以解答被Science杂志评为125个最具挑战性的科学难题之一的生物多样性决定机制问题。在过去的几十年里,利用经典模式生物(如黑腹果蝇、秀丽隐杆线虫、斑马鱼和小鼠)所开展的广泛研究给我们带来了生物学领域诸多重大发现和突破,奠定了目前遗传、发育和进化等领域的基本知识构架体系。然而,为数甚少的模式动物无法涵盖动物界高度多样化发育过程的全部信息,更无法提供对整个动物界发育进化过程的全景式解读和归纳。为填补这一极大的知识空白,利用具有关键系统发育位置和全谱系覆盖的新兴模式生物来描述整个生命树的发育进化,对驱动进化发育学领域的跨越式发展具有极为重要科学价值和意义。高通量测序技术的革命性突破及各类组学技术广泛应用,为生命科学领域带来前所未有的发展契机。基因组学、转录组学以及单细胞技术加速了许多传统的非模式生物转变成新兴的模式生物(如栉水母、丝盘虫、玻璃海鞘、侏儒蛤等)。尽管近些年非经典模式动物类群已积累了海量的多组学资源,并仍以史无前例的规模快速增长,但对这些储存分散的组学资源进行整合和综合分析仍是目前国际上动物进化和发育研究领域共同面临的重大挑战,迫切需要系统建立面向整个动物界的进化发育综合组学数据库和相应的分析工具和平台。

03

计算生物来到商业化前夜,一文搞懂产业链全貌 | 量子位智库报告(附下载)

量子位智库 发自 凹非寺 量子位 | 公众号 QbitAI 这个赛道火到全球大厂都想插一脚,却从未诞生一家真正意义上的公司。 它就是计算生物。 谷歌Meta英伟达百度阿里,还有比比皆是的初创企业,都屡屡传出最新前沿进展。 作为工具类学科,很难想象会在诞生近30年之后迎来如此盛况。 如今在AI激活、数据驱动下,计算生物已经来到大规模应用前夜。它将如何落地?发展到什么阶段?国内外差距到底有多大? 量子位智库做了个全球体系化梳理写下《计算生物学深度产业报告》,并整理出七个问答速览整个行业全貌。 1、计算生物学究

02

为什么选择GSEA分析?和KEGG和GO分析有什么区别?

但是,一般的差异分析(GO和Pathway)往往侧重于比较两组间的基因表达差异,集中关注少数几个显著上调或下调的基因,这容易遗漏部分差异表达不显著却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息。而GSEA不需要指定明确的差异基因阈值,算法会根据实际数据的整体趋势, 为研究者们提供了一种合理地解决目前芯片分析瓶颈问题的方法,即使在没有先验经验存在的情况下也能在表达谱整体层次上对数条基因进行分析,从而从数理统计上把表达谱芯片数据与生物学意义很好地衔接起来,使得研究者们能够更轻松、更合理地解读芯片结果。

06

JCIM | 化学、生物和生物医学科学的信息学研究

信息学正在跨学科发展,影响着化学、生物和生物医学的多个领域。除了成熟的生物信息学学科,其他以信息学为基础的跨学科领域也在不断发展,如化学信息学和生物医学信息学。其他相关的研究领域,如药物信息学、食品信息学、表观信息学、材料信息学和神经信息学等最近才出现,并作为独立的子学科继续发展。这些学科的目标和影响通常在文献中被单独回顾。因此,确定共同点和关键差异仍然具有挑战性。研究人员结合自然科学和生命科学中的三个主要信息学学科,包括生物信息学、化学信息学和生物医学信息学进行讨论,并对相关的子学科进行简要评论。重点讨论了生物信息学、化学信息学和生物医学信息学的定义、历史背景、实际影响、主要异同,并对生物信息学、化学信息学和生物医学信息学的传播和教学进行了评价。

03

Network在单细胞转录组数据分析中的应用

面向单细胞的技术革命,让我们得以进入新的研究层面,但也对传统的分析方法提出了一系列的挑战。单细胞技术正在弥补分子生物学和组织生物学之间的鸿沟,进入高通量时代以来,这项技术所揭示的不是单一元素的信息,而是在单细胞层面揭示某种系统关系:DNA,RNA,ATAC等。我们知道,在系统中,关键要素除了来自元素本身(基因,转录本等生物小分子)之外,还来自元素之间的关系。虽然作为领域起源的社会网络分析可以追溯到20世纪30年代,图论可以上溯几个世纪,但网络科学的迅速崛起与普及只是近几十年的事情。目前,基因调控网络,生物代谢与信号转导网络,蛋白质互作网络作为基本的生物分子网络(Biological molecular network )已经在生物信息分析中得到广泛的应用。

02

三大基础公共数据库介绍

美国的国家生物技术信息中心(National Center forBiotechnology Information,NCBI,https://www.ncbi.nlm.nih.gov/)是1988年美国国家健康研究所(National Institutesof Health,NIH)和国家医学图书馆(United StatesNational Library of Medicine,NLM)联合发起成立的分子生物学、生物化学、遗传学知识储备和文献整理平台,并逐步演变为大规模生物医药数据存储、分类与管理,生物分子序列、结构与功能分析,分子生物软件开发、发布与维护,生物医学文献收集与整理,全球范围数据提交与专家注释于一体的世界生物医学信息与技术资源数据库。NCBI采用著名的Entrez搜索和信息检索系统,可以进行在线资源检索,同时构建FTP数据资源下载平台(https://www.ncbi.nlm.nih.gov/guide/all/#downloads),方便用户批量下载数据。

02
领券