让我很无语,我又不是带领本科生搞一个学期的课程,仅仅是不到2小时我能讲解什么背景呢:
lncRNA 的全称是long noncoding RNA。即又长又表达且还不能编码翻译成蛋白质的一类RNA。
Motivation: 目前一些计算方法都是基于2011年的那个ceRNAs假设,研究lncRNAs和miRNA靶mRNAs之间的竞争关系。但是,当mRNAs脱离miRNAs的控制之后,海绵lncRNAs如何影响这些mRNAs的表达水平还不是很清楚。
在非编码RNA中,近年来最受关注的要数长链非编码RNA(lncRNA),它在免疫、肿瘤、炎症等方向中均扮演着重要角色。那么,当我们拿到含有lncRNA信息的VITA单细胞转录组数据后,后续如何分析挖掘?单细胞lncRNA信息能为我们提供哪些新的洞见?
标题:Epigenetic landscape analysis of lncRNAs in acute myeloid leukemia with DNMT3A mutations
这篇通过相似性网络融合(SNF)和一致性聚类(CC)划分整合多组学数据对软组织肉瘤(STS)进行聚类。并筛选预后不良和预后良好亚群之间差异表达的lncRNAs、miRNAs和mrna,以此构建ceRNA网络进行分析。
在4月期间,总共发表了医学相关在线数据库34个。下面就来给大家介绍一下主要有哪些数据库,以及笔者比较感兴趣的数据库。如果想要所有相关数据库信息的,后台回复:2104。
Lnc2Cancer 3.0由哈尔滨医科大学李霞老师和宁尚伟老师课题组开发,发表在2020年10月13日发表在Nucleic Acids Research杂志上。
今天给大家介绍北京大学朱怀球教授在Bioinformatics上发表的文章“LncADeep: an ab initio lncRNA identification and functional annotation tool based on deep learning”。识别lncRNAs,推断lncRNAs的功能,以及对IncRNA注释进行全面的构建是十分必要的。本文提出LncADeep是第一个不仅可以识别lncRNAs并且推断lncRNAs功能的工具,在识别lncRNA上,LncADeep集成了序列固有和同源性特征,放入深度置信网络(DBN)对全长和部分的转录本进行判别。结果表明,lncADeep的性能优于最先进的工具,并且可以跨物种IncRNA鉴定。对于功能注释,本文首先利用序列和结构信息,基于深度神经网络(DNNs)的深度学习算法预测了lncRNA的相互作用蛋白质,随后融合了KEGG和Reactome等人路径富集分析并且利用预测的相互作用蛋白进行功能模块检测,从而提供了丰富的途径和功能模块作为功能注释。
非编码RNA(non-coding RNA)包括micro RNA,long non-coding RNA,circular RNA,pi RNA等,它们不像蛋白质,可以作为生命活动的直接承担者,有关非编码RNA组学的研究也不能像蛋白分子或者基因分子一样仅仅做定量研究。
lncRNA全称为long non-coding RNA, 长链非编码RNA, 指的是长度在200nt以上的非编码RNA。 lncRNA在细胞周期调控, 细胞分化调控,疾病的发生与发展等多种生命活动中发挥着重要作用,是研究的热点之一。
关于LncRNA的功能。之前我们介绍过很多关于lncRNA的数据库比如:[[AnnoLnc2-一站式lncRNA查询数据库]]这个综合性分析lncRNA基本情况的数据库,或者[[LncPep-lncRNA编码肽检索数据库]]分析lncRNA编码肽的数据库。这次就来介绍一个关于预测lncRNA的ceRNA功能的数据库 (简单来说ceRNA的话,就是lncRNA-miRNA-mRNA三个互相竞争影响的情况):LncACTdb 3.0 : Home: http://bio-bigdata.hrbmu.edu.cn/LncACTdb/index.html
长链非编码rna(lncRNAs)已经成为多种生物过程和疾病的关键调控因子。虽然高通量测序使lncRNA的发现成为可能,但功能表征仍然有限。EVLncRNAs数据库是第一个也是唯一的存储库,包含来自不同物种的所有经过实验验证的功能性lncRNAs。
实验验证的数据库数据库其实和综述差不多。综述是基于一个主题检索相关文献,然后利用文字来进行来进行总结出这些文献的相关特点。而这类经过实验验证的数据库,第一步也是人工来检索相关的文献。第二步则把文献当中的相关信息,通过数据库的形式来呈现出来。这样的好处是我们可以得到作者作用检索的信息。
考核题的文章里面是自己测了8个TNBC病人的转录组然后分析,这里借助TCGA数据库,所以可以复现。我这里想展现的主要是TCGA的数据下载和基因的ID转换,分类,的理解。
在研究一个lncRNA之前,我们都要先去查看这个lncRNA可能的相关功能,比如要查看这个lncRNA的表达、查看其相互作用的miRNA或者需要去查看调控这个lncRNA的转录因子。对于不同的需求需要使用不同的数据库,今天就来介绍一个一站式查询lncRNA相关功能的数据库: AnnoLnc2 (http://annolnc.gao-lab.org/)
有多项研究表明lncRNA与众多生物学过程,复杂疾病相关,为了进一步探究lncRNA在这些生命活动中的具体作用,我们需要对lncRNA的功能进行分析。
step1: 计算资源的准备 如果有差不多配置的服务器,就可以从SRA/FASTQ格式数据开始走全套流程。不懂配置,请看前面转录组和表观组的传送门。 如果只有个人电脑,那么直接下载表达矩阵开始分析也是可以的。 step2: 读文献,查看GEO数据 文章是 Annotation and cluster analysis of spatiotemporal- and sex-related lncRNA expression in Rhesus macaque brain , 作者测了 4个年龄段的恒河猴:1年
在整个基因转录翻译的过程当中,基因是在细胞核发生转录,然后出核到细胞质当中发生翻译。对 lncRNA 而言,由于lncRNA的功能主要还是通过影响其它基因来实现的。所以 lncRNA 在不同的位置影响的功能肯定也是不一样的。如果在细胞核,就是参与转录调控了,经典的方式还是影响ceRNA的方式来进行调控;而如果在细胞质的话,那就参与转录后调控了,比如和mRNA形成互补双链来增加 mRNA 的稳定性。所以在研究 lncRNA 的时候,知道 lncRNA 的定位还是很有必要的。今天就给大家介绍几个预测lncRNA定位的数据库。
标题:A novel autophagy-related lncRNA prognostic risk model for breast cancer
随着二代测序和基因芯片的出现,对于我们可以一次性获得一个样本所有的基因表达情况。虽然我们没办法知道lncRNA的功能预测。但是我们可以通过测序数据进行统计分析得到和这个lncRNA相关的编码基因有哪些。进而对这些相关的编码基因进行富集分析预测。就可以间接的了解这个lncRNA是什么功能了。
LncRNA一直是近些年来非编码RNA领域的研究热点,所以,许多各式各样的LncRNA数据库应运而生。今天,小编就来给大家介绍一个通过整合lncRNA在广泛的生物学条件下的表达谱来系统表征人lncRNA表达格局的数据库:LncExpDB(https://bigd.big.ac.cn/lncexpdb)。这是一个人类lncRNA的表达数据库,致力于提供lncRNA基因的全面表达概况,探索其表达特征和能力,鉴定具有潜在的重要功能特征的基因,并在各种生物学环境/条件下与蛋白质编码基因相互作用。
标题:Identification of long non-coding RNA in the horse transcriptome
TANRIC整合了来自TCGA, CCLE等大型肿瘤研究项目的数据,对多种肿瘤的lncRNA表达量进行分析,差异分析,并对lncRNA与临床信息,基因组等数据进行相关性分析,文章发表在Cancer Research上,链接如下
今天跟大家分享的是2020年3月发表在Communications Biology(IF=4.165)杂志上的一篇文章Cancer LncRNA Census reveals evidence for deep functional conservation of long noncoding RNAs in tumorigenesis。文章中作者通过癌症LncRNA普查揭示证据,证明长非编码RNA在肿瘤发生中的深层功能保守性。
如果我们最后拿到的是蛋白编码基因,当然可以很容易的注释到各种数据库,比如:Gene Ontology terms, KEGG, Reactome, NetPath, PID, INOH and BioCarta pathways ,这些数据库本质上都是一些被定义好的基因集而已。
这一次要分享的文章题目是:Five key lncRNAs considered as prognostic targets for predicting pancreatic ductal adenocarcinoma
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线。该研究成果以`LncExpDB: an expression database of human long non-coding RNAs`为题在国际学术期刊《核酸研究》(`Nucleic Acids Research`)在线发表。 `LncRNA`通过复杂多样的分子机制发挥重要调控功能,在多个生物学过程以及疾病发生发展中均发挥重要作用。目前,人类基因组中已鉴定出十万多个lncRNA基因,但有功能研究的仅有数千条,因此全面注释lncRNA功能是人类基因组研究的重要内容和巨大挑战。近年来,高通量测序技术的迅速发展促进了正常组织、疾病、胚胎发育、器官分化、病毒侵染、亚细胞区室等多种生物学场景的研究,积累了丰富的组学数据,尤其是转录组测序数据,为从多角度发现和研究lncRNA的生物学功能提供了重要的数据基础与研究思路。 LncExpDB数据库致力于提供多生物学场景的lncRNA表达谱,鉴定具有潜在功能的lncRNA,促进lncRNA的功能实验研究。在LncBook数据库构建的人类lncRNA数据集基础上,研究人员整合CHESS、RefLnc、FANTOM等10余个专业数据库鉴定的lncRNA,基于严格审编标准,获得全面的高质量人类lncRNA参考数据集,包含101,293个基因/33,1244个转录本。LncExpDB数据库进一步整合9种重要生物学场景(正常组织/细胞系、器官发育、植入前胚胎发育、细胞分化、亚细胞定位、外泌体、癌症细胞系、病毒侵染、昼夜节律)的1,977个样本的转录组数据,通过标准化的转录组数据分析流程,系统分析并鉴定每种生物学场景的特征基因(管家基因/组织特异性基因、差异表达基因、节律基因、动态表达基因、亚细胞区室富集基因)集合,共计25,191个特征lncRNA基因和28,443,865对相关的lncRNA-mRNA共表达关系。此外,LncExpDB鉴定了具有表达证据支持的92,016个lncRNA基因,评估了lncRNA的表达水平与表达潜力。
lncRNome是一个综合性的人类lncRNA数据库,中收录了超过17000个lncRNA,网址如下
ceRNA是近年来研究的非常火热的一种调控机制,指的是不同RNA分子竞争性的结合miRNA, 通过这种竞争关系来调控不同RNA的表达,这里的RNA分子可以是mRNA, lncRNA, 甚至是pseudogene。
在之前 [[Gene Id二三事]] 中介绍过,每一个基因都在不同的数据库当中都有不同的 ID ,但是每一个基因又都有同样的一个基因名。这个基因名是哪里命名的呢?今天来介绍一下基因命名数据库: HUGO Gene Nomenclature Committee: https://www.genenames.org/
百味科研芝士的小伙伴们大家好啊!好久不见甚是想念,点赞在看养成习惯。我是你们的老朋友小木舟~今天给大家分享来自《Epigenomics》,IF= 4.173,国人占比:4.80% 的一篇文章。文章的题目是:新型mRNA-miRNA-lncRNA竞争内源性RNA网络的鉴定与乳腺癌的预后相关。简单的说就是乳腺癌的ceRNA网络构建。
作为一名科研狗,重来,是研究生,想来最重要的就是课题能否顺利的进行,当满心欢喜的搞好了实验设计发给老板,一天不到就被打回来,内心那是满满的崩溃
做科研的友友们可能都知道,长链非编码RNA(lncRNA)与人类疾病相关这个事实。虽然lncRNA与疾病的关联已受到广泛关注,但目前缺乏数据库预测lncRNA介导的靶基因调控机制、关键下游靶基因以及与疾病相关的lncRNA的重要生物学功能。那么,今天的神器就是为了解决这些问题的!
lncRNA可以作为miRNA sponge与miRNA发生相互作用,通过竞争性的结合miRNA, 可以调控其他基因的表达量, 发挥ceRNA的调控功能。
同样的策略,我们也可以应用到lncRNA的学习。以前我在:miRNA、LncRNA、CircRNA靠谱小结 也提到过一些基础知识,但还不够丰满!其实读一篇综述是最好的学习方式,不过英文的毕竟难啃。假如你还是需要深入学习,建议看2009的CELL杂志的超级经典综述:Evolution and Functions of Long Noncoding RNAs
所以我这里安排一个学徒作业,大家需要去下载TCGA数据库的BRCA这个癌症的芯片和RNA-seq的表达矩阵,分别进行差异分析,拿到统计学显著的上下调基因列表。
lncRNA(long non coding RNA)发挥功能的方式,目前研究最多的还是ceRNA 的功能。经典的ceRNA调控网络是通过 lncRNA-miRNA-mRNA 来构建的。这个研究思路,相对来说已经很成熟了,如果要在这个方面研究的话,其实再加一些变化可能更好一些,毕竟成熟的思路就代表创新性少一些,而如果要加变化的话,由于 ceRNA 调控的原始还是序列的结合,所以最直接能加的还是看基因组变异对于ceRNA 调控的影响。所以这次给大家推荐一个基因组变异对于ceRNA调控影响的数据库:LnCeVar
ceRNA-芯片,其实就是大杂烩,包含了mRNA、lncRNA、circRNA的基因芯片,可同时获得这三个层面的表达数据,同时作为lncRNA和circRNA两种非编码RNA调控功能研究的利器。
NONCODE数据库是一个综合的非编码RNA数据库,该数据库中包含了除tRNA和rRNA之外的其他类型的非编码RNA信息,其中绝大部分是lncRNA,网址如下
我组织的第一个活动是文献分享,第二周是关于ctDNA里面的甲基化在癌症诊断和预后的,都是中山大学肿瘤医院的大文章。
深度学习方法在准确识别疾病相关基因以进行诊断、预后和治疗方面发挥着至关重要的作用。2023年7月,《Frontiers in Genetics》发表综述文章,系统地评估了基于深度学习技术的多组学数据分析的最新趋势及其在疾病预测中的应用。
之前在介绍两个预测lncRNA编码潜能的数据库:[[SPENCER-肿瘤LncRNA编码肽查询数据库]]和[[LncPep-lncRNA编码肽检索数据库]]里面都提到使用CPAT来分析lncRNA序列是否具有编码潜能。因此今天就来简单的介绍一下这个数据库:Web server for Coding Potential Assessing Tool (CPAT): https://wlcb.oit.uci.edu/cpat/index.php
标题:The Long Intergenic Noncoding RNA (LincRNA) Landscape of the Soybean Genome
最近在做一个0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》,直播活动,收集整理文献看到了一个很有意思的研究,节选文章里面的部分图表作为学徒作业哈!
随着lncRNA研究的发展,lncRNA的数量越来越多,但是拥有功能注释的lncRNA只占了其中很小一部分。为了更好的开展lncRNA的功能研究,科学家收集文献中人类lncRNA相关的数据,包括了表达量,相关疾病,甲基化位点,SNP位点,功能描述等信息,并整理成了数据库LncBook, 网址如下
目前大部分lncRNA相关的数据库都是依赖高通量测序,而今天我们介绍的这个数据库以实验验证为基础,收集2016年5月1日前的所有lncRNA实验数据,并整合了lncRNAdb, LncRANDisease, Lnc2Cancer 和 PLNIncRBase 三个lncRNA数据库的结果,当前版本包含来自77个物种的1543个lncRNAs,是目前为止最全面的有实验结果支持的lncRNA数据库,EVLncRNAs(http://biophy.dzu.edu.cn/EVLncRNAs/)。
LncRNA在哺乳动物中大量转录,通过复杂多样的分子机制在多种生物学过程发挥重要功能,与人类疾病的发生发展密切相关。近些年,lncRNA成为基因组学与生物信息学领域的研究热点,涌现出大量研究成果。然而,丰富的lncRNA知识分散在文献中,使得获取、整合、统计及解析这些信息变得费时费力。尽管目前已开发了一些lncRNA知识库,为深入研究lncRNA提供了支持,但多数知识库专注于某一方面的注释,如疾病、互作、生物学功能、临床信息、亚细胞定位及发育过程。
单细胞测序技术能够揭示每个细胞独特的基因表达特征,精细区分细胞类型,深入系统的研究细胞间的相互作用关系,在肿瘤研究、免疫研究、神经生物学研究、发育研究等领域发挥着重要作用。
领取专属 10元无门槛券
手把手带您无忧上云