前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >microRNAs靶基因数据库哪家强

microRNAs靶基因数据库哪家强

作者头像
生信技能树
发布于 2020-04-21 06:47:13
发布于 2020-04-21 06:47:13
1.6K00
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

microRNAs早就不再是科研热点,但毕竟还是遗留下来了不少数据,而且好歹是TCGA计划的多组学中的一环。在自己的研究增加miRNA的角度也是极好的, 通常大家有4个需求:

  • 想知道自己感兴趣的一个或者多个miRNA有哪些靶基因
  • 想知道自己感兴趣的一个或者多个基因由哪些miRNA调控
  • 想知道自己感兴趣的一个或者多个miRNA跟哪些疾病或者药物相关
  • 想知道自己感兴趣的一个或者多个miRNA是否调控自己感兴趣的一个或者多个基因

如果你也有上述需求,那么一个R包推荐给你,发表在Nucleic Acids Res. 2014 Sep的The multiMiR R package and database: integration of microRNA–target interactions along with their disease and drug associations

关于R包的下载安装,我就不多说了:

代码语言:javascript
代码运行次数:0
运行
复制
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))
options("repos" = c(CRAN="https://mirrors.aliyun.com/CRAN/"))
options(download.file.method = 'libcurl')
options(url.method='libcurl')
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("multiMiR",ask = F,update = F)

安装并且加载multiMiR后,可以看到multiMiR的更新历史:

代码语言:javascript
代码运行次数:0
运行
复制
> library(multiMiR)
> db.ver = multimir_dbInfoVersions()
> db.ver[,1:3]
  VERSION    UPDATED                      RDA
1   2.3.0 2020-04-15 multimir_cutoffs_2.3.rda
2   2.2.0 2017-08-08 multimir_cutoffs_2.2.rda
3   2.1.0 2016-12-22 multimir_cutoffs_2.1.rda
4   2.0.0 2015-05-01     multimir_cutoffs.rda

这也就是我为什么推荐它的原因,首先当然是因为基于R,无需理会讨厌的网页工具,其次,它最近一次更新是2020-04-15 ,疫情如此严重,还坚持更新,值得鼓励!

当然,需要R编程基础从看得懂这个包的用法,有一个学习班推荐给大家:

miRWalk是12个网页工具的集合

如果你确实不喜欢R语言,也不想学,当然也可以使用网页工具哈:

一篇2018年6月的文章利用该miRWalk工具,选择被7个工具预测到的MiRNA–mRNA相互作用关系作为最后的结果。文献标题是:FABP4 as a key determinant of metastatic potential of ovarian cancer,网页工具描述如下:

miRWalk2.0 not only documents miRNA binding sites within the complete sequence of a gene, but also combines this information with a comparison of binding sites resulting from 12 existing miRNA-target prediction programs (DIANA-microTv4.0, DIANA-microT-CDS, miRanda-rel2010, mirBridge, miRDB4.0, miRmap, miRNAMap, doRiNA i.e.,PicTar2, PITA, RNA22v2, RNAhybrid2.1 andTargetscan6.2) to build novel comparative platforms of binding sites for the promoter (4 prediction datasets), cds (5 prediction datasets), 5’- (5 prediction datasets) and 3’-UTR (13 prediction datasets) regions. It also documents experimentally verified miRNA-target interaction information collected via an automated text-mining search and data from existing resources (miRTarBase, PhenomiR,miR2Disease and HMDD) offer such information.

其实还有 miRSystem 整合了其他的预测软件: DIANA, miRanda, miRBridge, PicTar, PITA, rna22和TargetScan,包含TarBase和miRecords的验证数据。

当然了,各取所需,完成科研目标为主!

但是,我们要推荐的multiMiR,有14个数据库源哦。

multiMiR的数据库源头

来自于:http://multimir.org/,数据库的详细网址如下:

代码语言:javascript
代码运行次数:0
运行
复制
                                                                                source_url
1           http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=microT_CDS/index
2                                  http://www.mirz.unibas.ch/miRNAtargetPredictionBulk.php
3                http://www.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download.pl
4                                                               http://www.mir2disease.org
5                                         http://www.microrna.org/microrna/getDownloads.do
6                                                                         http://mirdb.org
7                                                http://mirecords.biolead.org/download.php
8                                       http://mirtarbase.mbc.nctu.edu.tw/php/download.php
9                                       http://www.pharmaco-mir.org/home/download_VERSE_db
10                                             http://mips.helmholtz-muenchen.de/phenomir/
11                                                             http://dorina.mdc-berlin.de
12                                  http://genie.weizmann.ac.il/pubs/mir07/mir07_data.html
13 http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=tarbasev8%2Findex
14               http://www.targetscan.org/cgi-bin/targetscan/data_download.cgi?db=vert_61

收录了常见模式生物,人,小鼠,大鼠的miRNA数据

代码语言:javascript
代码运行次数:0
运行
复制
> db.count
       map_name human_count mouse_count rat_count total_count
1  diana_microt     7664602     3747171         0    11411773
2         elmmo     3959112     1449133    547191     5955436
3     microcosm      762987      534735    353378     1651100
4   mir2disease        2875           0         0        2875
5       miranda     5429955     2379881    247368     8057204
6         mirdb     1990425     1091263    199250     3280938
7     mirecords        2425         449       171        3045
8    mirtarbase      544588       50673       652      595913
9  pharmaco_mir         308           5         0         313
10     phenomir       15138         491         0       15629
11       pictar      404066      302236         0      706302
12         pita     7710936     5163153         0    12874089
13      tarbase      433048      209831      1307      644186
14   targetscan    13906497    10442093         0    24348590

从miRNA到mRNA

查询自己感兴趣的一个miRNA有哪些靶基因

注意,这个时候的miRNA的ID是有规则的哦,miRNA成熟体简写成miR,再根据其物种名称,及被发现的先后顺序加上阿拉伯数字,如hsa-miR-122;高度同源的miRNA在数字后机上英文小写字母(a,b,c,…),如hsa-miR-34a,hsa-miR-34b,hsa-miR-34c等;通常一个miRNA前体长度大约为70~80nt,很可能两个臂分别产生miRNA,则继续在名称之后加上-5p/-3p等,如hsa-miR-122-5p。

所以下面代码里面的例子miRNA的ID是 hsa-miR-18a-3p你应该是明白了的!

代码语言:javascript
代码运行次数:0
运行
复制
# The default is to search validated interactions in human
example1 <- get_multimir(mirna = 'hsa-miR-18a-3p', summary = TRUE)
names(example1)
# Check which types of associations were returned
table(example1@data$type)
# Detailed information of the validated miRNA-target interaction
head(example1@data)
dim(example1@data)
# Which interactions are supported by Luciferase assay?
example1@data[grep("Luciferase", example1@data[, "experiment"]), ]
example1@summary[example1@summary[,"target_symbol"] == "KRAS",]

既然可以查询一个miRNA,当然是可以批量查询多个,示例代码如下,top_miRNAs是差异分析后挑选的miRNA的ID组成的向量:

代码语言:javascript
代码运行次数:0
运行
复制
multimir_results <- get_multimir(org     = 'mmu',
                                 mirna   = top_miRNAs,
                                 table   = 'validated',
                                 summary = TRUE)

从mRNA到miRNA

查询 自己感兴趣的一个或者多个基因由哪些miRNA调控,代码分别如下:

代码语言:javascript
代码运行次数:0
运行
复制
example3 <- get_multimir(org     = "mmu",
                         target  = "Gnb1",
                         table   = "predicted",
                         summary = TRUE,
                         predicted.cutoff      = 35,
                         predicted.cutoff.type = "p",
                         predicted.site        = "all")
names(example3)
table(example3@data$type)
head(example3@data)
head(example3@summary)


apply(example3@summary[, 6:13], 2, function(x) sum(x > 0))


example4 <- get_multimir(org     = 'hsa',
                         target  = c('AKT2', 'CERS6', 'S1PR3', 'SULF2'),
                         table   = 'predicted',
                         summary = TRUE,
                         predicted.cutoff.type = 'n',
                         predicted.cutoff      = 500000)

example4.counts <- addmargins(table(example4@summary[, 2:3]))
example4.counts <- example4.counts[-nrow(example4.counts), ]
example4.counts <- example4.counts[order(example4.counts[, 5], decreasing = TRUE), ]
head(example4.counts)

因为查询的数据集,虽然记录了miRNA和mRNA的关系,但有很多筛选阈值可以选择,就需要熟练掌握数据库源头。

从miRNA到疾病或者药物

主要是数据库记录:

代码语言:javascript
代码运行次数:0
运行
复制
example2 <- get_multimir(disease.drug = 'cisplatin', table = 'disease.drug')
names(example2)
nrow(example2@data)
table(example2@data$type)
head(example2@data)

miRNA集合是否调控mRNA集合

代码语言:javascript
代码运行次数:0
运行
复制
load(url("http://multimir.org/bladder.rda"))

## ----Example5_part2, eval=TRUE, echo=TRUE---------------------------------------------------------
# search all tables & top 10% predictions
example5 <- get_multimir(org     = "hsa",
                         mirna   = DE.miRNA.up,
                         target  = DE.entrez.dn,
                         table   = "all",
                         summary = TRUE,
                         predicted.cutoff.type = "p",
                         predicted.cutoff      = 10,
                         use.tibble = TRUE)

table(example5@data$type)
result <- select(example5, keytype = "type", keys = "validated", columns = columns(example5))
unique_pairs <- 
  result[!duplicated(result[, c("mature_mirna_id", "target_entrez")]), ]

result

## ----Example5_part4, eval=TRUE, echo=TRUE---------------------------------------------------------
mykeytype <- "disease_drug"

mykeys <- keys(example5, keytype = mykeytype)
mykeys <- mykeys[grep("bladder", mykeys, ignore.case = TRUE)]

result <- select(example5, keytype = "disease_drug", keys = mykeys,
                 columns = columns(example5))
result

## ----Example5_part4_fortext, echo=FALSE, include=FALSE, eval=TRUE---------------------------------
unique_pairs <- 
  result[!duplicated(apply(result[, c("mature_mirna_id", "disease_drug")], 2,
                           tolower)), ]

一个示例

下面是使用edgeR包,对普通的转录组counts表达矩阵(miRNA)做差异分析,并且拿到感兴趣的miRNA基因集:

代码语言:javascript
代码运行次数:0
运行
复制
library(edgeR)
library(multiMiR)

# Load data
counts_file  <- system.file("extdata", "counts_table.Rds", package = "multiMiR")
strains_file <- system.file("extdata", "strains_factor.Rds", package = "multiMiR")
counts_table   <- readRDS(counts_file)
strains_factor <- readRDS(strains_file)
table(strains_factor)

# Standard edgeR differential expression analysis
design <- model.matrix(~ strains_factor)

# Using trended dispersions
dge <- DGEList(counts = counts_table)
dge <- calcNormFactors(dge)
dge$samples$strains <- strains_factor
dge <- estimateGLMCommonDisp(dge, design)
dge <- estimateGLMTrendedDisp(dge, design)
dge <- estimateGLMTagwiseDisp(dge, design)

# Fit GLM model for strain effect
fit <- glmFit(dge, design)
lrt <- glmLRT(fit)

# Table of unadjusted p-values (PValue) and FDR values
p_val_DE_edgeR <- topTags(lrt, adjust.method = 'BH', n = Inf)

# Getting top differentially expressed miRNA's
top_miRNAs <- rownames(p_val_DE_edgeR$table)[1:10]

有了感兴趣的miRNA基因集,就可以查询它们的靶基因

代码语言:javascript
代码运行次数:0
运行
复制
library(multiMiR)
# Plug miRNA's into multiMiR and getting validated targets
multimir_results <- get_multimir(org     = 'mmu',
                                 mirna   = top_miRNAs,
                                 table   = 'validated',
                                 summary = TRUE)
head(multimir_results@data)
table(multimir_results@data$mature_mirna_id)
dim(multimir_results@data)

是不是非常方便,有了multiMiR包后!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
🤩 miRTalk | 单细胞miRNA推断及细胞间通讯!~
3️⃣ 第三部分是可视化miRNA介导的细胞间通讯网络和miRNA-靶点相互作用网络。
生信漫卷
2025/05/19
700
🤩 miRTalk | 单细胞miRNA推断及细胞间通讯!~
miRNA分析流程学习(三)/miRNA靶基因预测-ENCORI数据库数据下载
获得miRNA之后就需要尝试去预测它们的作用靶点了,一般我们会采用多数据库整合分析,这次先介绍一下ENCORI数据库,这个数据库的优势之一在于它已经整合了多个数据库的数据。
凑齐六个字吧
2024/10/29
4330
miRNA分析流程学习(三)/miRNA靶基因预测-ENCORI数据库数据下载
如何预测miRNA靶基因(miRWalk2.0数据库)
miRWalk2.0是miRWalk数据库的改进版本。 miRWalk2.0可以提供最全面的预测和实验验证的miRNA-mRNA相互作用,可以极大地帮助研究者对miRNA进行研究。miRWalk2.0不仅记录了基因完整序列中的miRNA结合位点,还可以将这些信息与12个现有miRNA-mRNA相互作用数据库:DIANA-microTv4.0,DIANA-microT-CDS, miRanda-rel2010,mirBridge,miRDB4.0,miRmap,miRNAMap,doRiNA即PicTar2,PITA,RNA22v2,RNAhybrid2.1和Targetscan6.2)构建基于promoter (4 prediction datasets), cds (5 prediction datasets), 5’- (5 prediction datasets) and 3’-UTR (13 prediction datasets) 。它还记录了通过自动文本挖掘搜索收集的实验验证的miRNA-mRNA相互作用信息,同时也有来自有资源(miRTarBase,PhenomiR,miR2Disease和HMDD)。
用户1359560
2019/07/04
2.4K0
如何预测miRNA靶基因(miRWalk2.0数据库)
一篇文章学会miRNA-seq分析
第一讲:文献选择与解读 前阵子逛BioStar论坛的时候看到了一个关于miRNA分析的问题,提问者从NCBI的SRA中下载文献提供的原始数据,然后处理的时候出现了问题。我看到他列出的数据来自iron torrent测序仪,而且我以前也没有做过miRNA-seq的数据分析, 就自学了一下。因为我有RNA-seq的基础,所以理解学习起来比较简单。 在这里记录自己的学习过程,希望对需要的朋友有帮助。 这里选择的文章是2014年发表的,作者用ET-1刺激human iPSCs (hiPSC-CMs) 细胞前后,观察
生信技能树
2018/03/08
16.1K0
一篇文章学会miRNA-seq分析
RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!
生信技能树
2022/07/26
18.2K0
RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较
miRNA数据库荟萃,研究miRNA的看过来!
如今的生物学研究已经离不开生物信息学的辅佐,这里老谈给大家介绍目前研究miRNA的一些在线数据库,看看它们是如何帮助你们在摸爬滚打中找准方向的。这些数据库中既有“进口”冲锋枪miRbase,又不乏“国产”战斗机starbase。每一个数据库的功能又不尽相同,既有分子间相互作用的预测,又有对已报道实验结果的总结和整合。
生信交流平台
2020/10/23
2.6K0
miRNA数据库荟萃,研究miRNA的看过来!
mirbase数据库简介
miRbase 是由曼彻斯特大学的研究人员开发的一个在线的miRNA数据库,该数据库中收录了来自200多个物种,接近4万个miRNA的信息,是最全面的miRNA数据库,网址如下
生信修炼手册
2020/05/08
2.7K0
mirbase数据库简介
使用miRNAtap数据源提取miRNA的预测靶基因结果
今天我们比较一下另外的一个miRNAtap包,与multiMiR的结果的一致性,以及两个数据库的差异!首先安装miRNAtap包,代码如下:
生信技能树
2020/04/21
1.7K0
使用miRNAtap数据源提取miRNA的预测靶基因结果
GEO数据挖掘之转录组测序数据流程-以GSE150392为例
这个包里可以画pca, 热图,火山图,韦恩图,具体每个图的算法,可以看生信技能树GEO芯片分析
生信技能树
2022/06/08
2.6K1
GEO数据挖掘之转录组测序数据流程-以GSE150392为例
WGCNA仅仅是划分基因模块,其它都是附加分析
曾老师给我分享了一篇数据挖掘的文章,里面的WGCNA非常奇怪,我之前没见过这样的模块与表型的相关性热图
生信技能树
2023/09/04
1.4K0
WGCNA仅仅是划分基因模块,其它都是附加分析
miRTarBase:实验验证的miRNA靶基因数据库
miRTarBase是一个手工收集的,经过实验验证过的miRNA靶基因数据库,网址如下
生信修炼手册
2020/05/08
1.2K0
miRTarBase:实验验证的miRNA靶基因数据库
推荐 38个miRNA数据库
本文介绍了microRNA的生物信息学数据库,包括microRNA的预测、实验和临床等数据库。其中,mirbase是第一个microRNA数据库,已发展成为最大的小RNA数据库,包括了10000多个microRNA。其它数据库如targetscan、microrna.org、miRTarBase、miRanda等也是比较常用的microRNA数据库。这些数据库可以帮助研究人员更好地了解microRNA的生物学功能,预测靶基因,并指导药物设计和疾病治疗等。
企鹅号小编
2018/01/09
3.8K0
转录组差异分析—基本流程
读取RawCounts.csv文件,其文件形式如下图行名为ensembleid,列名为样本名称。
sheldor没耳朵
2024/07/29
2620
转录组差异分析—基本流程
加权基因共表达网络分析(WGCNA)实例
这里运行R语言包GDCRNATools的帮助文档中的例子获得胆管癌的rna表达矩阵
用户7010445
2020/03/23
2.6K0
加权基因共表达网络分析(WGCNA)实例
GDCRNATools--一个R包就能解决TCGA数据处理和可视化!
GDCRNATools是一个易于使用的用于整合GDC中lncRNA、mRNA和miRNA数据的R/Bioconductor软件包。
作图丫
2022/03/29
2.2K0
GDCRNATools--一个R包就能解决TCGA数据处理和可视化!
文献笔记六十一:分析GDC数据库中的数据的R语言包GDCRNATools
GDCRNATools: an R/Bioconductor package for integrative analysis of lncRNA, miRNA and mRNA data in GDC Department of Botany and Plant Sciences, University of California, Riverside Bioinformatics
用户7010445
2020/03/19
1.6K0
文献笔记六十一:分析GDC数据库中的数据的R语言包GDCRNATools
【收藏】23个circRNA数据库网址
circRNA很红,这个大家都知道。尤其是它身上那份高大上的神秘感,引得一众科学家瞬间产生扑倒circRNA的好奇感,并期望能看到该领域中更多不一样的风景。
生信交流平台
2020/08/05
5.7K0
经典教程:全转录数据分析实战
本文介绍全转录组数据分析方法,我们将以拟南芥测序数据为例,在 UseGalaxy.cn 云平台进行数据分析实践。
简说基因
2024/04/03
3260
经典教程:全转录数据分析实战
TargetScan:哺乳动物miRNA靶基因数据库
哺乳动物中的miRNA通过结合转录本序列的3’UTR区,从而发挥转录后调控作用。TargetScan是一个专门分析哺乳动物miRNA靶基因的软件,并且根据已有的分析结果整理成了数据库,网址如下
生信修炼手册
2020/05/08
2.4K0
TargetScan:哺乳动物miRNA靶基因数据库
送你一篇TCGA数据挖掘文章
UCSC Xena网址:https://xena.ucsc.edu/public-hubs/
生信技能树
2018/12/24
4.4K6
推荐阅读
相关推荐
🤩 miRTalk | 单细胞miRNA推断及细胞间通讯!~
更多 >
目录
  • miRWalk是12个网页工具的集合
  • 从miRNA到mRNA
    • 查询自己感兴趣的一个miRNA有哪些靶基因
  • 从mRNA到miRNA
  • 从miRNA到疾病或者药物
  • miRNA集合是否调控mRNA集合
  • 一个示例
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档