Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >GENESPACE优雅的绘制基因组共线性图

GENESPACE优雅的绘制基因组共线性图

作者头像
R语言数据分析指南
发布于 2023-07-11 05:40:04
发布于 2023-07-11 05:40:04
1.6K0
举报

欢迎关注R语言数据分析指南

本节来介绍一个用于了解多个基因组的同线性和直系同源模式分析及可视化的R包GENESPACE,软件运行需要依赖其它软件如OrthoFinder、MCScanX等,分析环境配置可以一站式完成数据的分析及可视化同时具有很高的自定性。小编下面进行部分的结果展示,软件安装等更多的详细内容请参考作者的官方文档。

官方文档

https://github.com/jtlovell/GENESPACE

(https://htmlpreview.github.io/?https://github.com/jtlovell/tutorials/blob/main/riparianGuide.html)

关注下方公众号下回更新不迷路

软件安装

代码语言:text
AI代码解释
复制
if (!requireNamespace("devtools", quietly = TRUE))
    install.packages("devtools")
devtools::install_github("jtlovell/GENESPACE")

library(GENESPACE)

定义软件路径

代码语言:text
AI代码解释
复制
genomeRepo <- "~/path/to/store/rawGenomes"
wd <- "~/path/to/genespace/workingDirectory"
path2mcscanx <- "~/path/to/MCScanX/"

下载基因组数据

代码语言:text
AI代码解释
复制
urls <- c(
  human ="000/001/405/GCF_000001405.40_GRCh38.p14/GCF_000001405.40_GRCh38.p14_",
  mouse = "000/001/635/GCF_000001635.27_GRCm39/GCF_000001635.27_GRCm39_",
  platypus = "004/115/215/GCF_004115215.2_mOrnAna1.pri.v4/GCF_004115215.2_mOrnAna1.pri.v4_",
  chicken = "016/699/485/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_",
  sandLizard = "009/819/535/GCF_009819535.1_rLacAgi1.pri/GCF_009819535.1_rLacAgi1.pri_")

genomes2run <- names(urls)
urls <- file.path("https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF", urls)
translatedCDS <- sprintf("%stranslated_cds.faa.gz", urls)
geneGff <- sprintf("%sgenomic.gff.gz", urls)

names(translatedCDS) <- genomes2run
names(geneGff) <- genomes2run
writeDirs <- file.path(genomeRepo, genomes2run)
names(writeDirs) <- genomes2run
for(i in genomes2run){
  print(i)
  if(!dir.exists(writeDirs[i]))
    dir.create(writeDirs[i])
  download.file(
    url = geneGff[i], 
    destfile = file.path(writeDirs[i], basename(geneGff[i])))
  download.file(
    url = translatedCDS[i], 
    destfile = file.path(writeDirs[i], basename(translatedCDS[i])))
}

解析基因组注释文件

代码语言:text
AI代码解释
复制
genomes2run <- c("human", "mouse", "platypus", "chicken", "sandLizard")
parsedPaths <- parse_annotations(
  rawGenomeRepo = genomeRepo,
  genomeDirs = genomes2run,
  genomeIDs = genomes2run,
  presets = "ncbi",
  genespaceWd = wd)

软件运行

代码语言:text
AI代码解释
复制
gpar <- init_genespace(
  wd = wd,
  ploidy = 1, 
  path2mcscanx = path2mcscanx)
out <- run_genespace(gpar, overwrite = T)

数据可视化

代码语言:text
AI代码解释
复制
ripDat <- plot_riparian(
  gsParam = out, 
  refGenome = "human", 
  forceRecalcBlocks = FALSE)
代码语言:text
AI代码解释
复制
ripDat <- plot_riparian(
  out, 
  refGenome = "human",
  useOrder = FALSE, 
  useRegions = FALSE)
更改顺序
代码语言:text
AI代码解释
复制
ripDat <- plot_riparian(
  gsParam = out, 
  refGenome = "mouse",
  genomeIDs = c("mouse", "human", "platypus", "chicken"), 
  forceRecalcBlocks = FALSE)
调整排序
代码语言:text
AI代码解释
复制
ripDat <- plot_riparian(
  gsParam = out, 
  #reorderBySynteny = FALSE,
  syntenyWeight = 0,
  refGenome = "human")

自定义标签

代码语言:text
AI代码解释
复制
ggthemes <- ggplot2::theme(
  panel.background = ggplot2::element_rect(fill = "white"))
customPal <- colorRampPalette(
  c("darkorange", "skyblue", "darkblue", "purple", "darkred", "salmon"))
ripDat <- plot_riparian(
  gsParam = out, 
  palette = customPal,
  braidAlpha = .75,
  chrFill = "lightgrey",
  addThemes = ggthemes,
  refGenome = "human")
部分区域高亮展示
代码语言:text
AI代码解释
复制
roi <- data.frame(
  genome = c("human", "chicken"), 
  chr = c("X", "Z"), 
  color = c("#FAAA1D", "#17B5C5"))
ripDat <- plot_riparian(
  gsParam = out, 
  highlightBed = roi,
  refGenome = "human", 
  genomeIDs = c("sandLizard", "chicken", "human", "mouse", "platypus"),
  customRefChrOrder = c("X", 1:22))

可以看到内容还是非常的丰富,感兴趣的朋友可仔细阅读作者的官方文档;有需要学习R语言个性化数据可视化的朋友,欢迎到小编的淘宝店铺 R语言数据分析指南购买2023年度会员文档同步更新中售价149元,内容主要包括各种高分论文的图表分析复现以及一些个性化图表的绘制均包含数据+代码;按照往年数据小编年产出约在150+以上

购买后微信发小编订单截图即邀请进新的会员交流群,小编的文档为按年售卖,只包含当年度的除系列课程外的文档,有需要往年文档的朋友也可下单购买,需要了解更多信息的朋友欢迎交流咨询。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GENESPACE优雅的绘制基因组共线性图
R语言数据分析指南
2023/08/18
1.1K0
GENESPACE优雅的绘制基因组共线性图
R语言里做基因组共线性可视化R包~GENESPACE
https://www.biorxiv.org/content/10.1101/2022.03.09.483468v1
用户7010445
2022/04/08
1.2K0
R语言里做基因组共线性可视化R包~GENESPACE
数据分析:基因突变瀑布图统计以及可视化
生信学习者
2024/11/19
1310
数据分析:基因突变瀑布图统计以及可视化
可视化—KEGG气泡图和桑葚图绘制
最近太忙了,其实有很多很多笔记需要整理,无奈实在没有时间进行。今天看到其他小伙伴的代码里绘制的KEGG气泡图和桑葚图觉得特别好看,就仔细扒一扒,写一篇笔记。
sheldor没耳朵
2025/06/30
1200
可视化—KEGG气泡图和桑葚图绘制
泛基因组比对教程
在本教程中,我们将把两个 Heliconius 蝴蝶物种的一条染色体(包含 optix 基因)与泛基因组进行比对。
数据科学工厂
2024/02/22
2940
泛基因组比对教程
编译|mummer2circos画环状细菌基因组圈图
mummer2circos 是一个用于绘制细菌基因组的圈图(circos 图)的工具。它基于 BLAST 或 NUCMER/PROMER 的比对结果,生成 SVG 和 PNG 格式的图像,可以直观地展示基因组的结构和特征。
用户1075469
2024/04/12
4030
编译|mummer2circos画环状细菌基因组圈图
Python版SCENIC转录因子分析(四)一文就够了
在升级了pySCENIC后,发现转录因子数据库更新了。因此本文基于更新后的转录因子数据库,再次记录了从软件部署到pySCENIC的运行,最后进行可视化的详细笔记,希望对大家有所帮助,少走弯路。
生信技能树
2023/02/27
17.7K0
Python版SCENIC转录因子分析(四)一文就够了
空间转录组2022||空间数据反卷积RTCD分析:细胞类型鉴定
RCTD可以将单细胞类型或细胞类型混合分配到空间转录组spots上。RCTD 有三种模式:
生信技能树jimmy
2022/11/24
4.6K0
空间转录组2022||空间数据反卷积RTCD分析:细胞类型鉴定
【直播】我的基因组58:用R包SNPRelate来对我的基因型跟hapmap计划数据比较
hapmap计划的人群分布结果和千人基因组计划的分布结果来分析是一样的!【直播】我的基因组55:简单的PCA分析千人基因组的人群分布 这两个计划里面收集的样本的种群信息都比较完善,而且每个样本的基因型
生信技能树
2018/03/08
2.2K0
【直播】我的基因组58:用R包SNPRelate来对我的基因型跟hapmap计划数据比较
基于Kallisto或Salmon的转录组定量流程
Kallisto和Salmon在RNA-seq数据分析中,相比于包含hisat2和STAR等软件的流程,展现出更高的处理速度。这主要归因于它们基于转录组序列reference(即cDNA序列)的特性和k mer比对原理。以下是关于Kallisto和Salmon在RNA-seq流程中速度优势的关键点归纳:
生信学习者
2024/06/13
2090
基于Kallisto或Salmon的转录组定量流程
生信代码:绘制基因组突变全景图
对于基因组突变全景图相信大家并不陌生,它是基因组学突变数据最基本的可视化展示方法之一。一张漂亮的,高大上的基因突变全景图不仅能展示出丰富的信息,还能为你的文章增色不少,其绘制方法也多种多样。今天我们则来看看最常用的两个包maftools和ComplexHeatmap在绘制基因组突变全景图上的异同。首先让我们来简单的了解下这两个包:
科研菌
2021/02/19
6.5K0
生信代码:绘制基因组突变全景图
基因组数据太难可视化?!快来看看这个工具吧~~
gggenomes是一款基于R语言的拓展工具包,旨在提供一套强大而灵活的工具,用于基因组数据的可视化与分析。gggenomes的设计理念源于ggplot2,它使用了类似于ggplot2的语法来创建精美的图形,并提供了丰富的功能和选项来满足不同类型的基因组数据可视化需求。
DataCharm
2023/08/23
1.1K0
基因组数据太难可视化?!快来看看这个工具吧~~
空间转录组数据注释分析:RCTD反卷积(Nature Biotechnology IF: 33.1)
本次使用数据为 hippocampus Visium 数据,首先,使用一个已经注释好的单细胞数据海马体数据集对空间数据用RCTD进行细胞注释,然后做区域差异表达分析
生信技能树
2025/04/06
6860
空间转录组数据注释分析:RCTD反卷积(Nature Biotechnology IF: 33.1)
pycirclize带你轻松绘制基因组图
R语言数据分析指南
2023/08/18
9981
pycirclize带你轻松绘制基因组图
gget:一款强大的基因组参考数据库的高效查询工具
开源 Python 和命令行程序 gget 可以高效、轻松地以编程方式访问存储在各种大型公共基因组参考数据库中的信息。 gget 与可获取用户生成的测序数据的现有工具一起使用 ,以取代在基因组数据分析过程中效率低下、可能容易出错的手动网络查询。虽然 gget 模块的灵感来自于繁琐的单细胞 RNA-seq 数据分析任务),但我们预计它们可用于广泛的生物信息学任务。
毅硕科技
2023/01/06
6340
gget:一款强大的基因组参考数据库的高效查询工具
基因集的转录因子富集分析
一般来说,大家拿到了感兴趣的基因集后,通常是做超几何分布检验看看富集到了什么生物学功能数据库,比如KEGG或者GO数据库,或者走gsea/gsva这样的富集分析,也是注释生物学功能数据库。大家读我的表达芯片的公共数据库挖掘系列推文应该是够多了:
生信技能树
2020/12/03
2.9K0
基因集的转录因子富集分析
一文读懂参考基因组和基因组注释+最全下载方法
自从 1990 启动的家喻户晓的人类基因组计划开始,全世界的科学家竭尽全力破译了第一个完整的人类基因组,从那时开始人类拿到了一本只有 ATCG 四个碱基书写的天书。后续人们逐步完善了基因组序列信息,并写在 Fasta 格式的文本文件“天书”中,这本天书就叫做参考基因组。
白墨石
2021/06/10
3.4K0
一文读懂参考基因组和基因组注释+最全下载方法
RcisTarget||转录因子结合基序富集
每对基因基序的得分可以用不同的参数来进行。因此,我们提供多个数据库(motif-rankings),根据以下几种可能性:
生信编程日常
2020/10/29
4.3K0
RcisTarget||转录因子结合基序富集
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
长读段比对算法与一代/二代测序数据的比对算法有很大的不同,因为长读段通常更长、包含更多错误和变异,并且需要更复杂的比对策略。
三代测序说
2023/10/26
1.5K1
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
irGSEA:基于秩次的单细胞基因集富集分析整合框架
许多Functional Class Scoring (FCS)方法,如GSEA, GSVA,PLAGE, addModuleScore, SCSE, Vision, VAM, gficf, pagoda2和Sargent,都会受数据集组成的影响,数据集组成的轻微变化将改变细胞的基因集富集分数。
生信技能树
2023/12/05
3.1K0
irGSEA:基于秩次的单细胞基因集富集分析整合框架
推荐阅读
相关推荐
GENESPACE优雅的绘制基因组共线性图
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档