前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)

使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)

作者头像
用户7010445
发布2024-05-27 20:27:12
1130
发布2024-05-27 20:27:12
举报

paragraph软件对应的论文

Paragraph: a graph-based structural variant genotyper for short-read sequence data

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1909-7

软件对应的github主页

https://github.com/Illumina/paragraph

软件可以直接使用conda进行安装

参考基因组、变异vcf文件、二代测序数据 下载自链接

https://s3-us-west-2.amazonaws.com/human-pangenomics/index.html?prefix=publications/vgsv2019/simulation/

来源于论文

Genotyping structural variants in pangenome graphs using the vg toolkit

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-1941-7

参考代码也来源于这篇论文,链接是

https://github.com/vgteam/sv-genotyping-paper/blob/master/simulation/genotype-other-methods.sh

有了参考基因组、已知结构变异的vcf文件、和一些样本的二代测序数据,对已知的结构变异进行基因型分型

第一步是二代测序数据与参考基因组进行比对

代码语言:javascript
复制
bwa index ref.fa
bwa mem ref.fa s2.fastq.gz -p -R "@RG\tID:$s2\tSM:s2" -t 8 | samtools sort - > s2.bam
bwa mem ref.fa s1.fastq.gz -p -R "@RG\tID:$s1\tSM:s1" -t 8 | samtools sort - > s1.bam

samtools index s2.bam
samtools index s1.bam

第二步是准备配置文件

配置文件的内容如下

代码语言:javascript
复制
id,path,depth,read length
s10,s1.bam,20,150
s20,s2.bam,20,150

运行paragraph

代码语言:javascript
复制
multigrmpy.py -m samples_for_paragraph.txt -i truth.vcf -r ref.fa -o paragraph.output -t 8

输出文件的内容

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档