Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用FUSION进行TWAS分析

使用FUSION进行TWAS分析

作者头像
生信修炼手册
发布于 2020-05-07 08:01:10
发布于 2020-05-07 08:01:10
4K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

FUSION是一款进行TWAS分析的软件,对应的文章发表在nature genetic上,链接如下

https://www.nature.com/articles/ng.3506

软件的官网如下

http://gusevlab.org/projects/fusion/

该软件同时支持对单个样本和多个样本的gwas cohort中的样本进行基因型填充,对应的流程图如下

首先对reference panel中进行建模,对于每个基因,筛选对应的cis-snp, 即在该基因上下游1Mb范围内的snp位点,通过不同的模型构建cis-SNPs和对应的gene之间的关系,接下来对gwas cohort中的样本进行填充,如上图中A所示,对于单个样本,根据其cis-SNPs的基因分析结果,预测对应基因的表达量,然后与表型性状进行关联分析;如上图中B所示,对于大量样本的gwas summary数据,考虑了SNP的连锁情况,根据cis-SNP和gene的关系,直接预测基因和性状之间的关联效应。

该软件采用R语言进行开发,基本用法如下

1. 利用reference panel建模

通过不同的模型,计算cis-SNPs和基因的关系,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Rscript FUSION.compute_weights.R \
--bfile $INP \
--tmp $TMP \
--out $OUT \
--models top1,blup,bslmm,lasso,enet

bfile参数指定plink格式的基因分型结果,tmp参数指定临时文件存放的目录,out参数指定输出文件的目录,运行成功后,在输出结果的目录,每个基因都会生成1个后缀为RDat的文件。接下来需要生成一个profile文件,首先准备一个list文件,每一行为一个基因对应的RData文件的路径,示意如下

运行以下命令生成profile

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Rscript utils/FUSION.profile_wgt.R  GTEx.Whole_Blood.list

对于GTEx, TCGA等公共数据,官网提供了事先构建好的模型

根据自己的细胞、组织类型,下载对应的数据集。

2. 对gwas cohort进行TWAS分析

代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Rscript FUSION.assoc_test.R \
--sumstats PGC2.SCZ.sumstats \
--weights ./WEIGHTS/GTEx.Whole_Blood.pos \
--weights_dir ./WEIGHTS/ \
--ref_ld_chr ./LDREF/1000G.EUR. \
--chr 22 \
--out PGC2.SCZ.22.dat

sumstats参数指定gwas队列样本的SNP分型结果,文件内容示意如下

weights指定基因的位置信息,内容示意如下

weights_dir参数指定基因RDat文件所在的目录,ref_ld_chr指定LD文件, 通常使用1000G的LD reference data, chr参数指定分析的染色体,out参数指定输出的结果。

输出结果列数很多,官网给出每一列的详细解释

FUSION使用的较为广泛,还有人用这个软件分析了很多gwas summary数据,做成了数据库twas-hub, 后续在详细介绍这个数据库。

·end·

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
◉ gsMap 首先使用图神经网络 (GNN) 学习嵌入表示,这些嵌入整合了基因表达水平、空间坐标,并可选地整合细胞类型注释先验信息。◉ 随后,gsMap 根据嵌入中的余弦相似性为每个位点识别同质位点,以形成一个微区域。◉ 每个位点依次被视为焦点位点,并通过将基因在微区域内的平均排名除以其在整个空间转录组 (ST) 切片中的平均排名,计算每个基因在每个焦点位点的特异性得分。◉ D,位点的微区域;F,基因表达特异性;G,位点空间图;R,排名;X,基因表达矩阵;Z,嵌入表示。◉ 然后,基于每个位点的 GSS(基因空间特异性得分)与其到转录起始位点 (TSS) 的距离以及 SNP 到基因的链接图,将这些 GSS 映射到单核苷酸多态性 (SNP),从而为每个位点生成一组独特的 SNP 注释。◉ 对于每个位点的 SNP GSS 注释,gsMap 使用分层连锁不平衡回归 (S-LDSC) 来评估具有更高 GSS 的 SNP 是否对目标性状的遗传力有显著富集。◉ LD,连锁不平衡。◉ 为了量化某个空间区域与性状关联的显著性,gsMap 使用柯西组合检验来聚合该空间区域内位点的 P 值。
生信菜鸟团
2025/05/23
2170
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
用 LDSC 计算遗传度以及遗传相关性
•精神分裂症的 LD Score 回归截距•精神分裂症的 SNP 遗传度•精神分裂症和躁郁症之间的遗传相关性
生信菜鸟团
2020/07/29
12.5K1
用 LDSC 计算遗传度以及遗传相关性
LDSC分析实战
通过对单个表型的GWAS分析结果进行连锁不平衡回归分析,可以鉴定是否存在混淆因素,同时估计遗传力的大小;对于多个不同表型的GWAS分析结果进行分析,则可以计算表型间的遗传相似度。
生信修炼手册
2019/12/19
4K0
LDSC分析实战
TwoSampleMR:孟德尔随机化一站式分析
包如其名,TwoSampleMR主要是为两样本孟德尔随机化分析而准备的,在应用这个包以前,我们来看看它的核心函数及其功能:
生信菜鸟团
2023/08/23
6.7K0
TwoSampleMR:孟德尔随机化一站式分析
多基因风险评分(PRS)分析教程
多基因风险评分(Polygenic Risk Score)分析过程概览。PRS 分析需要两个输入数据集:i)base data(GWAS):全基因组范围内遗传变异的基因型-表型关联的摘要统计信息(例如 beta,P值) ;ii)target data:目标样本中个体的基因型和表型。基于 base data 得到的 SNP 效应值计算 target data 中样本的 PRS。
生信菜鸟团
2020/08/04
16.4K0
多基因风险评分(PRS)分析教程
GWAS大家都耳熟能详, TWAS又是何方神圣
GWAS称之为全基因组关联分析,是研究复杂疾病遗传易感性的一种方法,已经广泛应用于各种复杂疾病中,识别到了许多与疾病相关的SNP位点,然而GWAS识别到的很多SNP位点很多位于非编码区,位于非编码区的基因,也由于连锁不平衡的存在,无法确切定位致病的候选基因。只基于gwas的结果,仅能给出候选的染色体区域。
生信修炼手册
2020/05/07
4.5K0
R语言实现eQTL分析
今天给大家介绍一个GWAS分析过程中的一个重要的环节eQTL(表达数量性状位点)分析。eQTL指的是染色体上一些能特定调控mRNA和蛋白质表达水平的区域,其mRNA/蛋白质的表达水平量与数量性状成比例关系,通俗点讲就是把基因表达作为一种性状,研究遗传突变与基因表达的相关性。
一粒沙
2019/07/31
10.1K0
【孟德尔随机化药靶分析】SMR分析
首先要明确SMR分析需要准备哪些文件?为了方便大家去SMR官方网站查找资料时有所参照,我尽量使用官网原文,附上相应的解说:
生信菜鸟团
2023/11/22
7.7K2
【孟德尔随机化药靶分析】SMR分析
FINEMAP:使用GWAS摘要数据进行无功能注释数据的精细定位(Fine-mapping)
全基因组关联分析(GWAS)是非常流行的定位表型或疾病遗传位点方法。不过很多情况下,GWAS 发现的最显著的 SNP(top SNP 或者 index SNP)并不是真正造成影响的causal SNP(因果SNP),而是因为跟 causal SNP 之间存在的 LD 而变得显著。因而,后续还需要对结果进行 fine-mapping(精细定位),把 causal SNP找到。
实验盒
2021/09/22
5.6K1
FINEMAP:使用GWAS摘要数据进行无功能注释数据的精细定位(Fine-mapping)
用 Matrix eQTL 进行 eQTL 分析
eQTL 分析是常用的多组学整合分析方法,使我们可以将基因表达水平的变化与基因型联系起来,有助于揭示生命系统的生理生化过程,发现导致某些疾病的遗传因素,以及确定受他们影响的生物学通路。
生信菜鸟团
2020/05/20
9.1K0
用 Matrix eQTL 进行 eQTL 分析
如何在Windows电脑上使用LDSC软件(3) ------ LDSC实操与结果解读
前两期的内容带大家学习了如何在windows系统上安装Linux子系统以及LDSC的安装,今天我将带大家正式开展LDSC分析并解读相关结果。
生信与临床
2022/08/21
4.2K4
如何在Windows电脑上使用LDSC软件(3) ------ LDSC实操与结果解读
R语言做基因表达量和变异位点的关联分析eQTL
http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
用户7010445
2024/05/09
2660
R语言做基因表达量和变异位点的关联分析eQTL
跟着Nature Genetics学GWAS分析:emmax软件gwas分析/qqman包展示结果
https://www.nature.com/articles/s41588-023-01340-y
用户7010445
2023/08/23
7290
跟着Nature Genetics学GWAS分析:emmax软件gwas分析/qqman包展示结果
PRS多基因评分教程学习笔记(二)
之前学习了Base Data质控过程,下面继续,最近一直没有开启博客写作,十月将过,加紧补点。
用户1075469
2020/03/03
2.4K0
文献导读(二):循环炎症细胞因子与五种癌症的风险:孟德尔随机分析
作者团队曾进行过一项研究:从北芬兰 1966 年出生队列(NFBC1966)、芬兰年轻人心血管风险研究(YFS)以及 1997 年和 2002 年的 FINRISK 研究的样本中获得了47种炎性因子的GWAS数据。
生信菜鸟团
2023/09/09
2.2K0
文献导读(二):循环炎症细胞因子与五种癌症的风险:孟德尔随机分析
不会安装使用PRSice-2软件就太不讲究了
之前说要学习PRS,研究了一下,发现它和MAS、GWAS、GS都有相通之处,尤其是MAS,对于分子标记辅助选择,选择最适合的位点进行表型数据的预测,真是一个非常好的工具,它可以自动考虑LD冗余,矫正effect,选择最优子集,并给出目标群体(候选群)的预测值。
邓飞
2022/12/13
9141
不会安装使用PRSice-2软件就太不讲究了
GWAS分析竟然发表6分的文章!!!
大家好,gwas分析目前已经很普及,很多育种群体非常适合gwas的数据挖掘,很多人类群体也非常适合gwas的位点挖掘。
邓飞
2024/04/10
3310
GWAS分析竟然发表6分的文章!!!
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
本篇,使用数据和代码演示的形式,展示了GWAS分析、群体结构分析、亲缘关系分析三部分内容。我又重演了一遍,修正了一些bug。文中代码和数据我回头专门整理相关博文进行分享。
邓飞
2022/12/12
4K0
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
想要进行gene prioritization分析,请看这里!
通过GWAS分析可以识别到与性状关联的SNP位点,然而从生物学角度出发,我们更想了解的是哪些基因或者通路导致了这些位点与性状的关联现象。为了解决这一问题,科学家们发明了DEPICT这款软件,通过预测基因的功能来对GWAS的结果进行解释。
生信修炼手册
2019/12/19
1.5K0
想要进行gene prioritization分析,请看这里!
FUMA:基因关联的功能图谱和注释
SNP2GENE 功能将 GWAS 统计摘要作为输入,并为主导 SNPs 确定的基因组区域中的所有 SNPs 提供广泛的功能注释。
生信菜鸟团
2024/07/31
1.5K0
FUMA:基因关联的功能图谱和注释
推荐阅读
相关推荐
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验