Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用plink软件利用Fisher精确检验关联基因型和表型(GWAS)

使用plink软件利用Fisher精确检验关联基因型和表型(GWAS)

作者头像
用户7010445
发布于 2024-07-02 08:22:54
发布于 2024-07-02 08:22:54
31510
代码可运行
举报
运行总次数:0
代码可运行

最近看论文 Genetic subdivision and candidate genes under selection in North American grey wolves,论文里用33个狼的皮毛颜色作为表型去和基因型进行关联分析

方法部分写到

individuals. To test for associations between SNPs near coat colour genes and phenotypic variation within our samples, we performed a case/control association test using both the Fisher’s exact test for allelic association (–fisher) and the full model testing for differences in any genotypes, with permutations for assigning significance (–model –cell 0 –perm) within PLINK

最近发表的甘蓝的泛基因组论文中的关联分析也是用这种方法做的,论文

Large-scale gene expression alterations introduced by structural variation drive morphotype diversification in _Brassica oleracea_

方法部分写到

We adopted the case–control GWAS strategy, which was widely used in disease gene mapping for humans30,31, to identify SVs that were substantially associated with different morphotypes of B. oleracea. Briefly, a GWAS analysis was performed between the case group (individuals belonging to a specific morphotype) and the control group (individuals belonging to all the other morphotypes). Significance was tested by a two-tailed Fisher’s exact test and adjusted by Bonferroni correction.

还有一篇水稻的泛基因组论文也是用的这个方法,论文

Long-read sequencing of 111 rice genomes reveals significantly larger pan-genomes

方法部分写到

Fisher’s exact test was used to detect gene PAV-discrete phenotype associations, and theWilcoxon rank-sum test was used to detect gene PAV-continuous phenotype associations in R v4.0.2. P-values were adjusted using the FDR method, and a threshold of FDR < 0.05 was used to claim a significant gene PAV-phenotype association.

这个是用基因的pav矩阵来做的关联

在网上找了找plink做这个分析的教程

https://www.staff.ncl.ac.uk/heather.cordell/mres2020casecon.html

以下这个链接也可以参考

https://cloufield.github.io/GWASTutorial/06_Association_tests/#significant-loci

输入数据是一个ped文件

ped文件每列的介绍

第7列开始时基因型数据,每两列是一个位点,这个示例数据里是4个位点,所以是8列

还需要一个map文件

map格式介绍

plink做fisher精确检验的命令

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plink --ped caseconped.txt --map caseconmap.txt --fisher

输出文件

把vcf文件转换成 ped和map

表型数据是3列 family id 个体id 表型,表型数据的前两列直接用vcf文件里的样本id就可以了,分隔符是Tab或者空格

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plink --vcf ../rMVP/smoove_filtered.vcf --pheno pheno.txt --recode12 --allow-extra-chr --allow-no-sex --out smoove

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
老师您好,可以添加联系方式吗,有一些问题想咨询,感谢
老师您好,可以添加联系方式吗,有一些问题想咨询,感谢
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
笔记 | GWAS 操作流程3:plink关联分析--完结篇
注意,这里我使用的是ped和map格式,如果ped文件中有表型数据(第六列),如果想指定表型数据,用--pheno,包括三列:家系,个体,表型值。
邓飞
2020/05/13
9.3K1
文献笔记五十四:全基因组关联分析鉴定拟南芥中控制种子大小的调节因子
A new regulator of seed size control in Arabidopsis identified by a genome-wide association study New Phytologist 2019 Peking University
用户7010445
2020/03/03
2.1K0
bioinfo05-GWAS学习
发现plink2 和plink 差别还是挺大的,没什么plink2 教程,还是用老版。
北野茶缸子
2022/05/19
4440
bioinfo05-GWAS学习
plink软件cookbook
快,真的是快,我用perl或者Python编写的代码运行需要50s,plink不到1s完成,在C语言面前,我掌握的语言是苍白的。所以,好好利用plink软件,对于速度的提升非常显著。
邓飞
2021/03/30
2.2K0
plink软件cookbook
基于RAINBOW的单倍型全基因组关联分析(haplotype-based GWAS)教程
Haplotype-based GWAS(单倍型全基因组关联分析)是基于 haplotype (单倍型)进行的关联分析,在基因组层面寻找与表型相关的变异。
实验盒
2021/09/22
2.1K0
基于RAINBOW的单倍型全基因组关联分析(haplotype-based GWAS)教程
统计遗传学:第八章,基因型数据质控
大家好,我是飞哥,本章节是理论+实操,干货满满,这里我将书中的数据用代码进行了实现,你可以下载相关的数据,用我整理好的代码进行操作,666!
邓飞
2022/12/12
1.8K0
统计遗传学:第八章,基因型数据质控
跟着Nature Genetics学GWAS分析:emmax软件gwas分析/qqman包展示结果
https://www.nature.com/articles/s41588-023-01340-y
用户7010445
2023/08/23
7320
跟着Nature Genetics学GWAS分析:emmax软件gwas分析/qqman包展示结果
plink分析二分类Logistic的GWAS模型,表型值编码以及OR值意义
大家好,我是邓飞。之前编写的GWAS Cookbook很受欢迎(快来领取 | 飞哥的GWAS分析教程V6版),但是也有一些知识点很容易让人疑惑,这里挑选出来介绍一下。
邓飞
2024/11/26
6040
plink分析二分类Logistic的GWAS模型,表型值编码以及OR值意义
笔记 GWAS 操作流程6-2:手动计算GWAS分析中的GLM和Logistic模型
表型数据如果只有一个,可以放在plink文件的ped数据的第六列,也可以单独拉出来:
邓飞
2020/09/30
2.9K0
笔记 GWAS 操作流程6-2:手动计算GWAS分析中的GLM和Logistic模型
一文搞定基因型数据清洗
我已经下载整理好了,下载本书的电子版pdf+数据+代码,链接:书籍及配套代码领取--统计遗传分析导论
邓飞
2022/12/13
9400
一文搞定基因型数据清洗
GWAS_Flow:使用GPU加速全基因组关联分析
21世纪是生物的世纪,生物数据的增长速度越来越快。很多分析工具在开发时并没有考虑到大规模数据的应用场景。在数据量不大的时候,这些工具的计算时间并不会太长,可以让人接受。但在数据规模庞大时,可能就 hold 不住,等待时间让人发指。
实验盒
2021/09/22
9950
GWAS_Flow:使用GPU加速全基因组关联分析
统计遗传学:第七章,基因型数据格式介绍
BEAGLE 5.0: https://faculty.washington.edu/browning/beagle/beagle.html.
邓飞
2022/12/12
1.6K0
统计遗传学:第七章,基因型数据格式介绍
笔记 | GWAS 操作流程5-1:根红苗正的GWAS分析软件:GEMMA
这个肯定厉害了,是「大家闺秀」,是「名门望族」,是「根红苗正」的GWAS分析软件。
邓飞
2020/06/04
10.2K0
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
本篇,使用数据和代码演示的形式,展示了GWAS分析、群体结构分析、亲缘关系分析三部分内容。我又重演了一遍,修正了一些bug。文中代码和数据我回头专门整理相关博文进行分享。
邓飞
2022/12/12
4K0
统计遗传学:第九章,GWAS+群体分析+亲缘关系分析
如何使用plink进行二分类性状的GWAS分析并计算PRS得分
这篇博客,用之前GWAS教程中的示例数据(快来领取 | 飞哥的GWAS分析教程),把数据分为Base数据和Target数据,通过plink运行二分类的logistic模型进行GWAS分析,然后通过PRSice-2软件,进行PRS分析。最终,选出最优SNP组合,并计算Target的PRS得分,主要结果如下:
邓飞
2022/12/13
2.9K0
如何使用plink进行二分类性状的GWAS分析并计算PRS得分
如何计算群体中的单倍型频率
昨天写了一篇(单倍型的显著性分析)的博文,里面介绍了为什么GWAS分析后,要进行单倍型的显著性分析,简而言之,如果显著性位点在block中,以block为代表进行利用,可以进行PRS(多基因评分)或者MAS(分子标记辅助选择。
邓飞
2025/04/04
2040
如何计算群体中的单倍型频率
基因型填充(Genotype-Imputation):从原理到操作
基因型缺失:样本中没有被测序数据覆盖到的区域,基因型就属于未知的,我们将之称为缺失位点
用户9434941
2022/02/05
2.8K0
GWAS全基因组关联分析流程(BWA+samtools+gatk+Plink+Admixture+Tassel)
我梳理了GWAS全基因组关联分析的整个流程,并提供了基本的命令,用到的软件包括BWA、samtools、gatk、Plink、Admixture、Tassel等,在此分享出来给大家提供参考。
追梦生信人
2020/10/19
12.5K2
GWAS全基因组关联分析流程(BWA+samtools+gatk+Plink+Admixture+Tassel)
plink软件初体验1--初试牛刀
准备写一系列plink软件常用的命令,最近在数据分析时,需要将基因型的数据转化为0-1-2的形式,编程实现效果太差,100万的数据,plink十几秒完成,真的是厉害,非常值得学习,所以,开始搞起!
邓飞
2020/11/03
1.3K0
R语言rMVP包做GWAS(全基因组关联分析)分析实例
本篇推文的示例数据来源于参考书 《Genome-Wide Association Studies》的第十章 A Practical Guide to Using Structural Variants for Genome-Wide Association Studies。
用户7010445
2024/05/18
2K1
R语言rMVP包做GWAS(全基因组关联分析)分析实例
推荐阅读
相关推荐
笔记 | GWAS 操作流程3:plink关联分析--完结篇
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验