Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何获取完整的GWAS summary数据(2)------ MRCIEU GWAS数据库

如何获取完整的GWAS summary数据(2)------ MRCIEU GWAS数据库

作者头像
生信与临床
发布于 2022-08-21 08:56:49
发布于 2022-08-21 08:56:49
4.6K0
举报

在上一期的内容中,我和大家简单介绍了如何从GWAS catalog数据库中获取完整的GWAS summary数据,不知道大家有没有掌握?

今天,我将和大家分享另一个可以下载完整GWAS summary数据的网站(https://gwas.mrcieu.ac.uk/),一看到网址里的“mrcieu”大家是不是想到这个网站肯定和“TwoSampleMR”包有联系。其实这个网站就是“TwoSampleMR”包所依赖的数据库,将它和“TwoSampleMR”包结合使用可以达到事半功倍的效果。

假设我们现在想寻找BMI(body mass index)的GWAS数据,可以在搜索栏里输入“body mass index”然后回车(如下图所示):

返回的结果如下图所示,这里我们需要关注标红的“GWAS ID”这一栏,它直接告诉你这个表型的ID了,这样就方便你使用”TwoSampleMR“包进行分析了:

我们不妨点击第一个“ieu-b-40“进去看看,结果如下图所示,这里包含该研究的基本信息,大家重点关注”Population“、”Sample size“和”Build“就行,这个数据没有提供完整的GWAS summary 数据:

接下来,我们点击“ukb-b-19953“这个数据集,可以发现它提供了VCF文件,其实这也就相当于提供了完整的数据,大家可以点击”View report“查看结果报告:

看到这儿,我想大家也明白了,这个数据库里的完整GWAS数据可以通过下载VCF和index文件得到,如果没提供VCF文件的,那说明它的完整GWAS summary数据不是公开的或者需要到别处去找(大概率是非公开的)。

最后,希望大家都能顺利找到自己想要的GWAS数据来进行MR分析,如果有什么问题欢迎私信我加群交流(微信:MedGen16)。

PS: 与GWAS catalog数据库一样,这个网站最好也用国外代理来打开,这样会比较快。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信与临床 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
TwoSampleMR:孟德尔随机化一站式分析
包如其名,TwoSampleMR主要是为两样本孟德尔随机化分析而准备的,在应用这个包以前,我们来看看它的核心函数及其功能:
生信菜鸟团
2023/08/23
6.7K0
TwoSampleMR:孟德尔随机化一站式分析
TwoSampleMR两样本孟德尔随机化:服务器拥堵502了怎么办
TwoSampleMR 这个包的代码很简单,以下这段是从MRbase数据库在线操作跑完复制下来的。总共四个函数,提取暴露,提取结局,整合数据,MR分析。直接跑的话很容易因为服务器拥堵而报错502。
用户11414625
2024/12/20
2320
TwoSampleMR两样本孟德尔随机化:服务器拥堵502了怎么办
TwoSampleMR包实战教程之去除连锁不平衡(LD)
在做MR研究时,我们有一步非常重要,那就是去除存在连锁不平衡的IV。连锁不平衡主要是使用两个参数r2和kb来衡量:
生信与临床
2022/08/21
5.2K1
“TwoSampleMR”包实战教程之简介与安装
在学习了充足的孟德尔随机化研究的理论知识后,我们接下来将进入实战教程阶段,首先要和大家讲解的就是TwoSampleMR这个包。这个R包拥有三大优势使之几乎可以满足所有的MR研究需求:
生信与临床
2022/08/21
6.1K0
“TwoSampleMR”包实战教程之简介与安装
如何获取完整的GWAS summary数据(1)------GWAS catalog数据库
在孟德尔随机化(Mendelian randomization,MR)研究中,对于暴露数据我们只需要那些显著的SNP信息,这样的信息在各种GWAS数据库中都是很容易获取的。但是,关于结局的数据,由于需要SNP和结局不相关,所以很多时候这种不显著的结果无法直接从文章或者数据库中查询到,这时候我们需要下载完整的GWAS summary数据了,这种数据一般包含上百万乃至上千万的SNP信息,所以数据量比较大(压缩后在200M左右),希望大家有所认识,有所准备。
生信与临床
2022/08/21
8.9K0
如何获取完整的GWAS summary数据(1)------GWAS catalog数据库
R语言实现孟德尔随机化研究
孟德尔随机化(Mendelian Randomization, MR)是近几年流行起来的用来进行因果推断的有效方法,它以遗传变异为工具变量来推导结局和暴露的因果关系,能有效避免传统流行病学研究的混杂偏
一粒沙
2020/11/16
11.5K0
R语言实现孟德尔随机化研究
R包“ieugwasr“教程---功能介绍与分析
在进行孟德尔随机化(Mendelian randomization, MR)研究时,我们最常使用的一个R包就是“TwoSampleMR”,这个包是由“MRCIEU”团队开发的。除此之外,该团队还开发了“PHESANT”这个使用非常广泛的R包以及“open GWAS”这个数据库。
生信与临床
2022/08/21
3.7K0
R包“ieugwasr“教程---功能介绍与分析
TwoSampleMR包实战教程之读取暴露文件
在上期内容中,我和大家简单介绍的TwoSampleMR这个R包的主要功能和安装方法,今天我将为大家讲解使用该包进行孟德尔随机化研究的第一步------读取暴露文件。
生信与临床
2022/08/21
7.5K0
TwoSampleMR包实战教程之读取暴露文件
TwoSampleMR:孟德尔分析(二)
至于F值和R^2值的计算,之前已经说过今天为了系统复现MR分析的所有步骤,再放一下下:
生信菜鸟团
2023/09/28
6.2K2
TwoSampleMR:孟德尔分析(二)
孟德尔分析:代谢疾病相关的GWAS数据库
继上周分享了血液中的蛋白组学相关网站后➡【孟德尔随机化】血液循环中的蛋白质组:常用网站一网打尽,今天我们继续扩充孟德尔随机化GWAS数据的来源吧~
生信菜鸟团
2023/09/09
2.8K0
孟德尔分析:代谢疾病相关的GWAS数据库
TwoSampleMR实战教程之提取IV在结局中的信息
在读取完暴露文件并去除掉存在连锁不平衡的SNP后,我们接下来要做的一件事就是提取IV在结局中的信息,完成这一步主要有两种方法:
生信与临床
2022/08/21
2.3K0
TwoSampleMR实战教程之提取IV在结局中的信息
Bioinfo01-孟德尔随机化
这是我之前关于孟德尔随机化相关课题的一个简单笔记。其中包括了关于孟德尔随机化的简单介绍,以及一些one-sample MR 的R 语言实战。
北野茶缸子
2022/05/19
3.9K0
Bioinfo01-孟德尔随机化
CAUSALdb:涵盖数千个GWAS研究和Fine-mapping结果的可视化数据库
现在 GWAS 研究越来越多。要查询以往的 GWAS 研究结果,可以使用 GWAS Catalog。GWAS Catalog 包含的信息非常多,不过有时可能满足不了需要。这里,推荐一个叫 CAUSALdb 的数据库。
实验盒
2021/09/22
1.3K0
CAUSALdb:涵盖数千个GWAS研究和Fine-mapping结果的可视化数据库
VannoPortal | SNP综合性查询数据库
在基因组的改变上。和基因突变比较类似的,同样也是核苷酸序列改变的一个类型就是单核苷酸多态 (SNP) 了。关于 SNP 的一些基本的介绍。我们在之前的 [[SNP是什么东西?]]当中已经做了简单的介绍。今天就给大家介绍一个综合性的 SNP 信息查询数据库。VannoPortal: http://www.mulinlab.org/vportal/index.html
医学数据库百科
2021/12/01
1.8K0
VannoPortal | SNP综合性查询数据库
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
在往期内容中,米老鼠和大家简单介绍过做孟德尔随机化研究使用到的数据库,主要是OpenGWAS, GWAS Catalog 和Phenoscanner这三个。其中,Open GWAS库的数据可以使用“ieugwasr”包来快速获取,具体请参考往期内容。今天我和大家简单介绍一下可以快速获取GWAS Catalog数据库信息的“gwasrapidd”包,该包于近期加入CRAN集。
生信与临床
2022/08/21
11.6K0
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
后GWAS时代的数据整合:RegulomeDB和HaploReg数据库
RegulomeDB和HaploReg数据库提供了将大量基因组学数据与非编码突变整合的思路。 1.背景 GWAS研究产生了大量的SNP,大部分在非编码基因组 这些SNP其实是Lead/Tag SNP,所以需要同时关注与这些SNP处于高LD(linkage disequilibrium)的其它SNP ENCODE产生的大量数据,可以用来注释这些SNP,为我们研究这些SNP的功能提供一些参考。 本篇介绍的两个数据库RegulomeDB和HaploReg的套路就是将ENCODE产生的注释数据与dbSNP和GWAS
企鹅号小编
2018/02/24
2.3K0
后GWAS时代的数据整合:RegulomeDB和HaploReg数据库
GEO数据库挖掘(2)--快速锁定目标数据
在上一期的推文 GEO数据库挖掘(1)--SCI文章速成 ,我们讲解了关于GEO数据库的背景知识,想必大家也了解了GEO是一个非常实用和权威的基因表达谱数据库。那么如何检索自己想要的数据呢?
用户6317549
2019/09/24
4.7K0
GEO数据库挖掘(2)--快速锁定目标数据
DisGeNet:疾病相关的基因与突变位点数据库
DisGeNet是一个专门收录人类疾病相关的基因与突变位点信息的数据库,对应的文章发表在Nucleic Acids Research上,链接如下
生信修炼手册
2019/12/20
6.6K0
DisGeNet:疾病相关的基因与突变位点数据库
Mendelian randomization(MR)
孟德尔随机化:根据孟德尔遗传规律,亲代的等位基因随机分配给子代,此过程相当于随机对照研究(RCT)的随机分组过程:不受混杂因素(社会地位、行为等)的影响;满足时间顺序合理性(遗传变异继承于父母,且保持不变)
用户10803254
2023/12/19
2K0
Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码
生信菜鸟团
2025/01/16
4270
Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码
推荐阅读
相关推荐
TwoSampleMR:孟德尔随机化一站式分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档