Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >单细胞数据(scRNAseq)可以做GSEA吗?

单细胞数据(scRNAseq)可以做GSEA吗?

作者头像
生信编程日常
发布于 2020-09-07 01:58:55
发布于 2020-09-07 01:58:55
4K00
代码可运行
举报
运行总次数:0
代码可运行

单细胞测序数据也可以做gsea,步骤跟用RNAseq的数据差不多,主要是要用到差异基因并且根据Fold change来排序。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(msigdbr)
library(fgsea)
library(dplyr)
library(ggplot2)

选择自己数据的物种以及要做的GSEA的数据库类型

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##查看物种的数据 msigdbr_show_species()
m_df<- msigdbr(species = "Homo sapiens", category = "H")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#将m_df的基因与通路取出并改成一个通路对应相应基因的格式
fgsea_sets<- m_df %>% split(x = .$gene_symbol, f = .$gs_name) 

这里选用seurat求差异基因,并将差异基因按显著性排序

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#每一个细胞类型的GSEA按显著性进行降序排序
gesa_TvsC_allgenes<-FindMarkers(seurat.combined, ident.1 = "TCF7KO", ident.2 = "NC", verbose = FALSE,test.use ="roc",logfc.threshold = 0.01,only.pos =F)
gesa_TvsC_allgenes$gene<-rownames(gesa_TvsC_allgenes)

gsea_genes<-gesa_TvsC_allgenes %>%
  arrange(desc(myAUC), desc(avg_diff)) %>%
dplyr::select(gene,avg_diff)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(tibble)
ranks <- deframe(gsea_genes)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fgseaRes <- fgsea(pathways = fgsea_sets,
                  stats = ranks ,
                  minSize=5,
                  maxSize=500,
                  nperm=10000)

对结果进行整理

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(dplyr)
fgseaResTidy <- fgseaRes %>%
  as_tibble() %>%
  arrange(desc(NES))

fgseaResTidy %>%
  dplyr::select(-leadingEdge, -ES, -nMoreExtreme) %>%
  arrange(padj) %>%
  head()
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(fgseaResTidy %>% filter(padj < 0.5) %>% head(n= 15), aes(reorder(pathway, NES), NES)) +
  geom_col(aes(fill= NES < 0)) +
  coord_flip() +
  labs(x="Pathway", y="Normalized Enrichment Score",
       title="Hallmark pathways NES from GSEA") +
  theme_minimal() 
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plotEnrichment(fgsea_sets[["HALLMARK_APICAL_JUNCTION"]],
               ranks) + labs(title="HALLMARK_APICAL_JUNCTION")

参考:https://jishuin.proginn.com/p/763bfbd24004

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
听哈佛大神讲怎么做单细胞转录组GSEA分析
NGS系列文章包括NGS基础、高颜值在线绘图和分析、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程)、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step))、批次效应处理等内容。
生信宝典
2021/03/10
2.8K0
听哈佛大神讲怎么做单细胞转录组GSEA分析
GSEA富集分析
Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包含两部分,一是已知功能的基因集 (可以是 GO 注释、MsigDB 的注释或其它符合格式的基因集定义),一是表达矩阵,软件会对基因根据其于表型的关联度(可以理解为表达值的变化)从大到小排序,然后判断基因集内每条注释下的基因是否富集于表型相关度排序后基因表的上部或下部,从而判断此基因集内基因的协同变化对表型变化的影响。
生信喵实验柴
2023/02/24
1.3K0
GSEA富集分析
单细胞测序—拟时序分析综合
拟时序分析(Pseudotime Analysis)在单细胞测序(Single-cell RNA-seq)中是一个重要的分析步骤,主要用于研究细胞在发育过程或其他生物学过程中所经历的状态变化。与传统的时间序列不同,拟时序分析不依赖于实际的时间信息,而是通过单细胞转录组数据来推测出细胞状态的动态变化轨迹。以下是进行拟时序分析的几个主要原因:
sheldor没耳朵
2024/08/30
1.1K0
单细胞测序—拟时序分析综合
Science杂志高颜值GSEA打分排序图
关于可不可以用差异基因进行GSEA分析,我们前面讨论过:IF10+杂志文章只用统计学显著的差异基因做GSEA就合理吗?
生信技能树
2025/02/06
2500
Science杂志高颜值GSEA打分排序图
单细胞各个亚群基因按照平均表达量排序后gsea分析
如果一定要做gsea或者gsva这样的给基因集合打分,也有几个补救措施,比如把单细胞表达量矩阵进行缺失值插补,或者把单细胞表达量矩阵构建成为metacell矩阵。不过,最简单的方法是把单细胞表达量矩阵按照各个亚群来进行表达量平均,我们以大家熟知的pbmc3k数据集为例,大家先安装这个数据集对应的包 SeuratData,并且对它进行降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释 ,而且每个亚群找高表达量基因,都存储为Rdata文件。标准代码是:
生信技能树
2023/02/28
1.3K0
单细胞各个亚群基因按照平均表达量排序后gsea分析
“个性化”GSEA分析 - Do GSEA with specified gene set
首先,让我们再简单回顾下GSEA的操作过程,(1)我们需要按顺序排列好的gene list用于分析,(2)需要参考基因集pre-defined gene set,那么这个从哪里来呢?这么跟大家说吧,在GSEA中富集出来的基因功能类或者基因集合都是提前定义好的,谁定义的呢?当然是GSEA官方或者一些权威数据库(比如KEGG通路数据库,Gene Ontology数据库等)。举个例子,有哪些基因隶属于p53 signaling pathway或者MAPK singaling pathway是不需要我们操心的,有专家已经帮我们定义好了。那么,如何去查看或者下载这些预定义好的基因集合呢?打开如下链接:
用户6317549
2020/03/31
4.4K0
“个性化”GSEA分析 - Do GSEA with specified gene set
🤒 GSEAmining | 来看看你的GSEA结果是不是需要瘦身啦!~
最近真是累的不行,今天抽空写一下新的教程,关于人人都会做的GSEA(Gene Set Enrichment Analysis)。
生信漫卷
2023/03/08
5160
🤒 GSEAmining | 来看看你的GSEA结果是不是需要瘦身啦!~
单细胞geneNMF分析流程学习
非负矩阵分解是一种用于分析高维数据的方法,它可以从一组非负数据向量中提取稀疏且有意义的特征。该方法非常适合分解单细胞RNA测序数据,有效地将大型的复杂矩阵(基因数量乘以细胞数量)分解为几个可解释的基因程序。
凑齐六个字吧
2025/04/16
2420
单细胞geneNMF分析流程学习
Cell杂志同款:多条GSEA结果基因rank排序图
GSEA多条通路结果展示图我们前面分享过一个漂亮的气泡图:Science杂志高颜值GSEA打分排序图
生信技能树
2025/05/06
1920
Cell杂志同款:多条GSEA结果基因rank排序图
单细胞Seurat+ORA+GSEA分析流程
这篇文章的目的是演示Seurat+ORA+GSEA的分析流程,重点是了解每一步分析对象的数据结构,正确的数据结构才能保证函数正常运行,用的是pbmc3k数据,下载地址是:https://cf.10xgenomics.com/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz。
R小白
2021/12/21
2.6K0
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
单细胞数据完成差异分析后,可以根据结果进行后续的GO ,KEGG,GSEA富集分析,推荐使用clusterProfiler-R包,可参考 R|clusterProfiler-富集分析 clusterProfiler|GSEA富集分析及可视化 。
生信补给站
2023/08/25
2.1K0
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
gseapy-python版的富集分析
富集分析分为超几何分布检验(ORA)和基因集富集分析(GSEA)。R语言有clusterprofiler包可以做富集,python是用gseapy。这个包功能强大,既支持两种富集分析,还支持基因集gmt的直接获取。
用户11414625
2024/12/20
3210
gseapy-python版的富集分析
单细胞实战之单细胞hdWGCNA分析——入门到进阶(高级篇3)
在高级篇2中回顾了用于拟时序分析的CytoTRACE2和monocle3两个工具。
凑齐六个字吧
2025/04/27
3790
单细胞实战之单细胞hdWGCNA分析——入门到进阶(高级篇3)
单细胞测序—标准分析流程(4)—GSEA与GSVA
https://github.com/rcastelo/GSVA/issues/172
sheldor没耳朵
2024/09/05
1.1K0
单细胞测序—标准分析流程(4)—GSEA与GSVA
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析12
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573
小胡子刺猬的生信学习123
2022/09/03
6670
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析12
单细胞实战之pseudobulks分析,GSVA富集分析——入门到进阶(初级篇3)
我们在上一讲内容中学习了“矫正”数据的三个工具~ 分别为细胞周期矫正,去除双胞体和RNA污染。接下来我们再来学习一下pseudobulks分析、GSVA富集分析。初级篇2最后得到的工程文件通过网盘分享:初级篇2 链接: https://pan.baidu.com/s/1ETVEkJNCJSe9NU7_aLEPVA 提取码: znmb
凑齐六个字吧
2025/02/14
1800
单细胞实战之pseudobulks分析,GSVA富集分析——入门到进阶(初级篇3)
分析GSEA通路中的上下调基因
传统KEGG(通路富集分析)和GO(功能富集)分析时,如果富集到的同一通路下,既有上调差异基因,也有下调差异基因,那么这条通路总体的表现形式究竟是怎样?是被抑制还是激活?或者更直观点说,这条通路下的基因表达水平在实验处理后是上升了呢,还是下降了呢?由于没有采用有效的统计学手段去分析某条通路下的差异基因的总体变化趋势,这使得传统的富集分析结果无法回答这些问题。
生信菜鸟团
2023/11/07
1.8K0
分析GSEA通路中的上下调基因
irGSEA:基于秩次的单细胞基因集富集分析整合框架
许多Functional Class Scoring (FCS)方法,如GSEA, GSVA,PLAGE, addModuleScore, SCSE, Vision, VAM, gficf, pagoda2和Sargent,都会受数据集组成的影响,数据集组成的轻微变化将改变细胞的基因集富集分数。
生信技能树
2023/12/05
3K0
irGSEA:基于秩次的单细胞基因集富集分析整合框架
把MsigDB数据库的全部通路转为gsva分析要求的输入格式
无论是超几何分布检验和GSEA富集分析,都离不开生物学功能数据库,数据库不仅仅是GO/KEGG哦,目前最齐全的应该是属于 MSigDB(Molecular Signatures Database)数据库中定义了已知的基因集合:http://software.broadinstitute.org/gsea/msigdb 包括H和C1-C7八个系列(Collection),每个系列分别是:
生信技能树
2022/12/16
1.4K0
获取KEGG通路的基因列表 做单细胞GSEA、GSVA分析
使用KEGG通路的基因列表进行单细胞GSEA GSVA分析的过程,我们需要遵循以下步骤:
生信小博士
2024/03/22
9180
获取KEGG通路的基因列表   做单细胞GSEA、GSVA分析
推荐阅读
相关推荐
听哈佛大神讲怎么做单细胞转录组GSEA分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验