Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何获得KEGG中某一条通路的全部基因?

如何获得KEGG中某一条通路的全部基因?

原创
作者头像
sheldor没耳朵
发布于 2025-02-10 06:35:00
发布于 2025-02-10 06:35:00
5870
举报
文章被收录于专栏:数据挖掘数据挖掘

如何获得KEGG中某一条通路的全部基因?

比如说我们想看PI3K-Akt signaling pathway这条通路中包含哪些基因?首先需要访问KEGG的官网,获取其hsa编号,如PI3K-Akt signaling pathway对应hsa04151.

访问如下网址(更改对应物种、编号即可),这将返回该通路涉及的所有 人类基因(hsaXXXXX)。KEGG hsa:XXXXX 这个编号通常是 NCBI Entrez Gene ID,即 NCBI 基因数据库 中的唯一基因编号。将网页内容复制到本地。再将Entrez Gene ID转化成基因名即可。

代码语言:r
AI代码解释
复制
https://rest.kegg.jp/link/hsa/path:hsa04151

将代码包装成一个函数,方便调用

代码语言:r
AI代码解释
复制
library(data.table)
library(AnnotationDbi)
library(org.Hs.eg.db)

convert_entrez_to_symbol <- function(file_path) {
  # 读取文件
  hsa04151_df <- fread(file_path, data.table = FALSE, header = FALSE)
  
  # 提取 ENTREZID
  hsa04151_df$ENTREZID <- sub("hsa:", "", hsa04151_df$V2)
  
  # 获取 ENTREZID 到 Gene Symbol 的映射
  e2s <- AnnotationDbi::select(org.Hs.eg.db,
                               keys = hsa04151_df$ENTREZID,
                               columns = "SYMBOL",
                               keytype = "ENTREZID")
  
  # 处理缺失值并去重
  ids <- na.omit(e2s)
  ids <- ids[!duplicated(ids$SYMBOL), ]
  ids <- ids[!duplicated(ids$ENTREZID), ]
  
  # 合并数据框
  hsa04151_df1 <- merge(hsa04151_df, ids, by = "ENTREZID", all.x = TRUE)
  
  return(hsa04151_df1)
}

# 使用示例
result_df <- convert_entrez_to_symbol("hsa04151.txt")
head(result_df)

即SYMBOL列中内容,为PI3K-Akt signaling pathway这条通路中所包含的全部基因。

如果存在多个通路,可以执行以下代码

代码语言:r
AI代码解释
复制
dir("hsa/")
 [1] "hsa04010.txt" "hsa04060.txt" "hsa04062.txt" "hsa04151.txt" "hsa04310.txt"
 [6] "hsa04330.txt" "hsa04340.txt" "hsa04350.txt" "hsa04380.txt" "hsa04390.txt"
[11] "hsa04510.txt"
library(dplyr)
dir("hsa/")
library(dplyr)
# 获取目录中的所有文件
file_list <- list.files("hsa/", full.names = TRUE)
# 使用 lapply() 依次读取文件并执行函数
result_list <- lapply(file_list, convert_entrez_to_symbol)
# 合并所有返回的结果
final_result <- bind_rows(result_list)
# 查看合并后的结果
head(final_result)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
还在使用同源基因转换获取非人类物种基因集吗,那你就out啦!来看看这个方法
今天分享业内大佬顾祖光的一个包,这个软件包旨在提供一个关于基因集富集分析的全面介绍,超棒的一个包,分享给大家~
生信技能树
2025/06/26
430
还在使用同源基因转换获取非人类物种基因集吗,那你就out啦!来看看这个方法
ChIP-Seq 分析流程-下游(2)
https://mp.weixin.qq.com/s/7gADGKEthliI-1viN1FC7w
生信菜鸟团
2025/02/25
2980
ChIP-Seq 分析流程-下游(2)
R语言实现KEGG通路富集可视化
用过KEGG的朋友应该都很熟悉里面的通路地图。你是否想过如果自己可以控制通路图将自己的基因绘制在一个通路图中,那么今天给大家介绍一个新推出的Bioconductor软件包pathview。这个包可以进行KEGG富集分析。
一粒沙
2019/07/31
9.4K0
使用pathview增强你的KEGG数据库注释结果的可视化
其中 GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是两个常用的生物学功能注释数据库,科学家通常是使用来超几何分布检验这个统计学算法做富集分析,即通过比较实际观察到的基因集合(几十个或者几百个)中特定功能或通路的基因数量与随机期望的数量来判断其是否富集。
生信技能树
2023/12/13
7880
使用pathview增强你的KEGG数据库注释结果的可视化
可视化—KEGG富集图中如何展示特定的通路
如果我们要展示特定通路,需要提前筛选,如我只关注炎症和免疫反应相关的通路(查资料且保证原始k k@result中有对应通路)。
sheldor没耳朵
2024/11/01
7793
可视化—KEGG富集图中如何展示特定的通路
如何利用clusterProfiler进行基因集的KEGG富集分析?
NGS 测序项目,不管是基因组测序,还是转录组测序,通常会得到一个基因列表,记录了基因突变,或者高/低表达量。
简说基因
2022/11/11
1.4K0
如何利用clusterProfiler进行基因集的KEGG富集分析?
RNA-seq(10):KEGG通路可视化:gage和pathview
开始用gage包进行富集分析,gage()函数需要fold change 和Entrez gene IDs
Y大宽
2018/09/10
3.5K0
RNA-seq(10):KEGG通路可视化:gage和pathview
RNA-seq入门实战(六):GO、KEGG富集分析与enrichplot超全可视化攻略
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!
生信技能树
2022/07/26
14.5K0
RNA-seq入门实战(六):GO、KEGG富集分析与enrichplot超全可视化攻略
RNA-seq入门实战(七):GSEA——基因集富集分析
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!
生信技能树
2022/07/26
15.5K0
RNA-seq入门实战(七):GSEA——基因集富集分析
生信技能树-day20 转录组下游分析-富集分析
今天的是三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦,还有互动练习题哈,欢迎大家点击文末的阅读原文去关注我们学员的公众号哦!
生信菜鸟团
2024/06/25
4713
生信技能树-day20 转录组下游分析-富集分析
不要怀疑,你的基因就是没办法富集到统计学显著的通路
另外,插一个题外话,因为黑粉瞎举报,我们生信技能树已经被取消了半个月的原创标识功能,让我很不爽。
生信技能树
2020/05/25
6.7K0
KEGG富集结果7大分类展示
可能很多人做KEGG Pathway富集时,还没有了解过KEGG 通路数据库也有分类呢?
生信技能树
2025/01/13
9890
KEGG富集结果7大分类展示
基因集富集分析(GSEA)及其可视化
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是是一种计算方法,用于确定事先定义的一组基因是否在不同的样品中差异表达。
青青青山
2022/07/04
7.8K0
基因集富集分析(GSEA)及其可视化
探针注释之其他基因id转换
注意看:if you get error by this code ,please try different type parameters
用户11414625
2024/12/20
1300
探针注释之其他基因id转换
生信中各种ID转换
1.Uniprot ID mapping 可以很方便地把 ID 转换为其他 ID 类型, 所包含的类型十分全面【https://www.uniprot.org/uploadlists/】
DoubleHelix
2020/06/04
11.4K1
生信中各种ID转换
干扰MYC-WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分析
PTEN(Phosphatase And Tensin Homolog)是一个重要的抑癌基因,编码的蛋白具有蛋白磷酸酶和脂质磷酸酶活性,能拮抗PIK3-AKT信号通路,调控细胞增殖、生长和代谢。PTEN在多种肿瘤中发生高频突变,但通常没有发生完全失去活性,多表现为单等位基因上的功能缺失,亚细胞定位异常,或者发生特殊的翻译后修饰,因为完全的PTEN缺失会给癌细胞带来衰老问题,当然这也给靶向PTEN的治疗带来了机会。
生信技能树
2019/06/10
1.2K0
干扰MYC-WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分析
可以每一条代谢通路都激活吗
其中附件有一张图是男性和女性的乳腺癌患者肿瘤细胞表达量差异基因的代谢通路打分后的差异热图,如下所示:
生信技能树
2024/05/31
2200
可以每一条代谢通路都激活吗
Pathview包:整合表达谱数据可视化KEGG通路
Pathview是一个用于整合表达谱数据并用于可视化KEGG通路的一个R包,其会先下载KEGG官网上的通路图,然后整合输入数据对通路图进行再次渲染,从而对KEGG通路图进行一定程度上的个性化处理,并且丰富其信息展示。(KEGG在线数据库使用攻略)
生信宝典
2019/11/18
10.4K0
分析GSEA通路中的上下调基因
传统KEGG(通路富集分析)和GO(功能富集)分析时,如果富集到的同一通路下,既有上调差异基因,也有下调差异基因,那么这条通路总体的表现形式究竟是怎样?是被抑制还是激活?或者更直观点说,这条通路下的基因表达水平在实验处理后是上升了呢,还是下降了呢?由于没有采用有效的统计学手段去分析某条通路下的差异基因的总体变化趋势,这使得传统的富集分析结果无法回答这些问题。
生信菜鸟团
2023/11/07
1.8K0
分析GSEA通路中的上下调基因
单细胞功能注释和富集分析(GO、KEGG、GSEA)(2021公开课配套笔记)
在前面几节我们已经知道各个细胞亚群的maerker基因,接下来我们对这些marker基因进行功能注释和富集分析。
生信技能树
2021/07/06
18.9K1
推荐阅读
相关推荐
还在使用同源基因转换获取非人类物种基因集吗,那你就out啦!来看看这个方法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档