前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【画图】如何预测基因的功能?

【画图】如何预测基因的功能?

作者头像
Chris生命科学小站
发布于 2023-02-28 10:34:40
发布于 2023-02-28 10:34:40
43200
代码可运行
举报
运行总次数:0
代码可运行

【画图】冠状病毒结合的宿主细胞受体ACE2在人组织中的表达情况

【画图】ACE2在TCGA肺癌数据的表达情况(请不要过度解读这个图的结果!)

我们平时在做分析的时候,找到差异基因之后要做的就是看看这个基因有什么功能,既然ACE2这个基因这么可恶,那么我们来预测一下这个基因在人肺组织样本都有哪些功能呢?

画图

1. 获得人肺组织表达谱数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
lungTMP<-read.csv("Lung.csv",header = T,check.names = F,row.names = 1)

2. 数据清洗按照ACE2基因表达量按照中位数分成高低表达组

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ACE2geneexp<-data.frame(t(lungTMP[str_sub(rownames(lungTMP),end=15)==gene,]),check.names = F)
ACE2geneexp$group<-ifelse(ACE2geneexp$ENSG00000130234.10 > median(ACE2geneexp$ENSG00000130234.10),"high","low")
ACE2geneexp$group<-as.factor(ACE2geneexp$group)

3. 计算差异基因

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(limma)
design<-model.matrix(~0+group)
contrast.matrix <- makeContrasts (contrasts = c("grouphigh-grouplow"), levels = design)
fit1 <- contrasts.fit(lmFit(lungTMP, design), contrast.matrix)
fit2 <- eBayes(fit1)
dif <- topTable(fit2,coef="grouphigh-grouplow",n=nrow(fit2),adjust="BH",sort.by = "P")

4.用Y叔的神包clusterProfiler分析

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(clusterProfiler)
library(org.Hs.eg.db)
library(ggplot2)
library(annoE)
genecluster<-AnnoENSG(EntrezID = T,data=dif )
genecluster<-genecluster[order(genecluster$logFC,decreasing = T),]
gene<-genecluster$EntrezGene
genelist<-genecluster$logFC
names(genelist)<-gene
ego <- enrichGO(gene          = gene,
                ont           = "ALL",
                OrgDb         = org.Hs.eg.db,
                pAdjustMethod = "BH",
                pvalueCutoff  = 0.05,
                qvalueCutoff  = 0.05,
                readable      = TRUE)
go.plot<-dotplot(ego, showCategory = 10,split="ONTOLOGY")+ facet_grid(ONTOLOGY~., scale="free")
go.plot

备注:上面annoE是站长自己写的注释基因的包。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
emapplot(ego)

5. 用GOplot包再画个八卦图

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(GOplot)
circ <- circle_dat(david, geneFC)
GOCircle(circ)

画图素材:

1、在GTEx上下载其中人肺组织表达谱数据

2、需要annoE包

3、GOplot中准备circ的代码

上面的素材,大家可以自行准备,当然如果嫌麻烦大家可以在文末赞赏,可以获得出图代码和相关数据!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Chris生命科学小站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【画图】某基因在人肺组织功能预测分析
现在已经有明确的实验证明,跟SARS病毒一样,新冠状病毒2019-nCoV与宿主细胞的ACE2受体结合[1]。上次教程已经给大家演示了,GTEx数据库有人各组织中基因表达谱数据,下载整理这个数据可以绘制出ACE2受体在人体组织中的表达量情况。
Chris生命科学小站
2023/02/28
2430
【画图】某基因在人肺组织功能预测分析
【画图】如何画火山图?
如果你不喜欢敲代码可以按照下面的链接在线完成 2分钟!使用小站工具,就能用鼠标点出火山图和GSEA图~回复:我要测试。领取测试数据玩起来吧~
Chris生命科学小站
2023/02/28
7390
【画图】如何画火山图?
【画图】如何批量做基因表达相关分析
【画图】与COVID-19/SARS-CoV-2/2019-nCoV病毒结合ACE2基因的表达在人肺组织中与那些基因表达相关?
Chris生命科学小站
2023/02/28
4141
【画图】如何批量做基因表达相关分析
生信技能树GEO数据挖掘直播配套笔记
二代测序(RNA_seq):如果是counts 可选择limma的voom算法或者edgeR或者DESeq2。 如果是FPKM或TPM可选择limma,注意:edgeR和DESeq2只能处理count注意:count做差异分析计算上下调,FPKM或TPM进行下游可视化
生信技能树
2022/06/08
2.1K0
生信技能树GEO数据挖掘直播配套笔记
生信技能树Day9 GEO数据挖掘 差异分析
用户11064093
2024/04/21
3120
【画图】如何批量展现基因表达相关性?
现在已经有明确的实验证明,跟SARS病毒一样,新冠状病毒2019-nCoV与宿主细胞的ACE2受体结合[1]。上次教程已经给大家演示了,GTEx数据库有人各组织中基因表达谱数据,下载整理这个数据可以绘制出ACE2受体在人体组织中的表达量情况以及可能的功能有哪些。
Chris生命科学小站
2023/02/28
4900
【画图】如何批量展现基因表达相关性?
单细胞测序—标准分析流程(4)—GSEA与GSVA
https://github.com/rcastelo/GSVA/issues/172
sheldor没耳朵
2024/09/05
1.1K0
单细胞测序—标准分析流程(4)—GSEA与GSVA
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
单细胞数据完成差异分析后,可以根据结果进行后续的GO ,KEGG,GSEA富集分析,推荐使用clusterProfiler-R包,可参考 R|clusterProfiler-富集分析 clusterProfiler|GSEA富集分析及可视化 。
生信补给站
2023/08/25
2.1K0
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
RNAseq数据 | 下载GEO中的FPKM文件后该怎么下游分析
Oncogenic lncRNA downregulates cancer cell antigen presentation and intrinsic tumor suppression不过不需要看文章,大家只需要做差异分析即可,这个时候需要注意的是,作者提供的是RPKM值表达矩阵!
生信技能树
2022/06/08
1.9K0
RNAseq数据 | 下载GEO中的FPKM文件后该怎么下游分析
GEO
用户10667093
2023/07/24
2950
GEO数据挖掘4
这里需要使用差异比较用到的limma包,在使用这个包进行分析之前,需要准备三个矩阵 * 表达矩阵 * 分组矩阵 * 差异比较矩阵
火星娃统计
2020/09/15
1.1K0
GEO数据挖掘4
基因集富集分析(GSEA)及其可视化
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是是一种计算方法,用于确定事先定义的一组基因是否在不同的样品中差异表达。
青青青山
2022/07/04
7.6K0
基因集富集分析(GSEA)及其可视化
新GEO
1.Entrez gene ID:我们一般说的Gnen ID即Entrez gene ID,是用一串数字表示的(在NCBI里面用)
用户10758803
2024/03/10
2910
GEO数据挖掘7
GSVA分析,gene Set Variation Analysis,被称为基因集变异分析,是一种非参数的无监督分析方法,用来评估芯片核转录组的基因集富集结果。 思路
火星娃统计
2020/09/15
1.5K0
GEO数据挖掘7
单细胞测序流程(单细胞rna测序)
咱们在上一个课程中进行了GO圈图绘画,但是我富集分析并不只是有GO,kegg通路的富集分析可以看到基因发挥的作用,在生物体中的重要性。
全栈程序员站长
2022/07/31
1.6K0
单细胞测序流程(单细胞rna测序)
R|clusterProfiler-富集分析
简单总结clusterProfiler包进行GO、KEGG的富集分析方法,结果输出及内置的图形展示。
生信补给站
2020/08/06
2.2K0
药物预测之差异基因为什么不行
现在可以尝试一下理解药物预测的原理啦,首先呢在前面的教程 药物预测之相关性为什么不行,我们发现简简单单的表达量相关性居然都可以勉勉强强得到还算是合理的结果啊!现在让我们一起看看差异基因能不能进行药物预测!
生信技能树
2021/10/12
1.5K0
使用R语言下载TCGA数据库癌症基因表达数据小例子
上面遇到的问题今天找到了解决办法:可以使用SummarizedExperiment包中的函数assay()函数将表达矩阵提取出来;colData()函数好像是获得一些样本信息
用户7010445
2020/03/03
2.8K0
单细胞转录组基础分析七:差异基因富集分析
单细胞测序技术是近年最大的生命科学突破之一,相关文章频繁发表于各大顶级期刊,然而单细胞数据的分析依然是大家普遍面临的障碍。本专题将针对10X Genomics单细胞转录组数据演示各种主流分析,包括基于Seurat的基础分析、以及基于clusterProfiler、Monocle、SingleR等R包的延伸分析。不足之处请大家批评指正,欢迎添加Kinesin微信交流探讨!
生信技能树jimmy
2020/09/04
11.7K1
单细胞转录组基础分析七:差异基因富集分析
富集分析-KEGG/GO
是系统分析基因功能、基因组 信息数据库,它有助于研究者把基因及表达信息作为一个整体 网络进行研究,以“理解生物系统的高级功能和实用程序资源库”著称。
用户10412487
2023/03/28
2.8K0
相关推荐
【画图】某基因在人肺组织功能预测分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验