生信论文的套路
在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。
生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。相关性包括表达与病理分期、治疗手段、年龄、种族、吸烟、突变、性别、共表达等因素的相关情况,通常用相关系数R表示,其差异也是用p值判断。
此外,免疫浸润分析是近两年的热点,尤其是免疫治疗获得诺奖之后。免疫浸润分析比生存分析、差异分析和相关性分析难度更大,因为免疫学是不断延伸、拓展的学科,并不断从理论走向应用、临床,兼有科学性和技术性,比如实验中已经普遍应用的免疫印迹(WB),流式分析,免疫组化和免疫荧光等等。免疫浸润涉及的内容广泛而深入,有果友留言说对免疫浸润多做介绍,芒果还在准备中,以后会分享给果友。
肿瘤微环境中有很多细胞,包括肿瘤细胞、成纤维细胞、免疫细胞、各种信号分子和细胞外基质等,肿瘤微环境显著影响着肿瘤的诊断、生存结局和临床治疗敏感性。其中免疫浸润也是近几年肿瘤研究的一个重要方向。所以,我们要清楚一个概念那就是肿瘤组织中并不是100%的细胞是肿瘤细胞,不同肿瘤组织的微环境都有着各自的特点。
肿瘤组织中存在着不同类型的细胞,但是传统的转录组测序方法(也叫Bulk RNA-seq)是将组织整体的RNA表达水平进行检测,我们并不能有效区分究竟哪些细胞表达了哪些基因。生信分析中,有一种算法叫反卷积分析,英文名叫Deconvolution。生信开发人员可以先通过预设一个优秀的数据训练集(训练集主要包含了每种不同免疫细胞的基因表达特征),然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。目前已公开发表的在线数据库中,包括TIMER、CIBERSORT、ImmuneCellAI、ABIS、EPIC等,通过机器学习和反卷积算法对样本中各类免疫细胞的免疫浸润情况进行分析。
免疫分析数据库
TIMER(免疫浸润分析首选)
https://cistrome.shinyapps.io/timer/
TISIDB(全景式反应与免疫分子的关系,与TIMER呼应,次选)
http://cis.hku.hk/TISIDB/
Kaplan-Meier Plotter(结合TIMER分析肿瘤微环境中的免疫细胞浸润情况)
http://kmplot.com/analysis/
CIBERSORT(注册和R语言基础)
https://cibersort.stanford.edu/
EPIC(上传数据,R语言基础)
https://gfellerlab.shinyapps.io/EPIC_1-1/
Immune CellAI(上传数据,R语言基础)
http://bioinfo.life.hust.edu.cn/web/ImmuCellAI/
ABIS(上传数据,最好有R语言基础)
https://giannimonaco.shinyapps.io/ABIS/
相关性分析数据库
Kaplan-Meier Plotter(临床相关性分析权威数据库,推荐)
http://kmplot.com/analysis/
GEPIA(病理分期相关性分析)
http://gepia.cancer-pku.cn/detail.php?gene=&clicktag=survival
UALCAN(种族、年龄、吸烟、突变等相关性分析,与km plotter的结果呼应)
http://ualcan.path.uab.edu/
Coexpedia数据库(共表达分析)
http://www.coexpedia.org/search.php
TIMER数据库(免疫细胞分子共表达分析)
https://cistrome.shinyapps.io/timer/
STRING(相互作用分子的分析)
https://string-db.org/cgi/input.pl?sessionId=iCNtss66oYVc&input_page_show_search=on
cBioPortal(Top50临近基因的相互作用分析)
https://www.cbioportal.org/
生存分析数据库
Kaplan-Meier Plotter数据库(生存分析经典数据库,首选)
http://kmplot.com/analysis/
PrognoScan数据库(生存分析信息最全面的数据库,次选)
http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html
GEPIA(国人之光,相关性分析是特色)
http://gepia.cancer-pku.cn/detail.php?gene=&clicktag=survival
UALCAN(甲基化是特色)
http://ualcan.path.uab.edu/
Oncolnc数据库(连mRNA, miRNA, or lncRNA也可以做生存分析)
http://www.oncolnc.org/
cBioPortal(组学分析神器也能做生存分析)
https://www.cbioportal.org/
差异分析数据库
oncomine数据库(差异分析首选)
https://www.oncomine.org/resource/main.html
GEPIA数据库(共表达是特色)
http://gepia.cancer-pku.cn/index.html
TIMER(免疫浸润分析是特色)
https://cistrome.shinyapps.io/timer/
HCCDB(肝癌数据库)
http://lifeome.net/database/hccdb/home.html
UALCAN(甲基化是特色)
http://ualcan.path.uab.edu/
CCLE(基因在细胞系的表达)
https://portals.broadinstitute.org/ccle/
THE HUMAN PROTEIN ATLAS (人类蛋白图谱)
https://www.proteinatlas.org/
Gene Expression Omnibus (基因表达数据库,R语言基础)
https://www.ncbi.nlm.nih.gov/geo/