生信分析,无论是Oncomine,GEPIA,还是KM Plotter数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生信操作。并没有想象中那么难。但是简单容易不代表不重要,也不说明水平高低,而是反应了一种思路,这才是最最重要的。p<0.05就是我们前期做分析想要的结果,即使用GEO数据库、TCGA数据库做分析,甚至做芯片或测序,没有差异也是枉然。
对于医生,个人建议是最好学会R语言,最起码掌握不用R语言的数据库分析。这样在繁重的临床工作之余,可以挖掘数据库,不做实验就能发论文,而且科研和临床思维混搭,既能接临床的地气,又能接科研的仙气。最重要的是阅读过的文献和做过的生信分析,可以进一步促进对临床上疾病的认识,提升医生的诊治水平。
接下来,我们将按照中心法则和生信论文分析的思路总结生信分析的网站。这些网站均是纯生信数据库,不需要R语言基础,就像Excel、PPT一样容易上手,只要你愿意学,肯定能学会。
差异分析数据库
oncomine数据库(差异分析首选)
https://www.oncomine.org/resource/main.html
GEPIA数据库(共表达是特色)
http://gepia.cancer-pku.cn/index.html
TIMER(免疫浸润分析是特色)
https://cistrome.shinyapps.io/timer/
HCCDB(肝癌数据库)
http://lifeome.net/database/hccdb/home.html
UALCAN(甲基化是特色)
http://ualcan.path.uab.edu/
CCLE(基因在细胞系的表达)
https://portals.broadinstitute.org/ccle/
人类蛋白图谱 THE HUMAN PROTEIN ATLAS
https://www.proteinatlas.org/
基因表达数据库 Gene Expression Omnibus (需要R语言基础)
https://www.ncbi.nlm.nih.gov/geo/