快,关注这个公众号,一起涨姿势~
想研究肿瘤数据库,可不是只有TCGA、GEO能用。小编今天帮大家总结了一些没那么广为人知,但好用且仍在更新的癌症基因数据库。
以下数据库按照综合性肿瘤数据库、肿瘤基因组数据库、肿瘤转录组数据库进行分类,供大家选用。
综合性肿瘤数据库
TCGA(https://cancergenome.nih.gov/)即是综合性肿瘤数据库,关注与癌症的发生和发展相关的分子突变图谱。GCBI知识库之前曾经出过TCGA的入门教程视频,里面包括了实例数据下载、整合及简单应用,留言获取观看链接。
小编这里给大家介绍一下其他的数据库。
1. COSMIC
网址:https://cancer.sanger.ac.uk/cosmic/
COSMIC是世界上最大最全面的有关肿瘤的体细胞突变以及其影响的资源。主要提供多种肿瘤细胞基因组中的CNA、甲基化、基因融合、SNP及基因表达信息等。主页面分为项目、数据管理、工具、帮助、搜索框等几大块,简洁清晰。
2. UCSC Cancer Genomics Browser
UCSC Cancer Genomics Browser是一个整合、可视化、分析癌症基因组学和临床数据的网络分析工具。该平台目前共有355个数据集,包括了来自71870例样本的全基因组数据。
用户可以通过它浏览基因组的任何一部分,并且同时可以得到与该部分有关的基因组注释信息,如已知基因、预测基因、表达序列标签、mRNA、CpG岛,克隆组装间隙和重叠、染色体带型、小鼠同源性等。
肿瘤基因数据库
3. ArrayMap
网址:https://arraymap.org/
ArrayMap是由苏黎世大学分子生命科学研究所构建的,提供预处理过的肿瘤基因组芯片数据以及CNA 图谱。arrayMap数据库为高分辨率致癌基因组CNA数据的meta分析和系统级数据集成提供了切入点。
用户可通过关键字搜索自己感兴趣的样本或者搜索特定文献中的样本,并在此基础上分析感兴趣的基因或基因组片段上的CNA 。用户还可以选择两个样本来比较二者的CNA 的差异。
收录内容:
62032 genomic array profiles
901 experimental series
267 array platforms
251 ICD-O cancer entities
709 publications (Pubmed entries)
4.Cancer Hotspots
网址:https://www.cancerhotspots.org/#/home
Cancer Hotspots数据库由Memorial Sloan Kettering癌症中心的Kravis分子肿瘤学中心维护,提供大规模癌症基因组学数据中发现的在统计学上有显著复发突变的信息。
目前,Cancer Hotspots里面包含有24592个肿瘤样品中鉴定的单残基和框内indel突变热点。用户还可按照gene、residue、type、variants等对其内容进行排列查看。
5. OncoKB
网址:http://oncokb.org/#/
OncoKB是由Memorial Sloan Kettering癌症中心(MSK)维护的全面的精准肿瘤学知识库,包含来自FDA,NCCN或ASCO,ClinicalTrials.gov和科学文献的专业指导方针和建议,治疗策略,肿瘤专家或肿瘤协会共识,参考文献等信息。
OncoKB目前包含有关554种癌症基因特定改变的详细信息,还有1级(FDA批准)、2级(标准护理)的治疗信息,3级临床证据和生物学证据。
肿瘤转录组数据库
6. ArrayExpress
网址:https://www.ebi.ac.uk/arrayexpress/
ArrayExpress是欧洲生物信息协会(EMBL-EBI)下属的功能基因组数据库,收集整理基于芯片和测序的基因组学实验的数据,以支持可重复的研究。数据库目前已收集了71416次实验的46.89TB存档数据。
在帮助页面有详细的在线教程,供用户学习如何搜索、提交数据。
7. Oncomine
网址:https://www.oncomine.org/
Oncomine是大型的肿瘤基因芯片数据库,致力于收集、标准化并分析肿瘤样本的基因表达谱芯片数据。目前,Oncomine 已经收集了来自715 个数据集的86 733 个样本的基因表达数据,可用于分析基因表达差异、预测共表达基因等,并可根据肿瘤分期、分级、组织类型等临床信息进行分类。
来源:
2. http://www.oxfordjournals.org/nar/database/subcat/8/33
3.杨建,蔡浩洋.肿瘤生物信息学数据库.[J]生物技术通报,2015, 31(11):89-101
领取专属 10元无门槛券
私享最新 技术干货