一个泛癌生存分析小工具,希望能够帮到一些科研工作者;特别是在文章做单基因机制的时候比较难找到该基因的临床意义的时候,一键筛选出该基因在200多个数据集中的生存数据结果;还提供了最佳临界值分组,避免了去各种临界值去测试最显著的临界值。
网页工具速览
PanCanSurvPlot (https://smuonco.shinyapps.io/PanCanSurvPlot/)

简介
识别可靠的肿瘤预后标志物可协助临床医生及研究人员更精准地预测肿瘤的发生发展及患者生存结局,在临床诊断、疗效评估及预后评估上发挥重要的作用。现有的支持在线生存分析的网页工具,如GEPIA2、PROGgeneV2、OncoLnc、Kaplan-Meier Plotter等,无论在数据集大小,生存分析方法丰富性还是自定义功能的多样性上逐渐无法满足研究人员日益增加的需求。因此,目前存在一个对于功能多样操作简易的泛肿瘤生存分析网页工具的迫切需求。
我们开发了PanCanSurvPlot (https://smuonco.shinyapps.io/PanCanSurvPlot/)这个Shiny网页工具,纳入了来自GEO和TCGA数据库中共计215个肿瘤相关数据集,涵盖了约10万个基因(mRNAs, miRNAs, lncRNAs),近4.5万个样本,51种不同癌症种类,13种不同生存状态类型。网站同时提供了根据中位数和最佳截断值两种分组方式,所有log-rank检验和单因素Cox回归的生存分析结果将会通过一张清晰直观的汇总表格呈现。最后,用户可自由选择配色方案和截断值水平快速获取符合出版要求的高质量Kaplan-Meier生存分析图。

一、PanCanSurvPlot与同类型生存分析工具相比的优势
1. 从纳入数据来看,PanCanSurvPlot在数据类型、数据集数量、癌种数量、生存信息数量上都具有明显的优势。PanCanSurvPlot纳入了约10万个基因(mRNAs, miRNAs, lncRNAs),涵盖TCGA和GEO数据库共计215个肿瘤相关数据集,51种不同癌症种类,44243个样本,13种不同生存状态类型。而近年来在生存分析领域火爆的网页工具GEPIA2和OncoLnc仅提供来自TCGA的数据集,分别提供TCGA全部33个癌种(GEPIA2)和部分21个癌种(OncoLnc)。类似的热门工具Kaplan‒Meier Plotter仅支持对于mRNAs和miRNAs的生存分析,且纳入数据集数量有限。
2. 从生存分析功能来看,PanCanSurvPlot更具有其独特无可替代的优势:①提供基于最佳截断值的分组作图;②提供基于两种分组方式的log-rank检验和Cox回归分析的详细统计结果(HR, 95%CI, P value),呈现于一张清晰直观的汇总表格中;③满足出版要求的高质量清晰KM图和个性化的颜色自定义功能。

二、PanCanSurvPlot使用简介


②汇总表格提供目的基因在所有癌种内的生存分析结果,提供2种生存分析算法(Kaplan-Meier log-rank检验和单因素Cox回归),2种分组方式(基于中位数分组,基于最佳截断值分组)。用户可在检索框内对癌种、数据集、平台、治疗方式、生存信息等进行自由筛选。统计结果(HR, 95%CI, P value)也可进行便捷排序。最后,用户可再点击最左侧的按钮选择分组方式进行绘图。

③获取并下载高清KM生存分析图。用户复核完选择的数据后,可点击Download按钮下载高清PDF图到本地电脑。左侧下拉框提供了对于配色方案和分组方式的便捷自定义功能。

④高清KM生存分析图展示。


小结
总的来说,PanCanSurvPlot是一款以网页为基础的便捷肿瘤相关生存分析工具,能够提供给用户,特别是不具备编程能力的生物医学研究者,探查不同肿瘤、不同生存状态下转录组标志物的生存预测结果。通过后续进一步扩展PanCanSurvPlot的功能以及不断根据用户的反馈进行更新完善,PanCanSurvPlot十分有潜力成为生物医学领域常规分析中坚实的一部分。
编辑:杨泓 石盈
校审:罗鹏 林安琪