Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nature: 泛癌突变特征,错过了TCGA但别错过它!

Nature: 泛癌突变特征,错过了TCGA但别错过它!

作者头像
王诗翔呀
发布于 2020-07-21 06:23:05
发布于 2020-07-21 06:23:05
9150
举报
文章被收录于专栏:优雅R优雅R

大家好,今天跟大家分享的是2020年发表在Nature(IF:43.07)杂志上的一篇文章:The repertoire of mutational signatures in human cancer.内外因素一直驱动着肿瘤基因组发生体细胞突变,在这一过程中形成了具有特征性的突变标签集。

PCAWG联盟在Nature杂志上连发6篇文章,涵盖肿瘤驱动突变、非编码区域、突变特征、结构变异、肿瘤进化和RNA改变6个方面,提出了目前为止最为全面的癌症基因组分析。前面两期已经对关于泛癌驱动突变和结构变异的文章作了详尽的介绍,这一期呢,我们将为大家接着介绍——泛癌突变特征

体细胞突变可由多种原因造成,包括外源因素和内源因素。 那么这些突变特征是什么呢?研究者从4645个全基因组测序和19184个外显子测序获得的84,729,690个体细胞突变中分析得到了81个突变特征:49个单碱基替换特征、11个双碱基替换特征、4个多碱基替换特征和17个小插入/缺失特征。 这些突变特征既有以往报道的,也有这次新发现的。通过估计每个突变特征对癌症基因组突变的影响,该研究发现了突变特征与外源或内源性暴露以及有缺陷的DNA维持过程的关联,为了解人类癌症发展的突变过程提供了系统性的分析观点。

The repertoire of mutational signatures in human cancer

人类癌症突变特征全貌

(分享者:科研菌-碎碎冰Chan)

一.研究背景

自2001年科学家对人类基因组测序后,肿瘤的全面基因组表征就成为癌症研究人员的主要目标之一,测序技术和分析工具的不断进步,也促使这一研究领域蓬勃发展。日前,“全基因组泛癌分析”联盟(PCAWG)进行了迄今覆盖面最广泛的癌症全基因组分析,完成了对38种不同肿瘤的全基因组分析,发布了迄今最完整癌症基因图谱。

癌症基因组中体细胞突变的突变过程都可能涉及DNA损伤或修饰,DNA修复和DNA复制(可能是正常的或异常的),并产生特征性的突变特征,可能包括碱基取代,小的插入和缺失,基因组重排和染色体拷贝数改变。

二.分析流程
三.结果解读
1.突变特征分析

作者首先在包括大多数类型癌症的23,829个样品中(其中包含PCAWG的2780个基因组、1,865个其他来源的基因组和19,184个外显子组)分析突变,得到79,793,266个SBSs(单碱基置换),814,191个DBSs( 双碱基置换)和4,122,233个small indels(小插入和缺失),这远比任何先前的研究多大约10倍的突变。

作者在此基础上为突变建立分类,共96个类别;并使用了基于非负矩阵分解(NMF)的两种方法:SigProfiler和SignatureAnalyzer。其中SignatureAnalyzer使用了更多的签名来重建突变图谱(图S1)。两种方法之间的DBSs和indels签名通常相似(图S2,图S3)。

首先展示出本次分析的结果图~

图1:展示了PCAWG肿瘤类型中SBSs、DBSs和indels的突变负荷。

肿瘤突变负荷(TMB):每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。

图1:PCAWG肿瘤类型中SBSs、DBSs和小插入缺失的突变负荷

图2:展示了SBSs,DBSs和indels等突变特征的概况,对正文中描述的每种突变类型进行了分类(SBSs为96类;DBSs为78类;indels为83类)。然后展示了签名SBS4,DBS2和ID3的详细概况。

图2:SBSs,DBSs和indels等突变特征的概况

图3展示的是,肿瘤每个突变特征的突变数量,其中每个点的大小代表显示出某个突变特征的肿瘤类型的比例。每个点的颜色代表肿瘤显示某个突变特征的中位突变负荷。

图3:PCAWG肿瘤每个突变特征的突变数量

图4:示例两种不同肿瘤中的SBSs、DBSs、indels突变特征。

图4.单个癌症样品突变谱的说明性例子

图S1:SigProfiler和SignatureAnalyzer分析在2780个PCAWG样本中每个样本中归属签名数量的直方图

图S2:使用SigProfiler和SignatureAnalyzer分析突变特征后得到的结果之间的比较

图S3:SignatureAnalyzer分析得到的签名

2.单碱基置换突变特征

不同癌症类型之间,以及相同类型但不同样本之间的SBSs的数量存在显著差异。

  • 本研究总共提取了67个SBSs突变特征,其中49个被认为可能是生物学起源;另外有13个可能是新识别的签名。
    • 作者也发现对于一些新鉴定的签名,也有其合理的潜在病因(图3、图S4、图S5):如SBS31和SBS35可能为铂化合物化疗引起;SBS38可能为暴露于紫外线引起等等。
  • 此外三个先前已发现的碱基取代签名(SBS7,SBS10和SBS17)分为了多个组成的签名。例如:SBS7→SBS7a、SBS7b、SBS7c(图2)。
    • 签名分裂可能反映了由同一诱因下,突变过程的不同阶段,这些过程具有紧密但不完全相关的活动。
  • 另外发现,某些碱基置换的签名显示出了转录链偏向( transcriptional strand bias,),DNA损伤后修复或DNA过量损伤均可导致这种情况。
  • SBSs显示出较大的负荷异质性(在不同癌症的类型和癌症不同样本中的突变数量存在显著差异)(图3)。几乎所有个体癌症样本均表现出了多重的突变特征,在PCAWG组中表现为三个突变特征(图4:给出了示例两个不同肿瘤中的SBSs、DBSs、indels突变特征)。

图3:PCAWG肿瘤每个突变特征的突变数量

图S4:SignatureAnalyzer将PCAWG肿瘤上每种癌症类型的每种突变特征的SBSs突变数量进行统计

图S5:在SigProfiler分析的整套PCAWG和非PCAWG癌症样本中,每种癌症类型的每种突变特征的SBSs突变数

3.双碱基置换特征

不同癌症类型之间,以及相同肿瘤类型但不同样本之间的DBSs的数量也存在显著差异。

  • 作者发现在大多数癌症基因组中,DBSs的数量远高于所预期的SBSs随机邻接的数量。
    • 这表明存在普遍发生的单个诱变事件,这些事件会导致相邻碱基的取代。
  • 在样本中,DBSs的数量存在很大差异,范围从0到20,818。DBSs的数量通常与SBSs的数量成正比(图1)。

本研究中作者提取了11个双碱基替换签名(图2)。

  • 签名DBS1的特征在于CC> TT突变,在具有SBS7a和SBS7b的恶性黑色素瘤中显示了数百至数万个突变,且表现出与胞嘧啶损坏一致的转录链偏向。
  • DBS2主要由CC> AA突变组成,其中CC> AG和CC> AT突变的数量较少,并且在肺腺癌,肺鳞癌和头颈鳞癌中通常由吸烟引起,突变数为数百至数千,DBS2显示鸟嘌呤损伤的转录链偏向,并与SBS4有关,后者是由暴露于烟草烟雾引起的。
    • 因此,DBS2可能是烟草烟雾诱变剂破坏DNA的结果。

图2:SBSs,DBSs和indels等突变特征的概况

4.小插入和缺失特征

插入缺失通常占碱基取代频率的10%左右(图1)。即使排除具有缺陷DNA错配修复证据的癌症,癌症基因组之间插入缺失的数量也存在很大差异。

  • 总体而言,缺失和插入的数目相似,但是癌症类型之间存在差异:一些癌症显示出更多的缺失,而其他癌症则显示出更多的各种亚型插入。

本研究中作者提取了17个indels的突变特征。

  • 在(≥5bp)的胸腺嘧啶单核苷酸重复序列中,indels签名1(ID1)主要由胸腺嘧啶的插入组成,而ID2的主要是胸腺嘧啶的缺失(图2)。
  • 在大多数类型的癌症的大多数样本中都发现了数十种特征的突变,在结直肠癌,胃癌,子宫内膜癌和食道癌以及弥漫大B细胞性淋巴瘤中尤为常见(图3)。
  • ID3主要特征在于胞嘧啶的缺失。
    • 而且存在突变的转录链偏向,在未转录的基因链上鸟嘌呤的缺失比胞嘧啶的缺失更多。
    • ID3突变与SBS4和DBS2突变相关,后者之前已经发现与吸烟有关。因此,烟草烟雾成分对DNA的破坏可能是ID3突变的基础。
  • 一小部分癌症表现出大量的ID1和ID2突变,这些通常伴有SBS6,SBS14,SBS15,SBS20,SBS21,SBS26和SBS44(图3)。

图3:PCAWG肿瘤每个突变特征的突变数量

图S6:SigProfiler和SignatureAnalyzer的SBSs,DBSs和indels签名之间的关联

图S7:从COMPOSITE功能集中提取的突变签名,由五核苷酸范围内的SBSs,DBSs和indels组成

5.与年龄的关系

癌症诊断年龄大致与突变签名的数量之间呈正相关关系,表明从受精卵到癌细胞的整个细胞谱系中,潜在的突变过程均已起作用。

  • 例如,SBSs1和SBSs5突变的数目与年龄正相关,且在不同类型的组织表现出不同的比率。
  • 此外,DBSs2和DBSs4也与年龄正相关;ID1,ID2,ID5和ID8也在多个组织中表现出与年龄正相关。

小结

在文章中作者联合ICGC和TCGA数据库进行了泛癌全基因分析(PCAWG),使用了涵盖大多数癌症类型的4,645个全基因组和19,184个外显子序列。作者的研究鉴定了49个SBSs(单碱基取代),11个DBSs(双碱基取代),4个CBS(多碱基取代)和17个indels(小插入和删除)签名。与以前的分析相比,这项研究数据集的规模巨大空前,研究者也因此发现了新的特征。分离重叠的特征以及将特征分解可能和独特的DNA损伤,修复和复制机制的特征相关。

该分析包括大多数公开的外显子组和全基因组癌症序列。尽管一些罕见的或地理上受限制的特征可能没有被捕获,造成有限突变负担的特征可能被遗漏,治疗性诱变暴露的特征也没有被彻底地探索。但是这项研究通过估计每个签名对单个癌症基因组突变目录的贡献,揭示了签名与外源或内源性暴露以及有缺陷的DNA维持过程的关联,为了解人类癌症发展的突变过程提供了系统性的分析观点。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020/07/19 18:25:00,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 优雅R 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
NATURE|人类突变特征
癌症基因组的体细胞突变是由在受精卵和癌细胞之间的细胞谱系中起作用的外源性和内源性突变过程引起的。每一个突变过程都可能涉及DNA损伤或修饰、DNA修复和DNA复制(正常或不正常)的组成部分,并产生一种特征性的突变特征,可能包括碱基替换、小的插入和缺失(indels)、基因组重排和染色体拷贝数变化。
作图丫
2022/03/29
2.4K0
NATURE|人类突变特征
12分NC教你构建缺氧评分和扩展分析
今天跟大家分享的是2020年发表在NATURE COMMUNICATIONS (IF:12.121)杂志上的一篇文章"Divergent mutational processes distinguish hypoxic and normoxic tumours".在文章中作者采用缺氧评分,构建了肿瘤缺氧的泛癌景观,并分析了缺氧与癌基因的相关性,以及分析了缺氧相关的突变和亚克隆特征。
生信菜鸟团
2020/09/22
1.7K0
12分NC教你构建缺氧评分和扩展分析
一口气发布6篇Nature、15篇子刊,史上最大规模揭秘癌症复杂性:涵盖38种肿瘤的2658个癌症基因组
Nature的这6项研究来自全基因组泛癌分析(Pan-Cancer Analysis of Whole Genomes, PCAWG)联盟,这是他们迄今为止最为全面的癌症基因组荟萃分析:
量子位
2020/03/04
7100
一口气发布6篇Nature、15篇子刊,史上最大规模揭秘癌症复杂性:涵盖38种肿瘤的2658个癌症基因组
基因组 | Nat.Genet | InDel 新分类系统
◉ a,TP53缺失的hTERT永生化视网膜色素上皮细胞(hTERT-RPE1TP53缺失,以下简称背景对照)中的突变积累实验。◉ b,CRISPR基因编辑的InDel负担和平均InDel倍数增加(每种基因型有2-5个亚克隆;补充表1-3)。◉ 红色虚线表示对照亚克隆的InDel负担均值。y轴以对数尺度显示InDel负担。◉ c,区分编辑亚克隆与背景对照的COSMIC-83 InDel特征。浅蓝色误差条表示未编辑对照的n=100次自举InDel特征与背景特征之间的余弦相似度的均值±3个标准差(扩展数据图1d),汇总自n=7个未编辑亚克隆。◉ x轴以对数尺度显示InDel数量。◉ d,减去背景后的基因编辑相关的COSMIC-83 InDel突变特征(补充表4)。◉ e,COSMIC ID1、ID2和ID7的关键特征(v.3.3)。◉ f,基因编辑ID与COSMIC ID之间的余弦相似度热图(v.3.3)。已知和提出的病因标注在热图上方(蓝色)。◉ g,将d中基因编辑InDel特征分解为COSMIC ID(v.3.3)的解决方案。
生信菜鸟团
2025/05/23
800
基因组 | Nat.Genet | InDel 新分类系统
Nature Communications|同源重组缺陷的泛癌landscape
同源重组(HR)通路对于高保真DNA双链断裂(DSB)修复是必不可少的,涉及许多基因,包括BRCA1和BRCA2。由于这些基因失活造成的HR缺陷(HRD)导致基因组改变水平的增加。HRD是许多肿瘤的共同特征,经常见于乳腺癌和卵巢癌。HRD的准确检测具有临床意义。
作图丫
2022/03/29
5900
Nature Communications|同源重组缺陷的泛癌landscape
中国人肝癌全基因组项目
先前的中国人肝癌研究队列规模有限,且集中在WES,对于 WGS 上研究较少。PCAWG 大规模的全基因组研究因为测序深度较浅而无法完全分析肝癌基因组的亚克隆结构。因此作者开展了 Chinese Liver Cancer Atlas(CLCA)中国人肝癌图谱项目。
生信菜鸟团
2024/03/18
2550
中国人肝癌全基因组项目
几项泛癌基于突变的网络模块分析汇总
今天为大家介绍2013年Nature Methods、SCIENTIFIC REPORTS、nature structural & molecular biology、Nature Genetics发布的几项关于泛癌网络模块分析的研究。
作图丫
2022/03/29
3530
几项泛癌基于突变的网络模块分析汇总
病理学+泛癌组合可发nature新刊!
癌症的诊断通常基于组织切片的组织病理学评估,并辅以遗传和其他分子检测。现代计算机视觉算法具有很高的诊断准确性和增强组织病理学工作流程的潜力。
作图丫
2022/12/04
4840
病理学+泛癌组合可发nature新刊!
TME文献精读 | 基于机器学习的体细胞突变检测方法
体细胞突变检测准确性可能会影响癌症患者的突变发现和治疗管理。为了解决这个问题,作者在机器学习的基础上开发了一种体细胞突变发现方法,该方法在识别经过验证的肿瘤改变方面优于现有方法(敏感性97% vs 90%~99%;阳性预测值98% vs 34%~92%)。使用此方法对来自1368 TCGA样本的成对肿瘤正常外显子组数据进行分析,该算法与TCGA MC3突变集的一致性为74%,并且还发现TCGA MC3集中可能存在假阳性和假阴性突变,包括在临床上可靶向的基因。对于先前用免疫检查点抑制剂治疗过的黑色素瘤和肺癌患者,该机器学习算法的高质量体细胞突变评估可改善基于肿瘤突变负荷的临床结果预测。与其他临床测序分析相比,将机器学习突变检测应用于临床二代测序(NGS)分析中可以提高检测结果的准确性。以上分析基于机器学习的分析可改进对肿瘤特异性突变的鉴定,并对癌症患者的研究和临床管理具有重要意义。
王诗翔呀
2020/07/06
1.3K0
TME文献精读 | 基于机器学习的体细胞突变检测方法
27分Nature子刊的生信分析是怎的高度?
今天给大家带来的是2020年3月发表在Nat Genet(IF=27.603)杂志上的文章“Pan-cancer analysis of whole genomes identifies driver rearrangements promoted by LINE-1 retrotransposition”。文章中作者通过泛癌数据分析了LINE-1 逆转座促进各种类型的重排。
生信菜鸟团
2020/11/03
1.2K0
几项泛癌driver突变分析汇总
今天为大家介绍2013年Nature Genetics、Nature、SCIENTIFIC REPORTS、Nature Methods和Nature Genetics发布的几项关于泛癌driver突变分析的研究。
作图丫
2022/03/29
1.3K0
几项泛癌driver突变分析汇总
这篇最近发在Nature上的肿瘤进化有什么不一样?
今天跟大家分享的是2020年2月发表在Nature(IF=43.07)杂志上的一篇文章。文章中作者讨论了2,658种癌症的进化史,说明了早期癌症检测的可能性。
生信菜鸟团
2020/07/29
2.6K0
这篇最近发在Nature上的肿瘤进化有什么不一样?
提供代码数据,向Nature学习如何用基因组数据来分析癌症的演化轨迹
某些基因的突变会驱动细胞不受控制地增殖并导致癌症。慢性髓性白血病(CML)中的费城染色体首次揭示了这种基因与癌症的关联<sup>1,2</sup>。然而,关于CML的发病轨迹、BCR-ABL1融合基因克隆扩增的速率及其如何影响疾病的认知仍然有限。通过对9名年龄在22至81岁之间的CML患者的1013个造血集落进行全基因组测序,我们重建了造血过程的系统发育树。研究发现,BCR和ABL1基因的内含子断裂并非总是出现,同时也观察到BCR基因中存在框外外显子断裂点,这需要通过外显子跳跃来形成BCR-ABL1融合基因。除了ASXL1和RUNX1突变外,其他额外的髓系基因突变主要存在于野生型细胞中。我们推断,由BCR-ABL1引起的爆发性增长在诊断前3-14年(置信区间为2-16年)即已开始,年增长率超过70,000%。在端粒长度较短的BCR-ABL1细胞中,突变积累更高,这反映了其过度的细胞分裂。克隆扩增速率与诊断时间呈负相关。普通人群中BCR-ABL1的检出情况与CML的发病率相符,而晚期和/或急变期CML的特征在于后续的基因组进化。这些数据突显了BCR-ABL1融合基因的强大致癌潜能,并与大多数癌症缓慢且连续的克隆演化轨迹形成了对比。
生信菜鸟团
2025/05/09
1100
提供代码数据,向Nature学习如何用基因组数据来分析癌症的演化轨迹
几项泛癌的关于突变与环境暴露和病原体分析汇总
今天为大家介绍2013年Nature 、Nature Genetics和Nature Communications发布的几项突变与环境暴露和病原体关系的研究。
作图丫
2022/03/29
4200
几项泛癌的关于突变与环境暴露和病原体分析汇总
Nat. Med. | 基于遗传学原发部位未知癌症的分类和治疗反应预测
今天为大家介绍的是来自Alexander Gusev团队的一篇论文。原发部位未知癌症(Cancer of unknown primary,CUP)是一种无法追溯到其原发部位的癌症,占所有癌症的3-5%。CUP缺乏已建立的靶向治疗方法,导致普遍预后不佳。作者开发了OncoNPC,这是一个基于机器学习的分类器,使用来自三个机构的22种癌症类型中的36,445个肿瘤的定向次世代测序(NGS)数据进行训练。肿瘤NGS基础的原发癌类型分类器(OncoNPC)在保留的肿瘤样本上取得了加权F1分数为0.942的高置信度预测(≥ 0.9)。
DrugAI
2023/11/06
2320
Nat. Med. | 基于遗传学原发部位未知癌症的分类和治疗反应预测
Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
生信菜鸟团
2024/11/23
2190
Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
研究癌细胞系的突变特征揭示APOBEC突变的周期性
细胞中的每一个变异过程都会在其基因组上留下印记。利用数学方法从人类癌症成千上万的体细胞突变中已确定超过40个碱基替换和10个基因组重排突变特征。目前研究人员对某些特征的突变过程有了深入的了解,突变过程与许多疾病潜在的生物学机制有关。
作图丫
2022/03/29
1.5K0
研究癌细胞系的突变特征揭示APOBEC突变的周期性
现在发在NG上的癌症全面基因组分析跟几年前的有什么不同?
生信菜鸟团
2025/02/18
1260
现在发在NG上的癌症全面基因组分析跟几年前的有什么不同?
Nature 子刊:IncRNA在肿瘤发生中的深度分析
今天跟大家分享的是2020年3月发表在Communications Biology(IF=4.165)杂志上的一篇文章Cancer LncRNA Census reveals evidence for deep functional conservation of long noncoding RNAs in tumorigenesis。文章中作者通过癌症LncRNA普查揭示证据,证明长非编码RNA在肿瘤发生中的深层功能保守性。
生信菜鸟团
2020/09/04
1.6K1
提供数据代码,想学基因组分析,看看这篇刚发在 Nature 的胃突变图谱分析就够了
◉ 这项研究的概述。从30名捐赠者身上采集了胃腺。◉ 对来自正常、发炎和/或化生胃组织的217个微解剖单个腺体以及21个胃癌腺体进行了全基因组测序,另外对829个微解剖(每个包含几个相邻的腺体)进行了深度靶向基因测序(seq.)。◉ 三个捐赠者的胃腺微解剖体中体细胞突变的VAF分布,按中位VAF着色。◉ 所有全基因组测序单个胃腺微解剖体(n=217)的中位VAF直方图。◉ 非癌症捐赠者胃腺的SNVs和indels数量与捐赠者年龄的关系图(n=79)。红色虚线表示基于混合效应模型的最大似然估计年龄和SNV突变负荷关系,灰色阴影区域表示95%置信区间。◉ d图中的P值是通过双侧方差分析测试获得的。◉ a图中的胃轮廓改编自Servier Medical Art(https://smart.servier.com/),采用国际CC BY 4.0许可。◉ a图中的激光捕获显微切割轮廓改编自参考文献8,Springer Nature Limited。◉ M代表男性;F代表女性。
生信菜鸟团
2025/04/11
1110
提供数据代码,想学基因组分析,看看这篇刚发在 Nature 的胃突变图谱分析就够了
推荐阅读
相关推荐
NATURE|人类突变特征
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档