前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >一文搞懂TCGA中的分析结果如何来

一文搞懂TCGA中的分析结果如何来

作者头像
生信修炼手册
发布2019-12-19 16:38:13
发布2019-12-19 16:38:13
2K0
举报
文章被收录于专栏:生信修炼手册生信修炼手册

TCGA对于不同类型的数据,有着独特的处理流程,具体如下

1. DNA-Seq Analysis Pipeline

TCGA中的DNA测序主要用来分析肿瘤患者中的体细胞突变,和GATK的体细胞突变流程类似,前期都经过了一个预处理步骤,这里称之为co-cleanning, 流程示意如下

就是经典的sort->markduplicate->Realign->BQSR步骤,得到co-cleaned BAM文件。然后用配对的肿瘤和正常样本进行somatic variant calling, 得到VCF文件。然后进行体细胞突变的注释,得到突变注释文件MAF, 示意如下

在进行体细胞突变位点分析时,使用了以下4款不同的软件同时分析

  1. MuSE
  2. Mutect2
  3. SomaticSniper
  4. Varscan2

各自对应的pipeline示意如下

各自pipeline得到的VCF文件,使用VEP软件对体细胞突变位点进行注释,使用了以下数据库进行注释

  1. GENCODE v.22
  2. sift v.5.2.2
  3. ESP v.20141103
  4. polyphen v.2.2.2
  5. dbSNP v.146
  6. Ensembl genebuild v.2014-07
  7. Ensembl regbuild v.13.0
  8. HGMD public v.20154
  9. ClinVar v.201601

注释完成之后,会对突变位点进行过滤,去除低质量的突变位点和潜在的生殖细胞突变位点,剩余的位点作为最终的体细胞突变位点,保存在MAF文件中供下载。

当然对于没有配对的正常样本,也有tumor-only variant calling workflow来处理,具体请参考以下链接

https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline

2. mRNA Analysis Pipeline

mRNA分析是通过STAR的2-pass模式比对hg38参考基因组,然后使用HTSeq进行定量,定量时基于Gencode V22版本的GTF文件,流程示意如下

在定量时,提供了以下3种策略

  1. Raw count
  2. FPKM
  3. FPKM-UQ

Raw count和FPKM是转录组分析中经典的定量策略,而FPKM-UQ则是在FPKM基础上新提出的一种策略,计算公式如下

和FPKM不同的是,在FPKM-UQ中采用所有基因Mapping reads数目的上四分位数代替了所有基因Mapping Reads的总数。官方也提供了一个示例帮助我们理解具体的计算过程

3. miRNA Analysis Pipeline

miRNA的分析采用了BCGSC开发的miRNA定量流程,这套流程只针对已知的miRNA进行定量,链接如下

https://github.com/bcgsc/mirna

流程示意如下

4. Copy Number Variation Analysis Pipeline

使用Affymetrix SNP 6.0芯片来分析CNV, 首先使用DNACopy这个R包来计算拷贝数,然后用GISTIC2根据CNV来评估基因的变化情况,是loss还是gain, 流程示意如下

5. Methylation Liftover Pipeline

通过illumina Infinum Human Methylation 27和HumanMethylation450 两个芯片平台来分析DNA甲基化,采用了beta值的定量策略。同时考虑到这两个探针是针对hg19来设计的,将探针序列与hg38进行比对,当MAPQ<10或者I型和II型探针比对到不同基因组区域时,过滤到这部分探针。剩余的CpG文件根据GENCODE V22版本的GTF来进行注释,根据这样的策略将hg19上的甲基化移植到hg38版本的基因组上,具体流程示意如下

了解TCGA数据分析的流程,可以更好的在GDC数据库中筛选数据,也可以更好的和自己的数据进行比较。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. DNA-Seq Analysis Pipeline
  • 2. mRNA Analysis Pipeline
  • 3. miRNA Analysis Pipeline
  • 4. Copy Number Variation Analysis Pipeline
  • 5. Methylation Liftover Pipeline
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档