甲基化技术里面,whole-genome bisulfite conversion (WGBS) 是金标准,但是价格昂贵,数据处理消耗计算资源,而Reduced- representation bisulfite sequencing (RRBS) 和Methylated DNA Immunoprecipitation Sequencing (MeDIP-Seq),都是片面的,只有 Methyl-Capture Sequencing (MC Seq)克服了它们其它这些技术的缺点:
但是实际上甲基化芯片才是最高频的产品,在人类研究领域主要是27k, 450k, 850k 以及最新的925k,而成熟的芯片早就有一系列公共资源在Bioconductor网页里面。
Bioconductor 是一个专注于生物信息学数据分析和生物数据科学的开源项目。它为生物信息学领域提供了一系列高质量的工具包和软件,以支持生物学研究中的数据处理、分析和可视化。
比如27k, 450k芯片就有如下所示包:
IlluminaHumanMethylation27k.db
IlluminaHumanMethylation27kanno.ilmn12.hg19
IlluminaHumanMethylation27kmanifest
IlluminaHumanMethylation450kanno.ilmn12.hg19
IlluminaHumanMethylation450kmanifest
IlluminaHumanMethylation450kprobe
也就是说一款甲基化芯片的3种bioconductor包,那么它们有什么区别呢?
比如 IlluminaHumanMethylation450kprobe,安装了它这个包就有一个数据对象,加载后可以看到这个芯片的全部的探针的基因组注释信息:

这个数据对象遵循了Bioconductor 提供了标准化的数据结构和格式,可以被GenomicRanges包里面的各种函数操作。
而另外的IlluminaHumanMethylation450kanno.ilmn12.hg19里面还有snp信息,包里面的数据对象更多了:
data(IlluminaHumanMethylation450kanno.ilmn12.hg19)
data(Locations)
data(Other)
data(Manifest)
data(SNPs.Illumina)
data(Islands.UCSC)
而IlluminaHumanMethylation450kmanifest是芯片产品相关信息,大概率大家是用不到它的。
它目前的配套的包的规律改版了
IlluminaHumanMethylationEPICanno.ilm10b2.hg19
IlluminaHumanMethylationEPICanno.ilm10b3.hg19
IlluminaHumanMethylationEPICanno.ilm10b4.hg19
IlluminaHumanMethylationEPICmanifest
它类似于前面的IlluminaHumanMethylation450kanno.ilmn12.hg19,信息也是非常丰富:
data(IlluminaHumanMethylationEPICanno.ilm10b2.hg19)
data(Locations)
data(Other)
data(Manifest)
data(SNPs.Illumina)
data(Islands.UCSC)
在27k, 450k, 850k 基础上,Illumina推出了新一代的升级版甲基化芯片Infinium MethylationEPIC v2.0 BeadChip(935k) ,EPICv2.0-935K芯片可检测人全基因组约935,000个CpG位点的甲基化状态,在EPICv1.0-850K的基础上去除了性能不佳的探针,新增186,000个CpG靶向增强子和超级增强子、更多CTCF结合位点、CNV检测区域、EPIC v1.0覆盖不足的CpG岛以及常见癌症驱动突变。