前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CUT&Tag 数据处理和分析教程(1)

CUT&Tag 数据处理和分析教程(1)

作者头像
数据科学工厂
发布2025-02-27 21:16:52
发布2025-02-27 21:16:52
33110
代码可运行
举报
运行总次数:0
代码可运行

引言

CUT&Tag 简介

在真核细胞的核里,DNA 上发生的所有动态活动,比如基因表达调控,都离不开一个由核小体(包括它们的化学修饰)、转录因子和相关蛋白复合物组成的染色质环境。不同的染色质特征会标记出激活或抑制基因表达的调控区域,以及那些在细胞类型间有差异、在发育过程中会变化的染色质区域。

过去,科学家们通常用染色质免疫沉淀(ChIP)技术来定位这些染色质特征的全基因组分布。ChIP 的做法是先把染色质交联固定并溶解,然后用针对特定蛋白或修饰的抗体把相关的 DNA 片段“捞”出来(见图 1a)。这项技术自35年前问世以来,基本操作方式没太大变化,但问题在于信号和噪声不好区分,还容易出现干扰结果的伪影。后来出现了一种替代方法——体内酶锚定技术,通过抗体或融合蛋白锁定目标染色质蛋白或修饰,再对下面的 DNA 进行标记或切割。这类方法在过去20年里不断发展,其中一种叫 Cleavage Under Targets & Tagmentation(简称 CUT&Tag)的技术用到了 protein-A-Tn5(简称 pA-Tn5)转座酶融合蛋白(见图 1b)。在 CUT&Tag 中,先把细胞或细胞核透化处理,然后加入针对特定染色质蛋白的抗体,再让带着镶嵌末端接头的 pA-Tn5 附着到抗体结合的地方。接着,通过添加镁离子激活转座酶,把接头插入附近的 DNA 上,最后扩增这些接头来构建测序文库。这种基于抗体锚定 Tn5 的方法灵敏度很高,因为样本在 pA-Tn5 附着后会经过严格清洗,而且接头插入效率也很高。相比传统的 ChIP-seq,CUT&Tag 的信噪比大大提高,绘制染色质特征所需的测序量减少了十倍左右。这使得我们可以把多个样本(一般最多90个)混在一起,通过给文库加上条形码并用 PCR 扩增后,在 Illumina NGS 测序仪上进行双端测序。

目标

这个教程是为了指导大家如何处理和分析按照 Bench top CUT&Tag V.3 协议生成的 CUT&Tag 数据。我们用来说明的例子是人类淋巴瘤 K562 细胞系中组蛋白修饰的分布数据,不过这个教程的适用范围很广,可以用来分析任何染色质蛋白,比如转录因子、RNA 聚合酶 II,还有带表位标签的蛋白。

数据处理和分析概述

依赖

  • Linux system
  • R (versions >= 3.6)
    • dplyr
    • stringr
    • ggplot2
    • viridis
    • GenomicRanges
    • chromVAR
    • DESeq2
    • ggpubr
    • corrplot
    • ChIPseqSpikeInFree [Optional]
代码语言:javascript
代码运行次数:0
运行
复制
library(dplyr)
library(stringr)
library(ggplot2)
library(viridis)
library(GenomicRanges)
library(chromVAR) ## For FRiP analysis and differential analysis
library(DESeq2) ## For differential analysis section
library(ggpubr) ## For customizing figures
library(corrplot) ## For correlation plot
  • FastQC(version >= 0.11.9)
  • Bowtie2 (version >= 2.3.4.3)
  • samtools (version >= 1.10)
  • bedtools (version >= 2.29.1)
  • Picard (version >= 2.18.29)
  • SEACR (version >= 1.3)
  • deepTools (version >= 2.0)

数据下载

本教程中使用的数据来自 Kaya-Okur 等人(2020年),可以从 GEO 上下载。

代码语言:javascript
代码运行次数:0
运行
复制
wget -O $projPath/data/IgG_rep2/IgG_rep2_R1_001.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/001/SRR8754611/SRR8754611_1.fastq.gz

wget -O $projPath/data/IgG_rep2/IgG_rep2_R2_001.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/001/SRR8754611/SRR8754611_2.fastq.gz

wget -O $projPath/data/IgG_rep2/IgG_rep2_R1_002.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/002/SRR8754612/SRR8754612_1.fastq.gz

wget -O $projPath/data/IgG_rep2/IgG_rep2_R2_002.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR875/002/SRR8754612/SRR8754612_2.fastq.gz
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 冷冻工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 引言
  • CUT&Tag 简介
  • 目标
  • 数据处理和分析概述
  • 依赖
  • 数据下载
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档