单细胞Hi-C测序技术 (Single-cell Hi-C, scHi-C)是解析细胞特异的染色质3D结构的利器。下面是一些基本概念。
接触图 (contact map) :通常Hi-C数据可用接触图 (contact map) 展示,在接触图中每一行或每一列都代表了一个一定长度的染色质区域,每个小方格代表着两个染色质区域之间物理互作,颜色深浅代表互作的强弱。接触图也是本文分析所用的输入数据。
嵌入(embedding):嵌入指的是高维空间的原始数据投射到低维空间后,原始数据在低维空间中的坐标。
A/B区室(A/B compartment):A/B区室指的是染色质上的两类区域,即较为开放且基因表达活跃的染色质“A”区域,以及较为关闭的且基因表达不活跃的染色质“B”区域。
TAD结构域(Topologically Associating Domains):TAD结构域指的是染色质上频繁发生自身互作的区域。染色质通常存在多个TAD结构域,而结构域之间低频互作区域则为TAD结构域边界。
目前,很多计算方法已经被开发出来,以揭示基于scHi-C的单细胞三维基因组特征,包括A/B区室,拓扑相关结构域和染色质环。例如:一种基于超图 (hypergraph)的机器学习算法Higashi,可利用单细胞之间潜在的相关性填补scHi-C数据中的缺失值,以解决数据的稀疏问题(PMID: 34635838)。然而,目前还没有对单细胞亚区区进行注释的方法,而这对于理解单细胞染色体的空间定位是很重要的。这里我们介绍一种新方法:scGHOST。
scGHOST,这是一种使用带约束随机游走采样的图嵌入技术的单细胞亚区注释方法。scGHOST在单细胞Hi-C数据和由单细胞3D基因组成像推导出的接触图中的应用,证明了其能可靠地识别单细胞亚区,为核亚区的细胞间变异性提供了见解。通过使用来自复杂组织的单细胞Hi-C数据,scGHOST识别出与各种细胞类型和发育阶段中的基因转录相关的细胞类型特异性或等位基因特异性亚区,这表明了单细胞亚区的功能意义。scGHOST是一种在广泛生物背景下注释单细胞3D基因组亚区的有效方法。
代码:The source code of scGHOST can be accessed at https://github.com/ma-compbio/scGHOST
文献:Xiong, K., Zhang, R. & Ma, J. scGHOST: identifying single-cell 3D genome subcompartments. Nat Methods(2024). https://doi.org/10.1038/s41592-024-02230-9
本文分享自 MedBioInfoCloud 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!