Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nature Genetics | 基于人工智能神经网络的基因组解读系统Nvwa并揭示细胞命运决定共性规律

Nature Genetics | 基于人工智能神经网络的基因组解读系统Nvwa并揭示细胞命运决定共性规律

作者头像
DrugAI
发布于 2022-11-28 10:03:22
发布于 2022-11-28 10:03:22
1.5K0
举报
文章被收录于专栏:DrugAIDrugAI

编译 | 程昭龙 审稿 | 林荣鑫,王静

本文介绍由浙江大学基础医学院的郭国骥、韩晓平和良渚实验室的王晶晶共同通讯发表在 Nature Genetics 的研究成果:目前研究人员在生成和分析基因组方面做了大量努力,但大多数物种仍缺乏预测基因调控和细胞命运决定的遗传模型。在该研究中,作者利用自主构建的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,并探究了八种代表性的后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型保守的调控程序。作者开发了一种基于深度学习的模型Nvwa,用于在单细胞分辨率下预测基因表达和识别调控序列。作者还系统地比较了细胞类型特异性转录因子,以揭示脊椎动物和无脊椎动物细胞类型的保守遗传调控。该工作有助于为研究不同生物系统的调控语法提供宝贵的资源和新的策略。

简介

单细胞是生命的基本单位。高通量单细胞RNA测序(scRNA-seq)增强了研究人员识别细胞类型的能力。随着scRNA-seq技术的发展,scRNA-seq分析已被用于绘制各种物种的全生物体细胞图谱,包括人类、斑马鱼、果蝇、小鼠、线虫和涡虫。细胞类型是多细胞生命的基本组成部分,由转录因子(TF)等核心调控因子控制。最近,细胞类型被提出作为具有准独立进化变化潜力的“进化单位”。具有共同谱系祖先的细胞类型共享核心调控TF,其可能在物种进化过程中发生分化。单细胞图谱为系统比较不同物种的细胞类型和调节因子提供了前所未有的机会。

虽然TF的表达可以用scRNA-seq来测量,但目前尚不清楚基因组是如何在细胞图谱背后编码不同的时空遗传程序的。深度神经网络是建模高维数据中复杂关系的强大方法,有助于学习在特定条件下从基因组序列到基因表达的映射。目前已经开发了几种模型来预测DNA序列中的基因表达或染色质谱,如Xpresso、DeepSEA、Basset、 Enformer和AI-TAC。这些深度学习模型在识别复杂序列模式方面显示出了强大的能力。然而,此类模型尚未应用于多物种的综合图谱,并且细胞图谱水平的深度神经网络有可能识别出跨生物共享的新细胞类型特异性调控。

在该研究中作者构建了斑马鱼、果蝇和蚯蚓的全身单细胞图谱。并收集了八种代表性的后生动物图谱,研究了细胞类型和TF的跨物种相似性。然后,作者开发了一种基于深度学习的模型Nvwa,以从单个细胞的DNA序列预测基因表达。最后,作者还解释了细胞类型特异性的序列规则,并表征了跨物种细胞类型的保守调控程序。

结果

构建斑马鱼、果蝇和蚯蚓的单细胞图谱

之前,作者使用Microwell-seq构建了人类和小鼠的全生物体细胞图谱。在这项研究中,作者使用可以消除组织特异性批次效应的scRNA-seq策略构建了斑马鱼、果蝇和蚯蚓的全身细胞图谱(图1a)。其中,斑马鱼图谱收集了635,228个单细胞数据,果蝇图谱涵盖了276,706个单细胞数据,蚯蚓图谱包含了95,020个单细胞数据。

通过对图谱数据进行无监督聚类,发现了105种主要的斑马鱼细胞类型(图1b)、87种主要的果蝇细胞类型(图1c)和62种主要的蚯蚓细胞类型,它们具有不同的基因表达程序。作者还根据典型细胞类型特异性标记的标准化表达水平对每个细胞类型进行注释。总共105种斑马鱼细胞被分为11个主要细胞谱系:内皮细胞、上皮细胞、红系细胞、生殖细胞、肝细胞、免疫细胞、肌肉细胞、神经元细胞、分泌细胞、基质细胞和其他细胞。作者还对105种主要细胞类型中的每一种进行了子聚类分析,并在层次结构中识别出1285个细胞类型子聚类(图1d)。

果蝇的细胞图谱中,87种细胞类型被分为12个主要的细胞谱系:上皮细胞、神经元细胞、血细胞、卵泡、肠细胞、生殖细胞、雄性副腺、马氏小管(MT)、肌肉细胞、增殖细胞、脂肪体和其他细胞。同时,作者使用MetaNeighbor将构建的单细胞图谱与一个平行的蝇细胞图谱项目进行了比较。在87种果蝇细胞类型中,约93.1%与组织特异性注释一致。最后,对87种主要细胞类型中的每一种进行子聚类分析,在层次结构中共识别出1085个子聚类(图1e)。

图1 使用Microwell-seq构建斑马鱼和果蝇细胞图谱

对于蚯蚓细胞图谱,62种细胞类型被分为8个主要的细胞谱系:消化腺细胞、上皮细胞、神经元细胞、体腔细胞、肌肉细胞、红细胞、生殖细胞和其他细胞。最后,子聚类分析在蚯蚓层次结构中共识别出462个子聚类,这些子聚类在功能上是有意义的。

斑马鱼、果蝇和蚯蚓的图谱资源可在http://bis.zju.edu.cn/nvwa/获得。此外,作者还在结构细胞(非免疫细胞)中观察到显著的免疫基因活性,包括斑马鱼上皮细胞、果蝇MT细胞和蚯蚓体腔细胞。并且作者证明了哺乳动物的结构细胞,包括上皮细胞、内皮细胞和基质细胞,可能具有免疫特征,从而有助于提高对造血系统外的免疫学理解。

细胞图谱中的跨物种比较

利用流式细胞术和群体分析在生物体水平上研究和建模基因调控模式一直是一个挑战。通过统一的单细胞信使RNA测序(mRNA-seq)平台,作者构建的细胞图谱数据资源为研究跨物种细胞分类的遗传调控提供了前所未有的机会。因此,作者旨在分析细胞类型特异性遗传调控网络,并通过数据集成机器学习来评估跨物种遗传调控的保守性。为了获得高质量的细胞,作者设置了一个更高的截止值,以生成一个数据集,其中斑马鱼和果蝇平均每个细胞大约有1000个基因,蚯蚓平均每个细胞大约有400个基因。作者总共从八种物种中获得了480种细胞类型,涵盖了主要的细胞谱系,包括上皮细胞、免疫细胞、神经元细胞、基质细胞、肌肉细胞、分泌细胞、红系细胞、生殖细胞、内皮细胞和增殖细胞谱系。然后使用伪细胞算法制作伪体细胞计数矩阵或基于马尔可夫亲和力的细胞图插补 (MAGIC),以插补缺失的基因表达。

为了检验细胞类型的跨物种相似性,对八个转录组数据集进行了成对SAMap分析。作者比较了MAGIC、单细胞和伪细胞三种数据集的跨物种比较结果,结果发现脊椎动物的细胞类型是保守的。基于MAGIC数据集,85.9%同源细胞类型对可以基于单细胞和伪细胞数据集重新识别。为了降低结果的假阳性率,作者设置了严格的阈值来构建跨物种图谱。经分析可知脊椎动物的细胞类型是保守的,特别是免疫细胞、基质细胞、神经元细胞、上皮细胞、内皮细胞和生殖细胞(图2a)。在果蝇的跨物种图谱中,作者还发现几乎来自同一细胞谱系的所有细胞类型都显示出很强的联系(图2b)。为了进一步验证跨物种图谱的结果,作者对肌肉和神经元中同源细胞类型之间的富集基因对进行了功能富集分析(图2c),作者发现富集的基因对具有一致功能,这与之前的研究结果是一致的。

图2 八个物种的跨物种分析

为了评估脊椎动物和无脊椎动物在调控水平上的调控保守性和细胞类型差异,作者计算了每个物种的TF特异性得分(图3a-h)。总的来说,作者在八个物种中共鉴定出2342个细胞谱系特异性TF。基于八个物种间同源基因的转换,可以观察到同源TF中更多保守特征。同源TF分别覆盖了人类、小鼠和斑马鱼所有细胞类型特异性TF的91.42%(70个中的64个)、98.75%(80个中的79个)和75%(104个中的78个)。总之,作者的研究为保守遗传调控基因的跨物种筛选提供了保守遗传调控的详细信息。

图3 利用scRNA-seq数据比较物种内部和物种间的调节TF

Nvwa根据DNA序列预测基因表达

TF作为调控网络中的重要功能节点,可以识别特定的DNA序列来控制染色质状态和转录。然而,确定DNA序列元件与细胞类型特异性基因调控相关的分子机制仍然具有挑战性。为了更好地理解基因组中编码的调控元件,作者开发了一种基于深度学习的模型Nvwa。训练Nvwa模型以从单热调控序列的输入中预测单个细胞各基因的表达。对预测的细胞图谱进行评估,以验证模型的性能。此后,将学习的序列规则以调控元件的形式进行解释,如序列基序及其预测影响。Nvwa配备了单细胞分辨率,可以进一步识别特定细胞类型与深度学习衍生序列基序之间的关联(图4a)。综上所述,Nvwa可以仅在单细胞水平上利用基因调控序列预测基因表达并识别特定于细胞类型的候选调控因子。

作者首先独立训练了八个物种的Nvwa模型,并评估了Nvwa能否正确预测单细胞基因表达。Nvwa表达预测的准确度是通过检测数据中受试者操作特征曲线(AUROC)下的平均面积和精确召回曲线(AUPR)下的面积来评估的。Nvwa稳健地预测了八个物种的基因表达,其总体AUROC为0.78,AUPR为0.59。通过比较不同细胞类型的性能,表达预测正确性最高的总是生殖系的细胞。Nvwa在预测单细胞基因表达方面进行了优化,在人类和果蝇数据集中优于Basset、DeepSEA、Beluga和Basenji等标准架构。此外,通过集成相关物种的序列进行多基因组训练,可以进一步提高Nvwa模型的准确性。Nvwa模型预测再现了细胞之间的关系,包括细胞类型的相似性和多样性,预测结果与在同一细胞类型中观察到的表达更为相似。细胞类型特异性进一步通过t分布随机邻居嵌入(t-SNE)和预测表达位点在保留基因上的调整互信息(AMI)评分得到证实。总的来说,这些评价证实了Nvwa可以从DNA序列中正确预测单细胞水平的基因表达。

Nvwa可以进一步扩展到扫描全基因组转录活性信号,尽管只训练了基因调控序列(平均约占基因组的13%)。Nvwa模型沿着整个染色体扫描序列,通过识别调控DNA序列来预测信号。通过检查Nvwa全基因组预测,作者观察到它们与实验测量的功能基因组数据相关。此外,通过可视化基因组浏览器轨迹,可观察到Nvwa预测与多种细胞类型和物种中实验定义的信号之间的一致性(图4b)。总的来说,实验分析从外部验证了Nvwa预测性能的鲁棒性。在其应用中,Nvwa模型可以作为在硅片中进行功能基因组研究的辅助工具。

图4 深度学习模型框架的应用和解释

Nvwa确定特定细胞类型的调控程序

为了理解为什么Nvwa可以正确预测单细胞基因表达,作者检查了学习模型的过滤器,其代表了对相应细胞类型重要的特定序列基序。正如预期的那样,在TSS周围的窗口内系统地移动输入序列表明,近端启动子区域(±1 kbp)的信息量最大。然后,作者基于特征映射和TF-MoDISco方法从每个第一层卷积滤波器中提取深度学习的基序,并发现这两种方法给出了一致的结果。作者还计算了序列基序的细胞类型特异性,并使用影响评分进行量化。结果表明,与不同TF相关的过滤器也参与了细胞类型的识别和细胞活性(图4c)。这些结果启发作者进一步分析模型过滤器及其与细胞类型特异性基序和TF的关系。

Nvwa衍生的序列基序可以分配到已知的TF结合位点(TFBS)。作者还观察到,带注释的滤波器与已知的TFBS高度相似(图4d)。在交叉验证分析中,大多数注释滤波器具有较高的再现性和信息含量,这表明Nvwa解释的鲁棒性。一些影响分数较高的未注释过滤器可能捕获了较短的序列模式。

除了生物学注释,作者还检查了Nvwa序列基序的细胞类型特异性。对于小鼠和果蝇,50%-80%的细胞类型特异性Nvwa基序通过相应的单细胞ATAC-seq数据被重新识别。作者还发现,细胞类型特异性过滤器与相应TF的已知作用一致(图4e,f)。作者还在果蝇中鉴定了过滤调节子,这证实了由相同过滤器调控的靶基因具有相似的细胞谱系特异性表达模式(图5a,b)。总之,这些结果表明,Nvwa可以利用与特定细胞类型相关的TF的深度学习衍生基序,使得能够直接从序列中筛选细胞类型特异性调控因子。

图5 Nvwa 确定特定细胞类型的调控程序

Nvwa基序的跨物种比较

为了进一步分析物种间的遗传网络,作者比较了基于深度学习的基序在物种间的保守性和差异性。作者在八个物种特异性模型中共识别出663个细胞类型特异性过滤器。约94.9%的细胞类型特异性过滤器至少与来自其他物种特异性模型的一个过滤器同源(图6)。并且同源过滤器倾向于保持物种间相似的细胞类型特异性。深度学习基序的跨物种比较显示出揭示特定细胞类型下保守调控因子富集的潜力。

图6 细胞谱系特异性过滤器的保守水平分布

总结

在这项研究中,作者利用自主构建的高通量单细胞测序平台Microwell-seq构建了斑马鱼、果蝇和蚯蚓的全生物细胞图谱。在没有组织特异性批次效应的情况下测量了整个细胞的平衡状态。这些细胞图谱为研究物种,特别是节肢动物和环节动物的细胞分类提供了前所未有的机会。在这项研究中,作者总共分析了八种具有代表性的后生动物物种,以生成一个详细目录,来说明动物进化过程中细胞平衡状态的保守性和多样性。为了区分趋同进化和协同进化,作者筛选了具有细胞类型特异性的细胞谱系特异性TF。该研究为在单细胞分辨率下深入理解比较基因组学提供了一个框架。未来的研究可能会收集更多的后生动物物种,以追踪重要细胞类型的出现和研究细胞进化。

同时,作者开发了一个基于深度学习的框架Nvwa,仅从DNA序列预测细胞图谱水平的基因表达。Nvwa具有与特定细胞状态相关的预测调控功能,这使作者能够直接从序列中筛选细胞类型特异性的调控因子。此外,Nvwa仅使用基因组序列就可以模拟多细胞生物的复杂表达模式。Nvwa从未使用任何表观基因组数据进行训练,但其全基因组活性预测与使用功能基因组学确定的候选调控元件相关。这些结果有两个含义。首先,利用基因组共享的基本规则,深度神经网络可以模拟多细胞基因表达图谱。第二,谱系特异性转录组在很大程度上由调控DNA序列决定。

虽然Nvwa为研究进化过程中细胞类型特异性调控程序提供了一个新的视角,但Nvwa模型的解释和应用仍需谨慎。首先,超参数和模型体系结构,特别是第一层卷积滤波器控制了序列模式解释的简并性和灵敏度之间的权衡,应该根据用户的特定目的进行调整。例如,可以增加滤波器数量以提高序列基序检测的灵敏度。其次,使用Nvwa进行全基因组预测可以帮助研究人员进行功能基因组研究,并填充高度重复的基因组区域。但由于Nvwa尚处于概念验证阶段,其预测结果与具体实验数据并不完全一致;因此,Nvwa应该在实践中作为辅助工具使用。第三,本研究聚焦于TF调控因子,并将深度学习衍生的序列模式解释为TF基序。然而,仍然有新的序列模式不能分配到已知的数据库。第四,通过功能实验验证调控元件非常重要。最后,基因调控机制复杂,模型的体系结构、预测性能和调控逻辑解释仍有待完善。

总之,作者生成了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,并开发了一种基于深度学习的模型Nvwa,来预测基因表达并识别单细胞水平的调控序列,作者还揭示了进化过程中保守调控程序的作用。该研究将为破解多物种调控图谱提供宝贵的资源。

参考资料

Li, J., Wang, J., Zhang, P. et al. Deep learning of cross-species single-cell landscapes identifies conserved regulatory programs underlying cell types. Nat Genet (2022).

https://doi.org/10.1038/s41588-022-01197-7

数据

https://figshare.com/s/ecc05b1051fb5678fd3e

http://bis.zju.edu.cn/nvwa/

代码

https://github.com/JiaqiLiZju/Nvwa/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nature丨单细胞测序揭示神经元的基因表达谱与其形态和功能之间的关系
2025年2月27日德国马普学会生物智能研究所等团队联合攻关,发表在Nature主刊题为:Transcriptomic neuron types vary topographically in function and morphology。研究背景是探讨神经元的基因表达谱与其形态和功能之间的关系:神经元的形态、连接和功能等表型特征在很大程度上由不同基因的特定差异表达组合所决定;转录组空间中聚类的神经元通常对应不同的细胞类型,而且在秀丽隐杆线虫神经元和视网膜神经节细胞等模型中,相同转录组类型的神经元已被证明可以共享形态和功能。斑马鱼中脑视顶盖由将视觉输入转化为运动输出的神经元组成,其视拓扑映射虽然连续,但顶盖的不同子区域在功能上具有专门化。为揭示顶盖神经元的细胞类型架构,本研究对斑马鱼顶盖神经元进行了单细胞转录组测序分析,鉴定出60多种转录组定义的神经元类型,这些细胞类型分布于特定的解剖层中。研究者通过双光子钙成像记录了数以千计顶盖神经元对视觉刺激的活动,并将这些神经元的功能响应与各自的转录组特征相匹配;此外,利用特定转基因品系对按照转录组类型鉴定的神经元进行了形态学分析。结果显示,即使属于同一转录组类别的神经元,其形态、神经连接和视觉响应也会因所在位置的不同而呈现显著差异;将神经元的空间坐标纳入分析后,在每一种转录组簇内进一步识别出在功能和形态上明显不同的解剖学亚群。上述研究表明,外部的、与位置相关的因素拓展了基因表达相似神经元的表型多样性,意味着仅凭基因表达谱无法完全预测神经元的功能和形态。
用户11646841
2025/05/22
940
SCENIC | 以single-cell RNA-seq数据推断基因调控网络和细胞功能聚类
目前单细胞转录组领域用的比较多的细胞聚类方法大多是直接从基因表达矩阵推断,但是对于多样本合并分析,很多情况下会出现难以解决的批次效应,例如:
生信技能树jimmy
2020/03/30
9.4K1
Nature | ​心脏发生的单细胞分析揭示了器官水平发育缺陷的基础
对单细胞技术感兴趣?点击浅蓝色字 — 中科院的算法开发博士带你真正玩转这项平均每个月都有多篇高IF文章的技术
生信宝典
2019/11/27
2.6K0
Nature | ​心脏发生的单细胞分析揭示了器官水平发育缺陷的基础
Nature:细胞的基因表达总是能反应其功能吗?细胞分类的目的是什么?
自从近200年前细胞被确立为生命的基本单位以来,生物学家一直致力于表征和分类构成每个器官和生物体的无数不同细胞类型。自19世纪神经科学家圣地亚哥·拉蒙-卡哈尔(Santiago Ramón y Cajal)绘制神经元的图像以来,大脑一直被认为是最复杂的器官,尽管当时区分神经元的唯一标准是形态(形状)。在过去的十年里,科学技术飞速发展,使得研究人员可以通过记录神经元的活动模式来对其进行功能分类,并根据其表达的基因进行分子分类。然而,目前对大多数神经系统中的细胞在分子、形态和功能描述之间仍存在脱节。近日,Shainer等人在《自然》(Nature)杂志上撰文,描述了他们在斑马鱼(Danio rerio)大脑的视觉处理区域尝试弥合这一差距的大胆研究。
生信菜鸟团
2025/03/13
910
Nature:细胞的基因表达总是能反应其功能吗?细胞分类的目的是什么?
Nat. Genet. | 哺乳动物胚胎发生细胞轨迹的系统重建
本文介绍由美国华盛顿大学基因组科学系的Chengxiang Qiu和美国洛克菲勒大学Junyue Cao等人共同发表在 Nature Genetics 的研究成果:作者着手整合几个与小鼠原肠胚形成和器官形成相关的单细胞RNA序列数据集。此外,作者定义了跨越E3.5到E13的19个连续阶段中每个阶段的细胞状态,试探性地将它们与其伪祖先和伪后代联系起来。尽管是通过自动化程序构建的,但由此产生的哺乳动物胚胎发生轨迹(TOME)在很大程度上与我们当代对哺乳动物发育的理解一致。作者还利用TOME指定转录因子(TF)和TF基序作为新细胞类型出现的每个分支点的关键调节因子。最后,为了便于脊椎动物之间的比较,作者对斑马鱼和青蛙胚胎发育相关的单细胞数据集应用相同的程序,并根据共享的调节器和转录状态指定“细胞类型同源物”。
DrugAI
2022/04/19
4530
Nat. Genet. | 哺乳动物胚胎发生细胞轨迹的系统重建
Nat. Comput. Sci. | 将单细胞ATAC测序数据与基因组序列整合以辨识细胞类型
今天为大家介绍的是来自中山大学杨跃东团队的一篇论文。单细胞染色质可及性测序(scATAC-seq)技术能揭示基因调控和表观遗传异质性的单细胞分辨率细节,但由于数据的高维性和极端稀疏性,通过scATAC-seq进行细胞标注仍然具有挑战性。现有的细胞标注方法主要关注细胞峰值矩阵,并没有充分利用基因组序列。作者提出了一种名为SANGO的方法,通过整合scATAC数据中可达性峰周围的基因组序列来进行精准的单细胞标注。基因组序列的峰(peak)被编码成低维嵌入向量,然后通过一个全连接网络迭代用于重建细胞的峰值统计。学习到的权重被视为表征细胞的调控模式,并用于通过图变换网络将查询细胞与参考数据中的已标注细胞对齐,进行细胞标注。SANGO在55个配对的scATAC-seq数据集上,在样本、平台和组织持续优于其他方法。SANGO还能通过图变换学到的注意力边权重探测未知的肿瘤细胞。此外,从已标注的细胞中,作者发现了细胞类型特异性的峰,这些峰通过表达富集分析、顺式调控染色质相互作用分析和基序富集分析提供了功能性见解/生物信号。
DrugAI
2024/05/14
3990
Nat. Comput. Sci. | 将单细胞ATAC测序数据与基因组序列整合以辨识细胞类型
空间单细胞图谱揭示脊椎动物咽部器官的演化起源
为了鉴定内层细胞成分和潜在的脊椎动物同源物,建立了单细胞分辨率的空间分辨图谱。scRNA-seq数据集由10017个有效细胞组成,使用Seurat工作流进行处理。初步定义了scRNA-seq数据集的细胞组成。多种细胞类型,包括免疫细胞、分泌性上皮细胞和血细胞,被发现具有细胞cluster特异性标记。对于Stereo-seq,通过空间条形码DNA纳米球(DNB)检测的表达谱与在文库构建中捕获的单链DNA染色光学图像对齐。根据不同的细胞分布特征,分别在组织密集区和稀疏区采用了方形划分和细胞分离两种细胞分离策略。使用这些方法,我们将DNB点分离成细胞unit,这代表了真实细胞形态的折衷反映。细胞分离后,在6个Stereo-seq切片中获得18371个细胞单位,并进行细胞类型注释。
追风少年i
2024/05/28
1670
空间单细胞图谱揭示脊椎动物咽部器官的演化起源
Cell子刊 | 肠内分泌细胞单细胞测序分析(附资源库传送门)
2019年12月17日,北京生命科学研究所袭荣文实验室在《Cell Reports》(IF:7.815;2018)杂志发表题为“The Cellular Diversity and Transcription Factor Code of Drosophila Enteroendocrine Cells”的文章,系统性的解析了果蝇肠道中内分泌细胞的亚型、分布、转录因子代码及信号调控机制,提出Notch 信号通路的侧抑制作用及发育过程中建立的不同的体节身份共同决定了肠内分泌细胞的多样性。
生信宝典
2019/12/21
1.2K0
Science:人类神经科学中的功能基因组学和系统生物学
由于对资源建设和工具开发的强大的财政和智力支持,神经科学研究已经进入了神经基因组学领域的关键发展阶段。以前的组织异质性的挑战已经遇到了技术的应用,可以让我们研究单个细胞尺度的功能轮廓。此外,以细胞类型特异性的方式干扰基因、基因调控元件和神经元活性的能力已经与基因表达研究相结合,以在系统水平上揭示基因组的功能基础。虽然这些见解必须基于模型系统,但由于人类遗传学、大脑成像和组织收集方面的进步,我们现在有机会将这些方法应用于人类和人体组织中。我们承认,在我们将模型系统中开发的基因组工具应用于人类神经科学的程度上,可能总是有限制的;然而,正如我们在这个角度所描述的,神经科学领域现在已经为解决这一雄心勃勃的挑战奠定了最佳基础。将系统级的网络分析应用于这些数据集,将有助于对人类神经基因组学的更深入的理解,否则,这是无法从直接可观察到的现象中实现的。
悦影科技
2024/01/08
5540
Dictys:单细胞多组学分析发育连续性的动态基因调控网络
本文介绍由哈佛医学院的Luca Pinello通讯预印在bioRxiv的研究成果:基因调控网络(GRN)是细胞功能和特性的关键决定因素,并且会在发育和疾病期间动态重组。尽管经过了几十年的发展,GRN推理仍然面临诸多挑战,如动态重组、因果推理、反馈回路建模和上下文特异性。为了解决这些问题,作者开发了一种动态GRN推断和分析方法Dictys,该方法利用了染色质可及性、基因表达的多组学单细胞分析、上下文特异性转录因子(TF)足迹、随机过程网络和scRNA-seq读取计数的高效概率模型。Dictys提高了GRN重建的准确性和再现性,并能够跨发育环境对特定上下文和动态GRN进行推断和比较分析。Dictys通过细胞类型特异性和动态GRN进行网络分析,恢复了人类血液和小鼠皮肤发育的独特见解。其动态网络可视化可以对发育驱动因子TF及其调控目标进行时间分辨的发现和研究。同时,Dictys是一个免费、开源和用户友好的Python包。
DrugAI
2022/11/28
9910
Dictys:单细胞多组学分析发育连续性的动态基因调控网络
Nat. Commun. | TRAPT:融合多阶段深度学习的大规模表观基因组调控因子预测框架
疾病发生和进展的特异性研究中,识别调控转录因子(TRs)仍具有挑战性,这些因子通过调控元件和表观基因组信号控制基因表达。大规模多组学表观基因组数据的引入,为解析调控元件及其调控因子的复杂模式提供了可能。研究人员在此提出TRAPT,一个多模态深度学习框架,可通过学习和整合靶基因的顺式调控元件及全基因组结合位点的调控潜能,推断转录因子的活性。在570个与TR相关的数据集上,TRAPT在预测转录因子,尤其是协同因子和染色质调控因子方面优于现有方法。此外,该方法成功识别出与疾病、遗传变异、细胞命运决策及组织相关的关键转录因子,展现了基于表观组数据识别TRs的全新视角。
DrugAI
2025/04/22
1390
Nat. Commun. | TRAPT:融合多阶段深度学习的大规模表观基因组调控因子预测框架
长读长洞察单细胞:第三代测序与单细胞表观基因组学的融合揭示生命复杂性的新维度
北京大学生物医学前沿创新中心(BIOPIC)汤富酬课题组与清华大学基础医学院纪家葵课题组合作在《Science》上发表题为“Chromatin Accessibility Landscape of Mouse Early Embryos Revealed by Single-cell NanoATAC-seq2”的研究论文。
天意生信云
2025/04/04
1160
长读长洞察单细胞:第三代测序与单细胞表观基因组学的融合揭示生命复杂性的新维度
【收藏】23个circRNA数据库网址
circRNA很红,这个大家都知道。尤其是它身上那份高大上的神秘感,引得一众科学家瞬间产生扑倒circRNA的好奇感,并期望能看到该领域中更多不一样的风景。
生信交流平台
2020/08/05
5.7K0
Nature|239个灵长类动物基因组的比较揭示了CRE元件的进化
在此研究人员构建了包含239个物种的全基因组比对,这些基因组占灵长类目中所有现存物种的将近一半。利用该资源,研究人员确立了在灵长类和其他哺乳动物中受到选择性约束的人类调控元件。例如人类中111318个DNase I酶切位点和267410个转录因子结合位点在灵长类受到选择性约束但是在其他哺乳动物中没有约束,并证明了这些元件对基因表达的cis作用。这些结果强调了作用在这些调控元件上进化力量的重要性。 原文链接:https://www.nature.com/articles/s41586-023-06798-8
生信宝典
2024/04/10
2360
Nature|239个灵长类动物基因组的比较揭示了CRE元件的进化
文献解析18 单细胞组学揭示了C3及C4植物中影响光合作用的保守调控元件
这篇文章于2024年11月20日发表于《Nature》杂志,主要探讨了通过单细胞组学技术研究水稻和高粱叶片发育过程中C3和C4途径调控机制。
小胡子刺猬的生信学习123
2024/12/30
3250
文献解析18 单细胞组学揭示了C3及C4植物中影响光合作用的保守调控元件
CNGBdb有哪些实用科学数据库?【时空+单细胞数据库合辑】 | CNGBdb-Question Time
STOMICS DataBase是一个与时空组学主题相关的综合平台,通过对公共数据库的6000多篇文献进行数据挖掘,联合时空数据汇交系统,策划了140个时空组学数据集,收录超1000张时空切片数据。
尐尐呅
2023/09/28
3290
CNGBdb有哪些实用科学数据库?【时空+单细胞数据库合辑】 | CNGBdb-Question Time
人工智能 | 一种细胞类型无关的调控预测多模态 transformer | Cell Genomics
◉ 图1。EpiBERT训练概述(A)描绘EpiBERT掩码可及性预训练的示意图。在预训练过程中,模型观察特定细胞类型每个输入窗口的掩码ATAC-seq、相应的序列和全局基序富集(STAR方法)。然后,模型预测掩码ATAC-seq信号。预训练后,可以解释该模型以预测调控基序和变异效应。(B)预训练的EpiBERT模型可以微调以预测观察到和未观察到的细胞类型的基因表达。微调后,可以解释该模型以预测增强子-基因(E-G)连接。(C)EpiBERT预训练的高级网络图。在每次训练迭代期间,模型输入包括随机选择的位点的一热编码基因组序列(524 kb),随机掩码(约15%)归一化的ATAC-seq(对应于随机选择的细胞类型的相应位点,4 bp分辨率),以及相对基序富集(STAR方法)。输入通过卷积层和前馈网络(FFN)层传递,合并,并由线性(可扩展神经网络内核)注意力层处理。模型预测掩码区域内的归一化ATAC计数(128 bp分辨率)。训练过程进行2500万次独立迭代/示例(每个对应一个特定的位点和细胞类型)。
生信菜鸟团
2025/03/13
1130
人工智能 | 一种细胞类型无关的调控预测多模态 transformer | Cell Genomics
Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!
深圳华大生命科学研究院联合多家机构的研究者们,利用华大堪称“超广角百亿像素生命照相机”的时空组学技术Stereo-seq,首次绘制了四种模式生物胚胎发育或器官的时空图谱,包括和人的基因相似度高达80%的实验室明星小鼠、参与高中课本里著名的摩尔根杂交实验的果蝇、胚胎发育研究的重要模式生物斑马鱼和植物研究的“网红”拟南芥。这是首次从时间和空间维度上对生命发育过程中的基因和细胞变化过程进行超高精度解析,为认知器官结构、生命发育、人类疾病和物种演化提供全新方向。
尐尐呅
2022/05/17
6800
Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!
单细胞转录组的时间序列数据分析
单细胞转录组数据分析在阐述多细胞生物发育与疾病进程方面已经开发了多种新的方法,如比较有名的轨迹推断(TI,trajectory inference)。但是,我们知道,各种轨迹推断方法只是一种利用表达量的排序手段而已,而且严重依赖先验的知识,如根节点的选择。有没有一种技术可以真正的在RNA转录的时候为转录的RNA打上时间的标签呢?
生信技能树jimmy
2021/10/09
1.9K0
王炸组合『单细胞+空间转录组』的科研应用【3】:胚胎发育/干细胞分化
单细胞转录组测序(scRNA-seq)和空间转录组学等新兴技术为分析细胞组织、形态和分子特性的分化以及系谱分配开辟了新途径。
尐尐呅
2021/08/24
6350
王炸组合『单细胞+空间转录组』的科研应用【3】:胚胎发育/干细胞分化
推荐阅读
Nature丨单细胞测序揭示神经元的基因表达谱与其形态和功能之间的关系
940
SCENIC | 以single-cell RNA-seq数据推断基因调控网络和细胞功能聚类
9.4K1
Nature | ​心脏发生的单细胞分析揭示了器官水平发育缺陷的基础
2.6K0
Nature:细胞的基因表达总是能反应其功能吗?细胞分类的目的是什么?
910
Nat. Genet. | 哺乳动物胚胎发生细胞轨迹的系统重建
4530
Nat. Comput. Sci. | 将单细胞ATAC测序数据与基因组序列整合以辨识细胞类型
3990
空间单细胞图谱揭示脊椎动物咽部器官的演化起源
1670
Cell子刊 | 肠内分泌细胞单细胞测序分析(附资源库传送门)
1.2K0
Science:人类神经科学中的功能基因组学和系统生物学
5540
Dictys:单细胞多组学分析发育连续性的动态基因调控网络
9910
Nat. Commun. | TRAPT:融合多阶段深度学习的大规模表观基因组调控因子预测框架
1390
长读长洞察单细胞:第三代测序与单细胞表观基因组学的融合揭示生命复杂性的新维度
1160
【收藏】23个circRNA数据库网址
5.7K0
Nature|239个灵长类动物基因组的比较揭示了CRE元件的进化
2360
文献解析18 单细胞组学揭示了C3及C4植物中影响光合作用的保守调控元件
3250
CNGBdb有哪些实用科学数据库?【时空+单细胞数据库合辑】 | CNGBdb-Question Time
3290
人工智能 | 一种细胞类型无关的调控预测多模态 transformer | Cell Genomics
1130
Cell专题发表全球首批生命时空图谱,国家基因库发布时空组专辑数据库开启文献“可视化解读”新模式!
6800
单细胞转录组的时间序列数据分析
1.9K0
王炸组合『单细胞+空间转录组』的科研应用【3】:胚胎发育/干细胞分化
6350
相关推荐
Nature丨单细胞测序揭示神经元的基因表达谱与其形态和功能之间的关系
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档