首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat.Biotechnol. | 单细胞数据集成的计算原理与挑战

今天给大家介绍由英国欣克斯顿,欧洲生物信息学研究所Ricard Argelaguet等人在《Nature Biotechnology》上发表了一篇名为“Computational principles and challenges in single-cell data integration”的综述。文中作者介绍了支持单细胞数据集成技术的基本概念,并讨论了用于链接不同数据集的锚的替代选择。此外,作者还回顾了单细胞数据集成策略的既定原则,局限性和诊断性,并强调了单细胞性状遗传分析方法和分子层间调控依赖性推断方法之间的相似性。最后,作者将基本的数据整合概念扩展到更具挑战性的未来应用,包括单细胞组学数据与物理维度(如空间和时间)的整合以及为个性化医疗构建人类变异参考图谱。

03

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

本文介绍由同济大学控制科学与工程系的洪奕光和中国科学院数学与系统科学研究院的万林共同通讯发表在 Nature Communications 的研究成果:单细胞数据集成可以提供细胞的全面分子视图。然而,如何整合异质性单细胞多组学以及空间分辨的转录组学数据仍然是一个重大挑战。为此,作者提出了uniPort,这是一种结合耦合变分自动编码器(coupled-VAE)和小批量不平衡最优传输(Minibatch-UOT)的统一单细胞数据集成框架。它利用高度可变的通用基因和数据集特异性基因进行集成,以处理数据集之间的异质性,并可扩展到大规模数据集。uniPort 将异质性单细胞多组学数据集嵌入到共享的潜在空间。它还可以进一步构建一个用于跨数据集基因插补的参考图谱。同时,uniPort提供了一个灵活的标签传输框架,以使用最优传输计划去卷积异构的空间转录组数据,而不是嵌入潜在空间。作者通过应用uniPort集成多种数据集,包括单细胞转录组学、染色质可及性和空间分辨转录组学数据,从而证明了uniPort的能力。

02

大数据时代的免费数据集成神器ETLCloud推荐

从数据治理的角度来看如何打破数据孤岛现是企业数据治理过程中最大的核心挑战。由于不同的业务部门和系统之间的数据相互独立,导致数据之间无法共享和利用,从而影响了企业的整体运营效率。IDC公司的调查显示,2022年,全球范围内有60%的企业面临“数据孤岛”的问题,企业无法高效、快速的从多个异构数据源中稳定汇聚数据。例如很多企业的生产部门和销售部门之间的数据无法共享,导致生产计划无法根据销售数据进行调整,销售订单也无法及时反馈到生产部门。这种数据孤岛现象导致企业生产效率低下,销售业绩也无法得到提升,要解决数据孤岛的问题,企业必须建立一个稳定、高效的全域数据集成平台。

02

系统架构师论文-论异构数据库的集成

本文讨论了某数据集市项目的数据集成方法与过程。该系统在2008年12月启动,在2009年5月正式上线使用。该系统是以oracle系统为主要的数据库,同时集成DB2系统中的数据。每天的话费清单系在DB2数据库中存储,通过E71调度程IWEDB2中的数据进行汇总并把结果写入到ORACLE数据仓库中。本文首先讨论了建立数据集市项目异构数据库的两个数据库系统的背景以及用户対该项目的需求。接着讨论了使用Perl技术来集成两个数据库中的业务逻辑的过程,并说明了该技术在集成过程中出现的问题,如:数据分层,E71调度程序改造,以及参数化SQL处理等问题。最后讨论了该集成方法的优点和缺点,并対改进该项目提出了优化Perl技术的设想。在本次的项目开发过程中,我主要担任了系统分析与设计的工作。

01
领券