首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

BMC Bioinformatics | DrImpute:在单细胞RNA测序数据中插补“dropout”事件

今天给大家介绍明尼苏达大学的Daniel J. Garry教授等人发表在BMC Bioinformatics上的一篇文章 “DrImpute: imputing dropout events in single cell RNA sequencing data” 。单细胞RNA测序 (scRNA-seq) 技术通过在单细胞水平上观察基因表达,从而开创了一个新的时代。然而,这项技术存在大量的技术和生物噪音。由于RNA转录组的数量较少以及基因表达的随机性,在scRNA-seq数据中有很高的概率将非零值判断为零,这被称为“dropout”事件。本文开发了一种名为DrImpute的插补方法来处理scRNA-seq数据中的“dropout”事件。实验表明,对比其他现有的插补方法,DrImpute在区分“dropout”事件与真实表达的零值方面有更好的性能。本文还证明了DrImpute可以显著提高现有的用于聚类、可视化等工具的性能。

02

作为一种连续现象的EEG微状态

近年来,脑电微状态分析作为一种描述大规模电生理数据时空动态性特征的工具得到了广泛的应用。脑电微状态被认为存在两种假设:(1)“胜者为王”,即任何给定时间点的地形图都处于一种状态;(2)从一种状态离散地转换到另一种状态。在本研究中,我们从脑电数据的几何角度研究了这些假设,将微状态地形作为原始通道空间子空间的基向量。我们发现,微状态内和微状态间的距离分布在很大程度上是重叠的:对于低全局场强 (GFP)范围,标记为一个微状态的单个时间点通常与多个微状态向量等距,这挑战了“胜者为王”的假设。在高场强下,微状态的可分性有所改善,但仍然较弱。虽然许多GFP峰(用于定义微状态的时间点)出现在高GFP范围内,但与较差可分性相关的低GFP范围也包含GFP峰。此外,几何分析表明,微状态及其跃迁看起来更像是连续的,而不是离散的,传感器空间轨迹变化率的分析显示了渐进的微状态转变。综上所述,我们的发现表明,脑电微状态被认为在空间和时间上是连续的更好,而不是神经集群的离散激活。 1.背景 基于脑电地形图具有准稳定模式的发现,研究人员描述这些稳定的地形图为脑电微状态。脑电微状态分析被认为是研究许多认知过程的神经特征的有效方法,也是研究脑电动态性并将之与认知和疾病联系起来的一种有效的方法。 当前的微状态模型基于两个关键假设,其中之一就是在任何时间点都存在一个单一的状态,即“胜者为王”原则。在脑电数据的几何角度下,M通道脑电数据集可以概念化为M维空间,每个时间点的地形对应于该M维空间中的一个坐标。微状态分析也可以看作是一种降维技术,它将每个微状态概念化为一维子空间,即表征为传感器空间中的向量。目前,将脑电数据紧密分布在(少量)微状态向量周围的假设称为离散性假设。如果微状态分析的离散性假设成立,那么与每个微状态相关的数据点应该紧密地分布在其父向量的周围,并且快速过渡到另一个微状态。 本研究使用标准微状态分析并结合经验和仿真数据的正交投影距离来表明,在传感器空间中,一个微状态内的时间点不一定局限于其父微状态向量周围。相反,单个时间点的地形图可以接近于多个微状态,并且取决于全局场功率,并且随着时间的推移而平滑地改变。因此,本研究表明,时空离散性的假设可能不能准确地捕捉到微状态的本质。此外,我们还证明了主成分分析可以用来可视化3D中的数据分布,因为它保留了不同聚类之间和聚类内的距离。 2.材料与方法 2.1 数据描述 本研究中,我们分析了两个数据集。我们使用了68名对照组和46名抑郁症/高BDI组,数据以500 Hz重新采样。 2.2 实验装置 使用64通道神经扫描系统记录数据,电极布置符合10-10国际系统。 2.3 数据分析 使用MATLAB中的EEGLAB工具箱导入数据进行分析。这些数据最初有66个通道,其中60个通道被保留下来进行分析。在进一步分析之前进行平均参考。然后,对数据进行1-30 Hz的带通滤波。执行ICA后手动清理数据。去除无关的伪影成分。 2.4 微状态分析 微状态分析算法包括以下步骤: (1)我们使用L1范数来计算GFP。这产生了GFP的时间序列,它反映了随着时间推移地形中的总能量(图1A-B)。 (2)GFP(t)的局部最大值被送到改进的k-均值聚类算法(步骤3-7)(图1C)。我们选择了四个聚类进行分析。 (3)聚类过程从随机选择n个模板图开始,其中n是聚类或微状态图的数量。 (4)利用GFP峰值数据计算n个模板图的空间相关性。取空间相关性的绝对值确保结果不依赖于地形图极性。 (5)计算模板图的解释方差。 (6)重新定义模板图,通过从每个聚类中提取所有地形图的第一主成分来实现。 (7)重复步骤4至6,直到解释方差不随迭代次数增加而改善。 (8)选择一组新的n个随机选择的模板图,并重复步骤3到7。最后,选择解释方差最大的一组模板图作为最终的微状态向量。

01

基于变分自编码器的静息态fMRI数据的表征学习

静息状态功能性磁共振成像(rsfMRI)数据显示出复杂但结构化的模式。然而,在rsfMRI数据中,潜在的起源是不清楚的和纠缠的。在这里,我们建立了一个变分自编码器(VAE),作为一个生成模型可用无监督学习训练,以解开rsfMRI活动的未知来源。在使用人类连接组项目(Human ConnectomeProject)的大量数据进行训练后,该模型学会了使用潜在变量表示和生成皮层活动和连接的模式。潜在表征及其轨迹表征了rsfMRI活动的时空特征。潜变量反映了皮层网络潜轨迹和驱动活动变化的主梯度。表征几何学捕捉到潜在变量之间的协方差或相关性,而不是皮质连通性,可以作为一个更可靠的特征,从一个大群体中准确地识别受试者,即使每个受试者只有短期数据可用。我们的研究结果表明,VAE是现有工具的一个有价值的补充,特别适合于静态fMRI活动的无监督表征学习。

02

Nature Methods | 单细胞基因组图谱数据集成的基准测试

本文介绍由德国计算生物学研究所的M. Colomé-Tatché和Fabian J. Theis共同通讯发表在 Nature Methods 的研究成果:作者对来自23篇出版物的85批基因表达、染色质可及性和模拟数据的68种方法和预处理组合进行了基准测试,总共代表了分布在13个图谱集成任务中的超过120万个细胞。作者使用14个评估指标,根据可伸缩性、可用性及其在保留生物变异的同时消除批次效应的能力对方法进行评估。研究表明,高度可变的基因选择提高了数据集成方法的性能,而数据缩放推动方法优先考虑批次去除而不是保留生物变异。总体而言,scANVI、Scanorama、scVI 和 scGen 表现良好,尤其是在复杂的集成任务上,而单细胞 ATAC 测序集成性能受特征空间选择的影响很大。该文免费提供的 Python 模块和基准测试管道可以为新数据确定最佳的数据集成方法,还能对新开发的方法进行基准测试。

01

轻量级实时三维激光雷达SLAM,面向大规模城市环境自动驾驶

对于自动驾驶汽车来说,在未知环境中的实时定位和建图非常重要。本文提出了一种快速、轻量级的3D激光雷达SLAM,用于大规模城市环境中自动驾驶车辆的定位。文中提出了一种新的基于深度信息的编码方法,可以对具有不同分辨率的无序点云进行编码,避免了点云在二维平面上投影时丢失维度信息。通过根据编码的深度信息动态选择邻域点来修改主成分分析(PCA),以更少的时间消耗来拟合局部平面。阈值和特征点的数量根据距离间隔自适应,从而提取出稀疏的特征点并均匀分布在三维空间中。提取的关键特征点提高了里程计的准确性,并加快了点云的对齐。在KITTI和MVSECD上验证了该算法的有效性和鲁棒性。里程计估计的快速运行时间为21ms。与KITTI的几种典型的最先进方法相比,所提出的方法将平移误差减少了至少19%,旋转误差减少了7.1%。

07

NATURE COMMUNICATIONS:大脑白质网络可控性的发育增长支持了脑动力学的多样性

白质在人脑中扮演着极为重要的角色,从神经基础看,白质是支配大脑神经冲动,感受突触刺激的中枢。在中枢神经系统内,组成各种传导束;在周围神经系统内,则集合为分布于全身各组织和器官的脑神经、脊神经和植物性神经。在已有研究中已经发现,白质的发育在人脑发育过程中扮演着极为重要的角色,如人类大脑“小世界属性”中远距离连接的结构基础就是由长距离的白质连接。再如,已有多篇研究发现人类的智力水平与白质发育有关,与智力发育存在显著相关的 N-乙酰-天冬氨酸是少突胶质细胞的代谢产物,而少突胶质细胞正是使神经纤维髓鞘化的细胞。

03

Nature|单细胞多组学绘制小鼠新皮质发育图谱

哺乳动物的大脑皮层具有着无与伦比的细胞类型多样性,为了维持皮质正常的分层与行使功能,这些细胞类型是在一系列严格约束下产生的;此外,随着皮质的发育,大量细胞还会经历细胞状态的转换。因此,研究支配皮质细胞类型的产生和组织的分子机制存在难度。本研究中,作者采用单细胞RNA测序、单细胞ATAC测序以及空间转录组技术,单细胞多组学的结合生成了发育中的小鼠新皮质的综合图谱,绘制了整个小鼠皮质发生过程中所有细胞类型的发育轨迹,确定了伴随个体细胞类型谱系规范的纵向分子动力学,从而能够对异常皮质发生的机制进行探索。

01

nature reviews neuroscience|数据驱动的神经退行性疾病进展模型:跳出黑匣子思考

数据驱动的疾病进展模型是一组新兴的计算工具,可重建长期慢性疾病的疾病时间线,为了解疾病过程及其潜在机制提供独特的见解。这种方法将人类的先验知识和假设与大规模数据处理和参数估计相结合,从短期数据推断出长期的疾病轨迹。与“黑匣子”机器学习工具相比,数据驱动的疾病进展模型通常需要更少的数据,并且本身具有可解释性,因此除了实现分类、预测和分层之外,还有助于理解疾病。在这篇综述中,我们将当前数据驱动的疾病进展模型置于一个总体框架中,并讨论了与构建静态疾病轮廓的更广泛的机器学习工具相比,它们在构建疾病时间轴方面的增强效用。我们回顾了它们在多种神经退行性疾病(尤其是阿尔茨海默病)中的应用,如确定疾病生物标志物的时间轨迹、检验关于疾病机制的假设和发现疾病亚型。我们概述了技术发展的关键领域,并将其转化为更广泛的神经科学和非神经科学应用。最后,我们讨论了将疾病进展模型纳入临床实践和试验设置的潜在途径和障碍。

01

Cell | 映射单细胞的转录组向量场

本文介绍由美国马萨诸塞州怀特黑德生物医学研究所的Xiaojie Xu和Jonathan S. Weissman以及匹兹堡大学计算与系统生物学系的Jianhua Xing共同发表在Cell的研究成果:基于单细胞测序(scRNA-seq)RNA速度和代谢标记预测细胞状态。作者提出了一个分析框架dynamo (https://github.com/aristoteleo/dynamo-release),推断绝对RNA速度,重建预测细胞命运的连续向量场,利用微分几何提取潜在的规则,最终预测出最佳的重编程路径和扰动结果。进一步分析了dynamo在克服传统基于剪接的RNA速度分析的基本限制方面的能力,表明其能在代谢标记的人类造血scRNA-seq数据集上精确估计速度。此外,微分几何分析揭示了驱动早期巨核细胞出现的机制,并阐明了PU.1-GATA1电路中的不对称调节。利用最小作用路径方法,dynamo可以准确预测驱动无数造血系统的转变,并最终由计算机干扰预测基因微扰引起细胞命运的转变。综上,Dynamo有助于开展细胞状态转变的定量分析和预测。

02

发育中的大脑结构和功能连接体指纹

在成熟的大脑中,大脑连接的结构和功能指纹可以用来识别个体的独特性。然而,使某一特定大脑区别于其他大脑的特征是否在出生时就已经存在仍不得而知。本研究利用发育中的人类连接组计划(Human Connectome Project, dHCP)的神经影像数据,对早产儿围产期进行两次扫描,以评估发育中的脑指纹。我们发现,62%的参与者可以通过后来的结构连接组与从较早时间点获得的初始连接矩阵的一致性来识别。相反,同一被试在不同时间点的功能连接体之间的相似性较低。只有10%的参与者在功能连接体中表现出更大的自相似性。这些结果表明,结构连接在生命早期更稳定,可以代表个体的潜在连接组指纹:当新生儿必须快速获得新技能以适应新环境时,一个相对稳定的结构连接组似乎支持功能连接组的变化。

02

马尔可夫毯、信息几何和随机热力学

本文考虑了热力学、信息和推理之间的关系。特别是,它在自组织的变分(自由能)原理下探索了信念更新的热力学伴随物。简而言之,任何拥有马尔可夫毯的(弱混合)随机动力系统,即 内部和外部状态的分离——配备有信息几何。这意味着内部状态参数化外部状态的概率密度。此外,在非平衡稳态下,内部状态流可以解释为统计学中称为贝叶斯模型证据的量的梯度流。简而言之,任何拥有马尔可夫毯子的系统都存在自然的贝叶斯力学。至关重要的是,这意味着内部状态执行的推论与其能量学(以随机热力学为特征)之间存在明确的联系。本文是 主题为“协调能源-自主计算与智能”。

01

ArcEngine + DevPress GIS二次开发:湖北疫情交互式数据分析、地图输出、专题可视化系统(含代码实现)

新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。在全球抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能够协助发现病毒传染源、监测疫情发展、调配救援物资,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。

03
领券