首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat. Biotechnol. | 创新算法有助于推进单细胞基因组学

现在经常生成大型单细胞图谱,作为分析小规模研究的参考。然而,由于数据集之间的批处理效应、计算资源的有限可用性以及对原始数据的共享限制,从参考数据中学习变得复杂。德国亥姆霍兹慕尼黑中心和慕尼黑工业大学 (TUM) 的研究人员创建了一种名为“scArches”的新算法,用于在称为单细胞架构手术 (scArches) 的参考之上映射查询数据集。scArches使用转移学习和参数优化来实现高效、分散、迭代的参考构建和新数据集与现有参考的上下关系,而无需分享原始数据。利用小鼠大脑、胰腺、免疫和全生物体图谱的例子,研究人员的工作表明scArches保留了生物状态信息,同时消除了批量效应,尽管使用的参数比从头整合少四个数量级。最后,scArches在映射到健康参照物时保留了冠状病毒疾病2019(COVID-19)的疾病变异,从而能够发现疾病特定的细胞状态。scArches将通过实现参照物图谱的迭代构建、更新、共享和有效使用来促进合作项目。

03

Nat. Commun. | Cellar一个交互式单细胞数据分析工具

本文介绍由美国卡内基梅隆大学的Ziv Bar-Joseph教授团队和加拿大麦吉尔大学健康中心的Jun Ding助理教授团队联合发表在 Nature Communications 的研究成果。细胞分类为高通量单细胞数据的主要挑战,在许多情况下,这种分配需要重复使用外部和补充数据源。为了提高跨大型联盟、平台和模态统一分配细胞类型的能力,作者开发了一种软件工具Cellar,可为分配和数据集比较过程中涉及的所有不同步骤提供交互式支持。作者讨论了由Cellar实现的不同方法,以及如何将这些方法用于不同的数据类型,如何组合互补的数据类型以及如何分析和可视化空间数据。作者通过使用Cellar注释几个来自多组学单细胞测序和空间蛋白质组学研究的HuBMAP数据集来展示Cellar的优势。

02

你也可以训练超大神经网络!谷歌开源GPipe库

深度神经网络(DNN)推动了许多机器学习任务的发展,包括语音识别、视觉识别、语言处理。BigGan、Bert、GPT2.0取得的近期进展表明,DNN模型越大,其在任务中的表现越好。视觉识别领域过去取得的进展也表明,模型大小和分类准确率之间存在很强的关联。例如,2014年ImageNet视觉识别挑战赛的冠军GoogleNet以400万的参数取得了74.8%的top-1准确率,但仅仅过了三年,冠军的宝座就被Squeeze-and-ExcitationNetworks抢去,后者以1.458亿(前者的36倍还多)的参数量取得了82.7%的top-1准确率。然而,在这段时间里,GPU的内存只提高了3倍左右,当前最优的图像模型却已经达到了谷歌云 TPUv2的可用内存。因此,我们急需一个能够实现大规模深度学习并克服当前加速器内存局限的可扩展高效架构。

02

你也可以训练超大神经网络!谷歌开源GPipe库

深度神经网络(DNN)推动了许多机器学习任务的发展,包括语音识别、视觉识别、语言处理。BigGan、Bert、GPT 2.0取得的近期进展表明,DNN模型越大,其在任务中的表现越好。视觉识别领域过去取得的进展也表明,模型大小和分类准确率之间存在很强的关联。例如,2014年ImageNet视觉识别挑战赛的冠军GoogleNet以400万的参数取得了74.8%的top-1准确率,但仅仅过了三年,冠军的宝座就被Squeeze-and-ExcitationNetworks抢去,后者以1.458亿(前者的36倍还多)的参数量取得了82.7%的top-1准确率。然而,在这段时间里,GPU的内存只提高了3倍左右,当前最优的图像模型却已经达到了谷歌云 TPUv2的可用内存。因此,我们急需一个能够实现大规模深度学习并克服当前加速器内存局限的可扩展高效架构。

03

Nature Methods | 单细胞基因组图谱数据集成的基准测试

本文介绍由德国计算生物学研究所的M. Colomé-Tatché和Fabian J. Theis共同通讯发表在 Nature Methods 的研究成果:作者对来自23篇出版物的85批基因表达、染色质可及性和模拟数据的68种方法和预处理组合进行了基准测试,总共代表了分布在13个图谱集成任务中的超过120万个细胞。作者使用14个评估指标,根据可伸缩性、可用性及其在保留生物变异的同时消除批次效应的能力对方法进行评估。研究表明,高度可变的基因选择提高了数据集成方法的性能,而数据缩放推动方法优先考虑批次去除而不是保留生物变异。总体而言,scANVI、Scanorama、scVI 和 scGen 表现良好,尤其是在复杂的集成任务上,而单细胞 ATAC 测序集成性能受特征空间选择的影响很大。该文免费提供的 Python 模块和基准测试管道可以为新数据确定最佳的数据集成方法,还能对新开发的方法进行基准测试。

01

腾讯公司副总裁Tom在腾讯数据中心分享日的主题演讲

大家好,非常荣幸今天有机会在这样一个天气晴朗的日子咱们济济一堂相聚在北京腾讯club展开我们第一次的腾讯数据中心分享活动。首先感谢各位贵宾抽时间来参加分享活动,让我们以热烈的掌声欢迎各位嘉宾。 今天虽然腾讯汇会场的房间并不大,但在座的各位刚才Jimmy也介绍过了,全是咱们数据中心生态系统里重量级的专家。希望大家在会中多多互动,多多交流,有什么问题,随时提出来。数据中心圈子也不大,大家茶歇的时候也可以互相认识一下。 首先,我想讲一讲为什么会有这样一个分享日。腾讯在数据中心领域起步比较早,在2006年就应业

08
领券