首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Nat. Commun. | 用于单细胞测序的林火聚类将迭代标签传播与并行蒙特卡洛模拟相结合

本文介绍由美国耶鲁大学统计与数据科学系的Mark Gerstein通讯发表在 Nature Communications 的研究成果:作者介绍了林火聚类,这是一种从单细胞数据中发现细胞类型的有效手段,具有良好的可解释性。林火聚类采用最小的先验假设,与当前方法不同,它计算每个细胞分配一个细胞类型标签的非参数后验概率。这些后验分布允许评估每个细胞的标签置信度,并允许计算“标签熵”,突出沿着分化轨迹的过渡。此外,作者表明,林火聚类可以在在线学习环境中进行稳健的归纳推理,并且可以很容易地扩展到数百万个细胞。最后,作者证明了该方法在模拟和实验数据的不同基准上优于最先进的聚类方法。总的来说,林火聚类是大规模单细胞分析中发现稀有细胞类型的有用工具。

02

R语言从入门到精通:Day16(机器学习)

在上一次教程中,我们介绍了把观测值凝聚成子组的常见聚类方法。其中包括了常见聚类分析的一般步骤以及层次聚类和划分聚类的常见方法。而机器学习领域中也包含许多可用于分类的方法,如逻辑回归、决策树、随机森林、支持向量机(SVM)等。本次教程的内容则主要介绍决策树、随机森林、支持向量机这三部分内容,它们都属于有监督机器学习领域。有监督机器学习基于一组包含预测变量值和输出变量值的样本单元,将全部数据分为一个训练集和一个验证集,其中训练集用于建立预测模型,验证集用于测试模型的准确性。这个过程中对训练集和验证集的划分尤其重要,因为任何分类技术都会最大化给定数据的预测效果。用训练集建立模型并测试模型会使得模型的有效性被过分夸大,而用单独的验证集来测试基于训练集得到的模型则可使得估计更准确、更切合实际。得到一个有效的预测模型后,就可以预测那些只知道预测变量值的样本单元对应的输出值了。

01

周志华团队和蚂蚁金服合作:用分布式深度森林算法检测套现欺诈

源 | AI科技大本营 互联网公司每天都面临着处理大规模机器学习应用程序的问题,因此我们需要一个可以处理这种超大规模的日常任务的分布式系统。最近,以集成树为构建模块的深度森林(Deep Forest)算法被提出,并在各个领域取得了极具竞争力的效果。然而,这种算法的性能还未在超大规模的任务中得到测试。近日,基于蚂蚁金服的参数服务器系统“鲲鹏”及其人工智能平台“PAI”,蚂蚁金服和南京大学周志华教授的研究团队合作开发了一种分布式的深度森林算法,同时提供了一个易于使用的图形用户界面(GUI)。 为了满足现实世界

09

GRL | 基于植被结构和生理指数的森林物候分析

全球森林覆盖面积大约占到陆地面积的30%,同时森林生态系统对于缓解大气CO2浓度上升起到不可忽视的作用。森林生长具有显著的季节变化特征,因此森林物候的变化对于森林碳汇的研究以及陆地生态系统模型的发展都有重要的意义。目前卫星遥感数据广泛应用于森林物候监测以及森林物候对于气候变化的响应,而使用的遥感产品主要分为两类:(1)植被结构指数,比如normalized difference vegetation index (NDVI)等;(2)植被生理指数,比如表示叶绿素/胡萝卜素变化的chlorophyll/carotenoid index (CCI)。但是这两种指数在表示植被的物候变化的区别的研究还很少,因此本文作者利用站点通量数据评估了植被结构和生理指数对于森林物候变化的监测效果。

03

好文速递:森林退化造成的碳损失超过了巴西亚马逊地区森林砍伐造成的碳损失

摘要:地上生物量(AGB)和森林面积的时空动态会影响巴西亚马逊河的碳循环,气候和生物多样性。在这里,我们通过分析基于卫星的年度AGB和森林面积数据集来调查AGB和森林面积的年际变化。我们发现,2019年的森林总面积损失比2015年更大,这可能是由于最近放松森林保护政策所致。但是,2019年的AGB净亏损比2015年减少了三倍。在2010–2019年期间,巴西亚马逊的累计总亏损为4.45 Pg C,而总收益为3.78 Pg C,导致AGB净亏损为0.67 Pg C.森林退化(73%)对总AGB损失的贡献是森林砍伐(27%)的三倍,因为面积退化的程度超过了森林砍伐的程度。这表明森林退化已成为驱动碳损失的最大过程,应成为更高的政策重点。

04

图论碎碎念(1)

Hello,大家好~~~这一期是图论碎碎念系列的第一篇推送。图论是一个范围非常广的理论。很多最优化的问题如排队论,存储论都可以抽象成图论问题来解决。再比如说现在鼎鼎有名的AI。它也包括很多图论内容。在另一个系列中,神经网络系列,ANN是不是就可以看成是一个多层图?再比如说前两天有个医学讲座,据说在《柳叶刀》上发表了一篇文章。在医学领域方面应该算是顶刊了。他对泰国的同性恋做了一个调查,对艾滋病染病途径黑箱进行了研究。具体文章名忘了,不过他的方法就是随机森林。什么叫随机森林呢?森林顾名思义,由树组成。组成森林的树也可以算一种图。这里不对图论做非常学术性或者是局限性的定义,要把它铺开来看。再比如说,工程领域的单代号网络图,双代号网络图,还有大名鼎鼎的甘特图等等等都是非常实用的工具,(广联达的梦龙斑马相信很多中建的都用过)。很多大家日常经常使用的一些理论工具,或者说是一些经验性的成果,其实都是在图论的基础上进行研究和创新的。所以说图论在日常生活中也好,在学术界也好,在工业界也好,其实是有非常广泛用途的。

01

周志华最新论文挑战深度学习 | 深度森林:探索深度神经网络以外的方法

【新智元导读】西瓜书《机器学习》作者、南京大学周志华日前发表论文,提出了一种基于树的方法,挑战深度学习。在设置可类比的情况下,新方法 gcForest 取得了和深度神经网络相当甚至更好的结果,而且更容易训练,小数据也能运行,更重要的是相比神经网络,基于树的方法不会存在那么困难的理论分析问题。周志华和冯霁在论文里写道,“我们认为,要解决复杂的问题,学习模型也需要往深了去。然而,当前的深度模型全部都是神经网络。这篇论文展示了如何构建深度树(deep forest),为在许多任务中使用深度神经网络之外的方法打开了

011

WWW 2022 | 结合高效整数规划求解,快手提出多元因果森林模型,智能营销效果显著

机器之心专栏 作者:快手社区科学部 在本文中,快手的研究者们提出了一种新的 HTE 预估方法——多元因果森林模型,并且结合高效的整数规划求解算法,效果显著优于业界常用的几种树模型方法。 在智能营销场景下,比如美团的满减优惠券,淘宝的购物红包等,需要形成系统化的营销决策。基于此类场景,快手为了实施更细粒度的营销决策,提出了一种新的多元因果森林模型。基于快手亿级别的用户量,快手社区科学部设计了资源分配并行算法,高效产出智能营销决策。为了解决多元因果模型的评估问题,该研究利用随机匹配的思想,提供了一个供业界参考

07
领券