Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在计算集群上训练RandomForest很慢

在计算集群上训练RandomForest很慢
EN

Stack Overflow用户
提问于 2014-03-25 14:08:30
回答 1查看 2.5K关注 0票数 4

我有一个计算机集群的帐户,而不是在Linux上运行的。我正在使用scikit-学习训练一个随机森林分类器与1000棵树在一个非常大的数据集。我试图通过运行以下代码来使用计算集群的所有核心:

代码语言:javascript
运行
AI代码解释
复制
clf = RandomForestClassifier(n_estimators=1000, n_jobs=-1)
clf.fit(data, Y)

但是,当我运行代码时,我看到只有1.2%的CPU被使用!那么为什么它没有使用所有存在的核心呢?请问如何解决这个问题?

编辑:我看到我的问题可能与这个链接中的问题有关,但我无法理解解决方案。https://github.com/scikit-learn/scikit-learn/issues/1053

EN

回答 1

Stack Overflow用户

发布于 2014-03-25 14:47:40

这可能不是问题的根源(因为n_jobs=-1应该自动检测和使用主节点中的所有内核),但是Sklearn将在集群中的单个机器的所有内核中并行运行。默认情况下,它不会在集群中来自不同机器的核心上运行,因为这意味着了解集群的体系结构,并通过sklearn不知道如何进行通信的网络进行通信,因为它因集群而异。

为此,您必须使用类似于ipython并行的解决方案。如果您想要使用集群的全部功能,请参阅Oliver的优秀教程

我建议您将sklearn更新到最新版本,在本地尝试代码(最好是在相同的OS、sklearn版本下),通过设置n_jobs=1,2,3...和基准测试fit来调试缩放行为和CPU利用率。例如,如果n_jobs=1在集群中的一个核心中没有很高的利用率,但在您的本地PC中却具有很高的利用率,这将表明集群而不是代码出现了问题。有时候,集群中的top命令的行为会有所不同,您应该与admin进行协商。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22647344

复制
相关文章
在 Kubernetes 上编排 MongoDB 集群
无状态应用在 Kubernetes 中的使用非常方便,但是对于一些有状态应用部署还是相对较麻烦,虽然也有单独的 StatefulSets 资源对象来处理有状态应用,但是毕竟不具有通用性,有状态应用的编排和具体的应用息息相关,比如 MongoDB、ElasticSearch、Redis、Zookeeper 等应用。我们这里不再对 StatefulSets 的具体使用展开介绍了,将通过部署一个可扩展的 MongoDB 集群为例进行说明。
我是阳明
2020/08/11
4.6K2
在 Kubernetes 上编排 MongoDB 集群
在TKE上新建托管集群
腾讯云容器服务(Tencent Kubernetes Engine ,TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务
马凌鑫
2019/04/10
9160
centOS上使用Git下载代码很慢
JaneYork
2023/10/11
3480
centOS上使用Git下载代码很慢
在现有 Kubernetes 集群上安装 KubeSphere
KubeSphere是在 Kubernetes 之上构建的企业级分布式多租户容器管理平台,提供简单易用的操作界面以及向导式操作方式,在降低用户使用容器调度平台学习成本的同时,极大减轻开发、测试、运维的日常工作的复杂度,旨在解决 Kubernetes 本身存在的存储、网络、安全和易用性等痛点。除此之外,平台已经整合并优化了多个适用于容器场景的功能模块,以完整的解决方案帮助企业轻松应对敏捷开发与自动化运维、微服务治理、多租户管理、工作负载和集群管理、服务与网络管理、应用编排与管理、镜像仓库管理和存储管理等业务场景。
jwangkun
2021/12/23
9600
在现有 Kubernetes 集群上安装 KubeSphere
在TKE(Kubernetes)集群上安装Rancher
Rancher是一个开源的企业级容器管理平台。通过Rancher,使用者再也不必自己使用一系列的开源软件去从头搭建容器服务平台。Rancher提供了在生产环境中使用的管理Docker和Kubernetes的全栈化容器部署与管理平台。
马凌鑫
2020/03/31
3.6K2
在TKE(Kubernetes)集群上安装Rancher
在腾讯云CVM上搭建Hadoop集群
本教程将介绍如何在腾讯云CVM上搭建Hadoop集群。Hadoop中是一个Apache的框架,可以让你通过基本的编程处理跨服务器集群的分布式方式的大型数据集。Hadoop提供的可扩展性允许你从单个服务器扩展到数千台计算机。它还在应用层提供故障检测,因此它可以检测和处理故障,作为高可用性服务。
林岑影
2018/08/01
8.7K1
在腾讯云CVM上搭建Hadoop集群
【Hadoop】17-在集群上运行MapRedece
本地作业运行器使用单JVM运行一个作业,只要作业需要的所有类都在类路径(classpath)上,那么作业就可以正常执行。在分布式的环境中,情况稍微复杂一些。开始的时候作业的类必须打包成一个作业JAR文件并发送给集群。Hadoop通过搜索驱动程序的类路径自动找到该作业JAR文件,该类路径包含JonfConf或Job上的setJarByClass()方法中设置的类。另一种方法,如果你想通过文件路径设置一个指定的JAR文件,可以使用setJar()方法。JAR文件路径可以是本地的,也可以是一个HDFS文件路径。通过使用像Ant或Maven的构建工具可以方便地创建作业的JAR文件。当给定范例所示的POM时,下面的Maven命令将在包含所有已编译的类的工程目录中创建一个名为hadoop-example.jar的JAR文件:
用户7886150
2020/12/08
8310
随机森林RandomForest
曾听人说,几乎每一个搞机器学习的人,都有一个自己特别喜欢的算法。确实如此,像我这种每次被单词都从a开始背到渣渣,就对我首次接触的算法情有独钟。不管什么问题都喜欢从我钟爱的算法开始分析建模。
Coder的技术之路
2021/05/14
4880
随机森林RandomForest
在VirtualBox上使用Bosh部署Zookeeper集群
安装 VirtualBox 略 $ VBoxManage --version 5.1.22r115126 安装Bosh $ wget -c https://s3.amazonaws.com/bosh-cli-artifacts/bosh-cli-2.0.48-linux-amd64 $ chmod +x bosh-cli-* $ sudo mv bosh-cli-* /usr/local/bin/bosh 安装完成后运行下面命令确认安装成功 $ bosh -v version 2.0.48-e94aeeb-
kongxx
2018/05/14
1.3K0
使用kubeadm在腾讯云上搭建Kubernetes集群
2.关闭seleniux、iptables、firewalld和NetworkManage
pengsiryan
2020/03/20
2.4K0
Flagger 在 Kubernetes 集群上是如何工作的?
通过前面一节的 Flagger基本学习,这节学习它的工作原理,以帮助加深理解应用!
philentso
2022/12/26
2.3K0
在 Docker 上建立多节点的 Hadoop 集群
在上篇文章中你已经看到了在你的devbox创建一个单点Hadoop 集群是多么简单。
星哥玩云
2022/07/01
1.1K0
在腾讯云上使用kubeadm搭建Kubernetes集群
容器技术在国内已经非常火爆,作为IT从业者的一员,必须跟上时代的浪潮,掌握容器相关技术。提到容器技术必然会提到容器的编排系统,在众多编排系统中Google的Kubernetes已跑在了行业的最前端,本文将介绍如何使用kubeadm快速的搭建一套用于学习和测试的kubernetes集群。
Hunter
2019/11/19
4.6K0
在腾讯云TKE上构建集群详细教程
以节点(8核16G,带宽按量计费,外网带宽100Mbps,系统盘配置50GB高性能云硬盘)为例,说明购买步骤。
cailynyu
2022/04/06
2.2K0
为什么不提倡在训练集上检验模型?
在你开始接触机器学习时,通常你会从读取一个数据集并尝试使用不同的模型开始。你可能会疑惑,为什么不用数据集中的所有数据来训练及评估模型呢?
用户1085347
2018/02/05
1.9K0
为什么不提倡在训练集上检验模型?
在NVIDIA Jetson集群上运行集群管理软件K3s
这次我们以Kubernet的轻量级管理工具K3S在这个4节点设备上搭建Docker容器集群管理功能,主要目的如下:
GPUS Lady
2021/01/06
2.7K0
在NVIDIA Jetson集群上运行集群管理软件K3s
手把手教你在CentOS上搭建Kubernetes集群
[root@localhost ~]# yum install -y net-tools
小小科
2019/08/26
8330
点击加载更多

相似问题

如何计算R中的randomForest训练

15

randomForest **有时**预测()在训练数据集上的NA

13

火花RandomForest训练StackOverflow误差

10

在集群中的不同节点上并行运行RandomForest

11

weka RandomForest是否使用bootstrap获取训练集

11
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档