腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
指定
sampsize
不会
提高
randomForest
的
速度
?
、
、
、
、
我正在尝试使用
randomForest
包在R中
的
上运行随机森林回归。我遇到了所需计算时间
的
问题,即使是在并行使用doSNOW和10-20个内核
的
情况下也是如此。我想我误解了函数
randomForest
中
的
"
sampsize
“参数。当我将数据集子集到100,000行时,我可以在9-10秒内构建一棵树。., data=t100K, ntree=1, importance=T)) #~10sec 但是,当我在运行
randomForest
的<
浏览 10
提问于2018-03-04
得票数 1
回答已采纳
1
回答
随机森林中
的
样本大小误差
我想为R中
的
列表设置不同
的
采样大小,我希望看到3个不同
的
RF返回,但在R“(
randomForest
)对象不能被强制为类型‘整数’”中出现错误。我
的
代码如下
sampsize
_vect[[1]]<- rep(6670,3)
sampsize
_
浏览 0
提问于2012-04-08
得票数 0
回答已采纳
3
回答
分层抽样似乎
不会
改变
randomForest
结果
、
我正在使用R中
的
randomForest
软件包来建立几个物种分布模型。我
的
反应变量是二进制(0 -缺席或1-存在),而且相当不平衡--对某些物种来说,缺席:存在
的
比率是37:1。这种不平衡(或零通胀)导致了可疑
的
出柜误差估计--缺席与在场
的
比率越大,我
的
出柜(OOB)错误估计值就越低。factor(Region), data = bll_HH, ntree = 500, replace = FALSE, importance = TRUE, strata = bll_H
浏览 8
提问于2013-11-22
得票数 4
回答已采纳
1
回答
R-
randomForest
中
的
上采样
、
、
我有一个高度不平衡
的
数据,并希望对少数类进行上采样以
提高
准确性(少数类是感兴趣
的
对象)。谢谢。
浏览 6
提问于2013-02-15
得票数 1
4
回答
关于加快随机森林
速度
的
建议
、
我正在使用
randomForest
包做一些工作,虽然它工作得很好,但可能很耗时。谁有什么建议可以加快
速度
呢?我使用
的
是带有双核AMD芯片
的
Windows7系统。为
randomForest
的
东西工作。谢谢。我正在使用rF进行一些分类工作(0和1)。数据有大约8-12个可变列,训练集是10k行
的
样本,所以它
的
大小还不错,但并不疯狂。我在运行500棵树和2、3或4
的
距离。(t22[,-c(1,2,7,12)],t22$Fail +
浏览 0
提问于2011-10-20
得票数 23
回答已采纳
3
回答
如何在R
的
randomForest
中使用类?
、
我有一个高度不平衡
的
数据集,目标类实例
的
比率为60000:1000:1000:50 (即总共4个类)。我想使用
randomForest
来预测目标类。实际上,在我玩
sampsize
的
时候,第一类
的
准确率下降了,尽管其他类预测
的
改善非常微小。在挖掘归档文件
的
过程中,我偶然发现了
randomForest
()
的
另外两个特性,即strata和classwt,它们用于解决类不平衡问题。(假设上面的情况下目标变量中有4个类) 另一
浏览 113
提问于2013-11-28
得票数 27
3
回答
R中用于回归
的
RandomForest
、
、
我正在试验R和
randomForest
包,我有一些使用支持向量机和神经网络
的
经验。我
的
第一个测试是尝试回归:sin(X)+高斯噪声。使用神经网络和支持向量机,我得到了sin(x)
的
“相对”好
的
近似值,这样噪声就被过滤掉了,学习算法也
不会
过拟合。(对于合适
的
参数)当在
randomForest
上做同样
的
事情时,我得到了一个完全过拟合
的
解决方案。我简单地使用(R 2.14.0,也在2.14.1上试用,以防万一): libr
浏览 1
提问于2012-02-13
得票数 8
1
回答
R
randomForest
中节点大小
的
副作用?
、
、
、
我目前正在开发一个
randomForest
模型。在我
的
配置中,我意识到高
的
节点大小值是使用交叉验证
的
性能更好
的
配置。对于nodesize = nrow(data)+4:library(data.table) n = 10,预测都是相同
的
。对我来说,节点大小是节点中执行拆分所需
的
最小记录
浏览 0
提问于2016-10-18
得票数 1
1
回答
随机森林类权值
的
计算
、
、
、
我注意到我
的
数据有轻微
的
阶级不平衡,所以我试图优化我
的
训练模型,并通过提供班级权重来重新训练我
的
模型。我提供了以下类权重
的
值。cwt <- c(0.385,0.614) # Class weights我使用以下代码训练模型 ntree=nt, mtry=mt,importance=TRUE, proxim
浏览 1
提问于2019-07-17
得票数 2
回答已采纳
1
回答
当护林员不是一种选择时,使插入符号训练rf更快
、
、
、
我试图运行
的
网站代码是使用一个旧版本
的
R,不接受游侠作为库。我必须使用插入符号包。我试图在我
的
列车数据帧中处理大约80万条线路,下面是我使用
的
代码 tuneGrid = tunegrid,看看前面的文章,我试着调整我
的
控制参数我是否能够
指定
一个特定<em
浏览 11
提问于2022-04-24
得票数 1
回答已采纳
4
回答
学习随机森林分类器能按树调整样本大小,处理类不平衡吗?
、
、
、
、
关于滑雪板随机森林
的
简单问题: 在随机森林
的
R实现(称为
randomForest
)中,有一个选项
sampsize
()。这允许您根据结果来平衡用于训练每棵树
的
样本。例如,如果您试图预测结果是正确还是错误,并且培训集中90%
的
结果是假
的</
浏览 2
提问于2013-11-27
得票数 6
回答已采纳
1
回答
R中随机林分层抽样
我在
randomForest
的
文档中阅读了以下内容 样本大小:要绘制
的
样本
的
大小。为供参考,该函数
的
接口如下: mtry=if (!else floor(sqrt(ncol(x))), replace=TRUE, classwt=NULL, cutoff,
浏览 5
提问于2013-02-12
得票数 8
回答已采纳
4
回答
R将多个
randomForest
对象放入一个矢量中
、
、
我正在使用随机森林包处理较大数据
的
子集,并希望将每个版本存储在列表中。:for(i in 1:10){answers <- (rbind(answers, RF))这种方法是可行
的
,但下面是单个RF对象
的
输出: >
浏览 3
提问于2011-10-19
得票数 8
回答已采纳
1
回答
为什么
PyTorch比滑雪板模型更快?
、
、
、
、
最近,我了解了Python
的
蜂鸟库。我在一个有两个标签
的
10m大小
的
数据集上训练了一个
RandomForest
。用sklearn进行推断需要450 ms。但是,在将相同
的
模型转换为PyTorch后,现在需要128 on
的
CPU推理。 如果两者都运行在CPU上,那么
为什么
蜂鸟
的
Pytorch模型比sklean模型更快呢?我不明白蜂鸟对我
的
滑雪板模型做了什么来
提高
速度
。
浏览 0
提问于2020-06-23
得票数 1
回答已采纳
1
回答
利用并行处理优化封装
randomForest
速度
、
、
、
我如何才能获得以下代码(替代代码也会很棒),以
提高
使用多核并行方法对回归方程进行
randomForest
分析
的
速度
?paste(a, "~", b)) {
randomForest
(fo
浏览 0
提问于2019-04-17
得票数 0
2
回答
卡雷特-随机森林不起作用:“有些地方不对劲;所有精确
的
度量值都丢失了:”
、
、
第一个链接表明响应变量
的
级别不能是0和1。在我
的
数据中,情况并非如此: Factor w/ 2 levels "No","Yes": 1 1 1 1 1 1 1 1 1 1 ...312670L, 152593L, 50020L, 220877L, 13104L, 20888L, 319386L, 代码(更新):libra
浏览 0
提问于2015-10-12
得票数 6
回答已采纳
1
回答
Windows上使用doSNOW
的
R中
的
并行计算:如何将结果从集群传回主机
、
在Windows上使用R中
的
集群时,我一直在尝试找到一种简单
的
方法来将结果从集群传输到主服务器。如果结果是一个数组或一个简单
的
数字,foreach / %dopar%语句
的
.combine选项会处理这一点,但如果结果是一个复杂
的
对象让这样
的
randomForest
模型,如何将整个模型从从集群传输回主集群如果有人知道一种更优雅
的
方法,或者
为什么
assing不起作用,我很感谢你
的
意见。-------------
浏览 0
提问于2012-05-23
得票数 3
4
回答
如何
提高
randomForest
性能?
、
、
我有一个38 MB大小
的
训练集(包含420000行
的
12个属性)。我正在运行下面的R片段,使用
randomForest
来训练模型。这对我来说需要几个小时。rf.model <-
randomForest
( data=newdata,有人能告诉我怎样才能
提高
我
的
表现吗?我
的</em
浏览 2
提问于2014-04-15
得票数 19
回答已采纳
1
回答
随机森林:k折交叉验证
的
OOB?
、
、
、
我是机器学习
的
新手,目前我正在尝试使用R中
的
插入符号和
randomForest
包实现随机森林分类。我正在使用trainControl函数,并反复进行交叉验证。也许这是一个愚蠢
的
问题,但据我所知,随机森林通常使用装袋将训练数据分成不同
的
子集并进行替换,使用1/3作为验证集来计算OOB。但是,如果您
指定
要使用k折交叉验证,会发生什么情况?从插入符号文档中,我假设它只对重采样使用交叉验证,但是如果它只使用交叉验证,
为什么
仍然会得到OOB错误?或者,打包仍然用于模型<
浏览 1
提问于2021-03-19
得票数 0
1
回答
是否应该使用X-UA兼容来减少解析/呈现HTML页面的时间?
、
、
、
、
在Internet Explorer (8、9或10)中,如果我使用值IE=edge,chrome=1
指定
,与不包含任何对X-UA-Compatible
的
引用相比,浏览器解析/呈现HTML页面的
速度
是否更快在我
的
例子中,我100%确定IE
不会
进入信息兼容模式进行渲染,所以我想看看添加页眉是否会
提高
页面的负载。
浏览 0
提问于2012-04-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
可能没有你想象的那么复杂!
使用yuicompressor压缩js和css文件的两种方式
90%的程序员不懂数据库的索引知识,看完之后你就懂了
数据库的索引解析
随机森林的简单实现
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券