腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3209)
视频
沙龙
1
回答
使用
‘脱
字符
’
包
对
随机
森林
进行
K-
折
验证
时
的
变量
编码
、
、
、
、
我想运行一个RF分类,就像在'randomForest‘中指定
的
一样,但仍然
使用
k重重复交叉
验证
方法(代码如下)。如何阻止插入符号从我
的
分类
变量
中创建虚拟
变量
?我读到这可能是由于一个热
编码
,但不确定如何改变这一点。我将非常感谢一些关于如何解决这个问题
的
例子!$ protected_area: num 7.55 10.93 2.84 2.89 12.71 … 剩下
的
: > control <- trainCont
浏览 9
提问于2020-10-23
得票数 0
回答已采纳
1
回答
如何自动排除predict.randomForest中未见
的
新因素水平?
、
、
我正在
使用
ramdomForest
包
创建一个
随机
森林
模型。也许数据集是巨大
的
,有100多万个200+
变量
的
观测结果。当
使用
样本数据训练
随机
森林
时
,我无法捕获所有
变量
的
所有因素级别。因此,在
使用
predict()
对
验证
集
进行
预测时,它会抛出一个错误,因为存在新
的
因素级别,而这些
浏览 5
提问于2015-09-28
得票数 2
回答已采纳
2
回答
如何替换包randomForest r中
的
引导步骤?
、
、
、
、
例如,我训练了一个经过增强训练
的
模型,并将其与
随机
森林
训练模型(R
包
randomForest)
进行
了比较。 我
使用
时间序列数据,其中解释
变量
是其他数据和因
变量
的
滞后值。由于某种原因,
随机
森林
的
表现严重不足。我能想到
的
问题之一是,
随机
森林
对
每棵树
的
训练数据执行一个抽样步骤。如果对时间序列数据这样
浏览 6
提问于2015-08-17
得票数 5
回答已采纳
1
回答
随机
森林
:k
折
交叉
验证
的
OOB?
、
、
、
我是机器学习
的
新手,目前我正在尝试
使用
R中
的
插入符号和randomForest
包
实现
随机
森林
分类。我正在
使用
trainControl函数,并反复
进行
交叉
验证
。也许这是一个愚蠢
的
问题,但据我所知,
随机
森林
通常
使用
装袋将训练数据分成不同
的
子集并
进行
替换,
使用
1/3作为
验证
集来计算OOB。
浏览 1
提问于2021-03-19
得票数 0
1
回答
MATLAB交叉值函数向单元阵列抛出错误
、
、
、
matlab crossvalind函数
进行
K-
折叠交叉
验证
.当我试图运行indices = crossvalind('Kfold',seqs,2);
时
,我得到以下错误: seqs{1} - Group 1 seqs{2
浏览 2
提问于2017-06-19
得票数 2
回答已采纳
5
回答
选择二进制分类算法
、
、
、
、
我有一个二进制分类问题:10个属性,包括二进制、数字和范畴 这类问题
的
最佳选择是哪种算法?默认情况下,我将从SVM (将标称属性值转换为二进制特性)开始,因为它被认为是相对干净且不含噪声
的
数据
的
最佳选择。
浏览 0
提问于2014-06-15
得票数 20
回答已采纳
1
回答
如何处理最新
的
星火
随机
森林
的
分类特征?
、
、
、
、
在
随机
森林
的
Mllib版本中,有可能用参数categoricalFeaturesInfo指定具有名义特征(数值但仍然是绝对
变量
)
的
列,那么ML
随机
森林
是什么呢?在用户指南中,它
使用
VectorIndexer来转换向量中
的
分类特征,但是它被写成“自动识别分类特征,并
对
它们
进行
索引” I发现,在
随机
森林
中,数字索引无论如何都被视为连续
的
特性,因此建
浏览 1
提问于2017-10-15
得票数 6
回答已采纳
2
回答
随机
森林
交叉
验证
K折叠与插入
包
R最佳auc
、
、
、
、
我有一个相当严重
的
问题,我已经很多天没能解决了!我不明白插入
包
的
训练控制功能是如何在R中工作
的
,我需要交叉
验证
(10倍)
的
随机
森林
,并认为插入
包
一次只能自动选择一个测试集( 10 %
的
数据集),并
验证
随机
林中
的
随机
林型( 90%
的
数据集)。web上
的
所有教程都输入了列车功能
的
培训集和预测函数<
浏览 3
提问于2020-12-14
得票数 1
1
回答
not NC无助于
对
我
的
混合连续/分类数据集
进行
过采样。
、
、
当我
使用
SMOTE
对
四类分类问题中
的
三类
进行
过采样
时
,针对少数类
的
Prec、Recall和F1度量仍然很低(~3%)。我
的
数据集中有32个分类
变量
和30个连续
变量
。所有的分类
变量
已被转换为二进制列
使用
一热
编码
。此外,在
进行
过采样处理之前,我将
使用
Iterativeimputer计算所有缺失
的
值。关于分类器,我
使用</em
浏览 0
提问于2019-08-09
得票数 0
1
回答
如何在R中
使用
林模型
包
向
变量
和因子添加标签,以
进行
最终
的
林图表示?
、
、
使用
森林
模型软件
包
的
林地确实是多
变量
cox回归
的
好方法。但是,我在用原始
变量
和数据因素
的
名称替换最终表示标签(即
变量
:Age 2表示“年龄”;因子:0表示"<60",1表示"≥60")
时
遇到了问题,≥
对
R
编码
的
知识有限,但我尝试了expss
包
向
变量
和因素添加标签这是我
的</e
浏览 0
提问于2019-06-15
得票数 0
1
回答
在创建交叉
验证
索引
时
随机
地重新排列数据点?
、
、
以结构化
的
方式提取数据点,即对数据点
进行
排序。我将
使用
或Matlab中
的
进行
分层交叉
验证
。 如果我
使用
上面的函数,我还需要先
随机
地重新排列数据点(行)吗?
浏览 0
提问于2016-03-11
得票数 0
回答已采纳
1
回答
数据科学学习资源在道路交通数据中
的
应用?
我
的
背景 现在,我熟悉基本
的
推断统计和R
包
(plyr、dplyr、ggplot2等)。最近,我认识到机器学习算法也有助于通过监督&
浏览 0
提问于2014-11-05
得票数 2
1
回答
如何在nnet中
使用
大小和衰减
、
我
对
神经网络世界还很陌生,所以我请求您
的
理解。我正在生成一些测试,因此我有一个关于参数size和decay
的
问题。我
使用
caret
包
和nnet方法。首先,这是
使用
插入符号
使用
nnet方法
的
最好方法吗?),但我不明白如何在实践中
使用
它们。有人能帮上忙吗?
浏览 1
提问于2017-02-23
得票数 9
回答已采纳
1
回答
通过电子邮件链接自动登录到.Net Mvc网站
、
我有一个网络应用程序,发送一个链接,以重定向到网站
的
每个用户
的
电子邮件。 此链接应重定向到包含每个电子邮件
的
特定信息
的
页面。因此,我将不得不发送一个带有链接
的
查询
字符
串(每个电子邮件
的
特定id。另外,如何保护查询
字符
串参数?
浏览 19
提问于2019-08-12
得票数 1
回答已采纳
1
回答
R
的
'randomForest‘库
的
'rfcv()’函数中
的
‘'mtry’
、
、
、
、
我想
使用
交叉
验证
来确定在
随机
森林
方法中尝试
的
变量
数量。我不知道如何在rfcv()函数中
使用
mtry参数。我相信这可以通过randomForest
包
的
rfcv()函数来完成。training_x,train
浏览 72
提问于2020-05-05
得票数 1
回答已采纳
1
回答
有意义地解释BaseN
编码
的
特征重要性
、
、
、
我有一个用户出生地
的
数据,特别是一个城市。因为我
的
数据集中有几千个城市,所以我寻找OneHot
编码
的
替代方案,因为我不想为一列向我
的
数据集中添加数千列。我发现BaseN
编码
是OneHot
的
一个很好
的
替代方案,所以我选择了它。我用基数4
对
我
的
数据
进行
了
编码
,所以现在我
使用
的
是City_0、City_1等,而不是
字符
串column
浏览 46
提问于2021-10-03
得票数 0
3
回答
用似然估计
编码
分类
变量
我正试图理解如何
使用
似然估计来
编码
分类
变量
,但到目前为止还没有取得什么成功。 如有任何建议,将不胜感激。
浏览 0
提问于2016-04-04
得票数 27
7
回答
在Python代码中运行"wc -l <filename>“
我想
对
巨大
的
文件(每个文件都有数十万行)
进行
10
折
交叉
验证
。我想在每次开始读取文件
时
执行一次"wc -l“,然后生成固定次数
的
随机
数,每次将行号写入一个单独
的
文件。我
使用
的
是:for i in files:如何在此处插入文件名。它是一个
变量<
浏览 0
提问于2011-06-29
得票数 10
回答已采纳
2
回答
基于决策树创建有监督
的
分类器
我需要R编程语言
的
帮助,我必须回答这个问题:) (a)基于决策树创建一个有监督
的
分类器。(b)
随机
分成训练集和测试集,以确定分类器
的
预测质量。 我做了这段代码,但我只是得到了所有类别的相同结果。
浏览 0
提问于2014-03-11
得票数 0
1
回答
随机
森林
分类器Matlab v/s Python
、
、
、
、
我在Python和MATLAB中
使用
了
随机
森林
分类器。在10棵树
的
集合中,我在Python中获得了80%
的
准确率,在MATLAB中仅获得了30%
的
准确率。即使MATLAB
的
随机
森林
长有100或200棵树,这种差异依然存在。 这两种编程语言之间
的
差异可能是什么原因?
浏览 5
提问于2015-05-22
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
集成学习与模型融合
基于随机森林的分类与回归
7 种机器学习算法的 7 个要点
机器学习的第一步:先学会这6种常用算法
达观数据:5分钟带你理解机器学习及分类算法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券