腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
R
对
具有
重复
K
倍
的
数据
集
进行
逻辑
回归
、
、
、
、
数据
集
由这里
的
数据
集
组成:https://www.kaggle.com/adityakadiwal/water-potability?select=water_potability.csv。假设
数据
帧由Ph、硬度、固形物、氯胺和盐分组成。 我想在10
k
倍
上运行
逻辑
回归
(例如,我希望尝试更多
的
选择)。抛开所需
的
计算能力不谈,我还想用不同
浏览 17
提问于2021-06-22
得票数 1
2
回答
K
-折叠交叉验证
的
应用与部署
、
、
、
K
折叠交叉验证是一种用于将
数据
分割成
K
个Folds数
的
技术,用于测试和培训。目的是估计机器学习模型
的
可拓性。该模型被训练
K
次,每列折叠一次,然后在相应
的
测试褶皱上测试。假设我想
对
任意
数据
集
上
的
决策树和Logistic
回归
模型与10个Folds
进行
比较。假设
对
每个模型
进行
10
倍
的
训练,并得到相应
浏览 6
提问于2022-05-20
得票数 3
回答已采纳
1
回答
多项式
回归
的
10
倍
交叉验证
、
、
我想
使用
一个10
倍
的
交叉验证方法,它测试哪一个多项式形式(第一,第二或第三阶)给一个更好
的
拟合。我想将我
的
数据
集
划分成10个子集,并从10个
数据
集中删除1个子集。导出没有此子集
的
回归
模型,
使用
导出
的
回归
模型预测该子集
的
输出值,并计算残差。最后,
对
每个子集
重复
计算例程,并将所得残差
的
平方和起来。
浏览 2
提问于2014-11-14
得票数 0
回答已采纳
2
回答
R
中createFolds随机样本
、
我想把我
的
数据
集
分成30
倍
。因此,我在
R
.I createFolds中
使用
了caret软件包中
的
caret函数,以获得可
重复
的
结果。注意事项 wdbcc是我
的
数据
集
,<e
浏览 3
提问于2020-02-05
得票数 1
回答已采纳
1
回答
过度采样只会平衡培训
集
,那么测试
集
呢?
、
、
在
数据
分类不平衡
的
情况下,我知道我们只是过采样了培训
集
(以防止
数据
从培训到测试子集
的
泄漏),但是如果我
的
测试集中没有正
数据
点怎么办?测试
集
仍然非常偏斜,只有我
的
阳性类
的
1%。我
使用
XGBoost、随机森林、Logistic
回归
和KNN
进行
分类任务。同时,我也尝试过
使用
SMOTE、SMOTE和Class_weight来
对
我
浏览 0
提问于2019-08-20
得票数 2
回答已采纳
3
回答
尺度神经网络
、
、
、
、
当
使用
神经网络(TensorFlow:深度神经
回归
)时,当将训练
数据
从样本增加到整个
数据
(例如10
倍
大
的
数据
集
)时,您应该
对
模型体系结构(更深/更宽)、学习速度和一般
的
超参数
进行
哪些更改?在这些变化中,有多少尝试和错误涉及到启发式
逻辑
?
浏览 0
提问于2019-03-21
得票数 6
1
回答
在
K
倍
交叉验证中,最终测试
集
的
意义是什么?
、
、
我正在对我
的
二元分类问题
进行
logistic
回归
,并
使用
k
折叠交叉验证(
k
=10)
对
模型
进行
了验证。但是,我不明白为什么我需要一个最终
的
测试
集
:模型
的
性能不能基于
k
折叠验证(即,来自10个结果折叠
的
度量标准)
进行
评估吗?因为,模型没有真正“看到”测试
数据
,这不是
K
折叠
的
全部要点吗?因此,最终<
浏览 0
提问于2023-04-23
得票数 0
2
回答
R
:
K
倍
交叉验证
的
列车
数据
集
、
、
我正在
使用
R
中
的
C5.0在心脏病
数据
集
上做一些分类任务,在大多数情况下,
数据
将被分成80%用于训练,20%用于测试,我想
使用
k
倍
交叉验证(
k
=10),但我
对
这一点感到困惑,正如我们所知道
的
那样,通过
使用
10
倍
交叉验证,我们将整个
数据
划分为9个训练子集和一个子集
进行
测试。是否可以将
数据
划分为训练
浏览 0
提问于2017-11-20
得票数 3
1
回答
在logistic
回归
中
重复
计算AUC是否有意义?
、
、
、
我有一个关于logistic
回归
模型和测试它
的
技巧
的
问题。我不太清楚我是否正确理解中华民国曲线是如何建立起来
的
。如果是第一种情况,是否有必要
重复
进行
随机列车试验,并将曲线下
的</e
浏览 0
提问于2021-05-26
得票数 0
1
回答
从验证精度到测试精度
的
显著下降
、
、
、
、
我对分类任务比较熟悉,虽然我一直在研究
回归
问题。给我一个大
的
训练
数据
集
(>70
k
样本)和一个独立收集
的
测试
集
(~2
k
)。在测试
集
上,我始终取得了不错
的
验证精度,但精度却明显较低。我一直在执行这样
的
验证: 3)
对
浏览 0
提问于2019-08-11
得票数 3
1
回答
决策树
回归
与交叉验证在学习中
的
应用
、
、
我
的
数据
集
有多个预测器(y =单因变量;X=多个自变量),也有单个预测器,包含足够
的
情况(> 10
k
)。以下解释适用于所有情况。因此,我试图用交叉验证(10
倍
)
对
回归
者
进行
评分,以获得更真实
的
准确性表示:rf = RandomForestRegressor() dt.fit基本KFold交叉验证指南中给出
的
解释是:每一折叠一次作为验
浏览 0
提问于2017-06-21
得票数 5
回答已采纳
1
回答
logistic
回归
的
交叉验证
我在
R
中运行
逻辑
回归
的
10
倍
交叉验证时遇到了一些问题。cv.erro
浏览 2
提问于2019-08-27
得票数 0
1
回答
R
插入包,我如何调整拦截和斜率在lm?
、
、
我试图
使用
R
插入包执行5
倍
交叉验证
的
线性
回归
模型。我是机器学习
的
新手,但我期望每一次“
重复
”,一个新
的
斜率和拦截将适合“训练”
数据
集
。然而,默认情况下,对于所有
重复
,斜率和截距保持不变,并且测试似乎只是推出了新
的
RMSE和Rsquared与每个
重复
。有没有办法允许
对
拦截
进行
调优?这是我
的
代码: regressC
浏览 1
提问于2017-01-19
得票数 1
1
回答
Azure ML Studio中
的
Evaluate Model Node不接受混淆矩阵中
数据
集
的
所有行
、
、
、
、
我有一个this dataset,其中肯定
的
类由APS系统
的
特定组件
的
组件故障组成。我正在
使用
Microsoft Azure Machine Learning Studio执行预测性维护。如下图所示,我
使用
了4种算法:
逻辑
回归
、随机森林、决策树和支持向量机。您可以看到,评分模型节点中
的
输出
数据
集
由16
k
行组成。然而,当我看到评估模型
的
输出时,在混淆矩阵中,Logistic
回
浏览 19
提问于2021-01-14
得票数 1
1
回答
基于重采样
的
参数整定/模型选择
、
、
我一直试图深入了解重采样方法
的
更多细节,并在1000行
的
小
数据
集中实现它们。
数据
被分成800个训练
集
和200个验证
集
。我
使用
K
-折叠交叉验证和
重复
K
-交叉验证来
使用
训练集训练KNN。根据我
的
理解,我
对
结果作了一些解释--但是,我
对
它们有一定
的
怀疑(见下面的问题):Resampling: Cr
浏览 0
提问于2016-07-13
得票数 0
1
回答
三级logistic
回归
、
我试图用三层logistic
回归
来分析
具有
二进制响应
的
纵向
数据
.我
的
数据
的
层次结构类似于这个例子--学生(1级)嵌套在类(2级)中,类嵌套在学校(3级)内。有人能建议我
对
SAS或
R
代码
进行
适当
的
解读,以执行三级混合效应logistic
回归
吗?我并不是要求
对
3级
逻辑
回归
背后
的
理论帮助.
使用
SAS
浏览 3
提问于2013-09-13
得票数 4
1
回答
Logistic
回归
:下降不显著
的
预测变量
、
、
我
使用
R
对
我
的
数据
集
进行
逻辑
回归
。我
的
数据
集
有50多个变量。 所面临
的
挑战是在
R
中编写代码,以评估某些记录和变量(例如,p值>.05)
的
统计有效性,并根据这样
的
参数从模型中删除记录和变量。是否有任何已经实现
的
方法来执行此操作?如有任何帮助或建议,将不胜感激。谢谢。
浏览 4
提问于2014-10-18
得票数 0
回答已采纳
1
回答
交叉验证:来自scikit
的
cross_val_score函数-学习参数
、
、
、
、
根据科学
的
DOC -学习 我想知道X,y是X_train和y_tra
浏览 1
提问于2018-05-04
得票数 4
回答已采纳
1
回答
对于二进制分类,GBM需要多少
数据
才能比logistic
回归
更可靠?
、
、
当将GBM与二元分类
的
逻辑
回归
进行
比较时,两者各有优缺点。我有兴趣了解
数据
集
的
长度(行数)与适合样本
的
可靠性之间
的
一般权衡。 显然,
数据
越多,预测结果就越可靠(其他
的
数据
都是相等
的
)。
数据
行越多,GBM
对
真实
数据
集
的
预测能力就越强。所以我想知道是否有一个粗略
的</em
浏览 0
提问于2017-11-20
得票数 2
1
回答
predict_proba比较
、
我想预测单个credit_balance大于值N为真的概率LDA predict_proba是[[0.94144572 0.05855428]]我们应该看哪些参数来
浏览 0
提问于2018-04-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
在R语言中实现Logistic逻辑回归
一份机器学习的自白书
创建具有业务影响的数据科学项目:用R预测流失
交叉验证和超参数调整:如何优化你的机器学习模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券