腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
识别
ML
模型
是否
过度
拟合
数据
集
?
、
、
我一直在比较sklearn中的不同回归
模型
,在这样做的过程中,我对我得到的
模型
的评分值感到困惑。在下面的代码中,您可以看到我同时使用了线性回归和岭回归,但是训练和测试
数据
集
的分值差异很大。---RIDGE REGRESSIONTest Score 0.32642156452579363 我的问题是,训练
数据
集
和测试
数据
集
的分值之间的较小差异
是否</em
浏览 19
提问于2019-04-25
得票数 0
1
回答
确定决策树回归使用的关键列/功能
、
、
在Azure
ML
中,我有一个使用boosted决策树回归的预测回归
模型
,它相当准确。
如何
识别
此信息?我很高兴将结果
数据
<e
浏览 0
提问于2017-07-10
得票数 0
1
回答
要部署的最终
模型
的预处理
、
、
、
、
通常,对于
ML
工作流,我们导入
数据
(X和y),将X和y划分为train、valid和test,对train、valid和test的
数据
进行预处理(缩放、编码、计算nan值等),执行HP调优,在得到最佳HP
模型
后,将最终
模型
拟合
到整个
数据
集
(即X和y)。因此,当在X和y上
拟合
最终
模型
时,我们将得到一个错误,因为我们还没有对X和y进行编码(并执行其他预处理步骤)。那么我们应该
如何
在整个
数据</e
浏览 0
提问于2021-11-29
得票数 1
回答已采纳
1
回答
为什么当我们使用相同的
数据
集
来训练
模型
时,训练
数据
集
的准确性并不总是100%?
、
、
虽然基于树的
ML
算法在训练
数据
集
上的准确率是100%,但是为什么不是每次都这样。我知道这会导致
过度
拟合
,但是为什么不每次在我们的
模型
被训练的
数据
集
上都有100%的准确性呢?
浏览 0
提问于2023-02-15
得票数 0
回答已采纳
4
回答
在火车上99%的准确率和在测试中96%的准确性是不是太过分了?
、
、
、
、
我有一个二进制分类问题,类比较均衡(57%-43%),使用随机森林分类器的GridSearch获得了最佳的超参数,并应用该
模型
进行了训练和测试。现在我在火车上有99%的准确度,在测试中有96%。
浏览 0
提问于2022-12-27
得票数 2
1
回答
我
如何
理解yolov4训练
是否
过
拟合
?
、
、
、
、
我正在训练
如何
在自定义
数据
集中使用YOLOv4进行人类检测。我使用以下命令训练
数据
集
: !.但当我观察测试
数据
时,它在视频记录中提供了大约80%的准确率。它是不是太合适了?我该
如何
解决这个问题?我认为图表中的准确性应该越来越高。
浏览 20
提问于2021-04-12
得票数 0
1
回答
何时/
如何
使用神经网络超参数扫描的验证
集
?
、
、
、
我对
如何
使用验证
集
感到非常困惑。我知道他们被用来执行超参数扫描,但我不太确定是以什么方式。例如,假设我试图在一个有一个隐藏层和一个有两个隐藏层的神经网络之间做出决定,并且我有一个50/25的训练/验证/测试分割的
数据
。我不会执行k-折叠简历,因为这是我的问题的内在原因。我
是否
应该在培训期间使用验证
集
(以防止
过度
拟合
)和在事实之后使用相同的验证
集
(当
模型
被完全训练时)以确定哪个
模型
更好?何
浏览 0
提问于2020-02-21
得票数 1
1
回答
集成
模型
中验证
集
的增强
、
、
、
、
我有8个
模型
,我已经培训了90%的集合(培训
集
),并跟踪其性能损失的验证
集
(10%的原始
集
)。我想通过将不同的
模型
与稠密层混合来生成一个集合
模型
。然而,验证
集
只包含64个样本,我担心这可能会导致严重的
过度
拟合
。我想知道增加验证
数据
是否
有意义,这样我就可以增加实例的数量,并帮助防止
过度
拟合
。
浏览 0
提问于2020-07-21
得票数 1
3
回答
我怎样才能知道我的conv1D
模型
是被
过度
安装,还是从损耗曲线中被低估?
、
、
我正在研究时间序列多元
数据
的分类。通过进行主成分分析,我将多变量转换为单变量,并将其输入角点中的conv1d中.我已经确保我没有混合培训和验证
数据
集
。我对这两个
数据
集
进行了相互独立的洗牌。我对3728个样本进行了训练,在610个样本上进行了验证。
浏览 0
提问于2019-06-22
得票数 5
回答已采纳
2
回答
如何
避免
过度
拟合
(Encog3 C#)?
、
、
问题是我不确定
如何
防止
过度
拟合
。我知道我必须将
数据
分成训练
集
、测试
集
和评估
集
,但我不确定在哪里以及何时使用评估
集
。目前,我将所有
数据
分成训练和测试
集
(50%,50%),在一个部分训练网络,在另一个部分进行测试。准确率为85%。我的问题是,
如何
使用评估
集
来避免
过度
拟合
?我对评估
集
感到困惑,任何帮助都将不胜感激。
浏览 1
提问于2015-06-10
得票数 0
1
回答
什么是“空间特征编码”?有人能举出一个具体的例子吗?
、
、
另一方面,与以往主流的图像
识别
方法(如HAAR、SIFT、HOG图像特征和spatial feature encoding、随机森林或支持向量分类器)相比,CNN
模型
具有更高的建模能力。考虑到在
模型
训练过程中需要适应的数百万个参数(比以前的管道多得多),CNN的表示增强了计算机图像
识别
模型
的能力,使其能够很好地处理更具有挑战性的成像问题。主要的风险是
过度
拟合
,因为
模型
的能力通常很高,深入学习,但
数据
集
往往非常有限(这
浏览 0
提问于2019-07-16
得票数 2
回答已采纳
2
回答
J48算法与ID3算法输出的WEKA差异
、
、
我有一个
数据
集
,我在WEKA中使用J48和ID3算法进行分类。
浏览 3
提问于2015-04-09
得票数 0
1
回答
我能用训练过的
数据
来测试我已经训练过的
模型
吗?
、
我有一个预测多个问题答案的
模型
。我使用了一个80/20的火车测试分裂我的问题,并调整它。我现在可以用同样的问题,它被训练和测试,以重新测试所有的问题,但为了确定赢得比赛的百分比?或者,在最初训练我的
模型
时,训练
数据
和测试
数据
是否
应该通过游戏而不是问题来分割?
浏览 0
提问于2019-04-24
得票数 1
1
回答
理解Scala中使用"randomSplit“进行机器学习的
数据
分割问题
、
、
嗨,我是MLlib的新手,我正在阅读星火网站上有关这方面的文件。我很难理解为什么在下面的代码中我们需要缓存"0“用于培训,"1”用于测试: val training = splits(0).cache()有人能帮我理解原因吗?据我所知,我们需要正负样本,所以"1“可以是正的,"0”可以是负的,为什么要这样划分呢?
浏览 2
提问于2014-07-21
得票数 5
回答已采纳
5
回答
如何
提高损耗避免过
拟合
、
、
、
、
building-powerful-image-classification-models-using-very-little-data.html的第一部分中建议的体系结构来构建一个2类图像分类器对于前几个历元(约20),训练和验证误差一直在减少,直到测井损失达到0.4 (到目前为止我得到的最好值)之后,
模型
开始
过度
拟合
,验证损失不断增加。我知道我可以通过降低网络复杂性和增加辍学来防止
过度
拟合
,但这也降低了训练的准确性。 请提出一些建议,以
浏览 0
提问于2018-04-09
得票数 6
1
回答
MNIST超
拟合
、
、
、
、
我目前正在处理MNIST
数据
集
。我的
模型
已经对训练
数据
进行了
拟合
,我希望通过使用weight_decay来减少
过度
拟合
。这样我就可以在x轴上绘制不同数量的weight_decay,并在y轴上显示验证
集
的性能。我该怎么做?将值存储在列表中,并使用for循环来迭代?下面是我尝试过的代码。
浏览 8
提问于2022-03-28
得票数 0
1
回答
关于
过度
适应和击打的问题
、
、
因此,我理解,当您有良好的精度,例如,训练
数据
集
和测试
数据
集
的一个坏的准确性,但为什么我甚至要检查训练
数据
集
的准确性?如果我在测试
数据
集
上有很好的准确性,这意味着我很有可能不会
过度
适应,对吗?(假设我们确保
模型
没有对任何测试
数据
进行训练) 我还有另一个问题:使用SMOTE的
过度
采样
是否
会导致
过度
拟合
(测试
数据
<
浏览 0
提问于2022-12-30
得票数 0
回答已采纳
1
回答
如何
使用验证
集
来减少
过度
拟合
的朴素贝叶斯?
、
使用验证
集
减少
过度
拟合
的正确步骤是什么? 假设我将
数据
分成80:10:10 (培训:验证:测试)。我在训练
集
上训练,然后得到90%的准确度。我把这个
模型
应用到验证集中,然后得到20%。那我该怎么办?
如何
使用验证
集
来减少
过度
拟合
,特别是参照Na ve Bayes?
浏览 0
提问于2018-11-07
得票数 1
3
回答
是否
应该训练确定性
模型
分裂成火车,测试
数据
集
?
、
研究了确定性的GLM
模型
(OLS
模型
、Logistic回归
模型
、零膨胀
模型
等)与某些CART
模型
(随机森林
模型
、LightGBM
模型
、CatBoost
模型
等)之间的区别。这是基于随机预测的。我听说,对于随机
模型
,我们应该分成训练和测试,以避免
过度
拟合
,这在确定性
模型
中不会发生,因为它们使用线性规划来寻找最佳参数。我的看法是这是真的。确定性
模型
浏览 0
提问于2021-09-22
得票数 2
1
回答
在Date列中添加
是否
会导致
过度
拟合
?
、
我正在处理一个
数据
集
,以及
如何
预测
是否
会下雨,所以我应该包括date列。我还没有建立
模型
,但我认为它会导致
过度
拟合
。
浏览 0
提问于2020-02-24
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何构建自定义人脸识别数据集
Mozilla开源语音识别模型和世界第二大语音数据集
伯克利与MIT最新研究:CIFAR-10分类器能否泛化到CIFAR-10中?
利用正则化方法避免过拟合问题
Kaggle机器学习比赛前top2%成绩的技巧
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券