腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3066)
视频
沙龙
1
回答
我们
可以
在
Weka
中使
用刀
切
交叉
验证
来
评估
训练
数据
集
吗
?
我想在
Weka
中使
用刀
切
交叉
验证
来
评估
训练
数据
集
。
我们
可以
通过刀
切
交叉
验证
进行
评估
吗
?
浏览 18
提问于2018-01-30
得票数 0
1
回答
使用r和
weka
。如何将元算法与nfold
评估
方法一起使用?
、
、
、
., data=iris)summary(e)现在我执行AdaBoost
来
优化分类器的参数summary(m2)
浏览 4
提问于2010-10-06
得票数 4
回答已采纳
6
回答
Weka
中的
交叉
验证
、
、
从我所读到的情况来看,我一直认为
交叉
验证
是这样执行的:
在
k次
交叉
验证
中,将原始样本随机分成k个子样本.
在
k个子样本中,保留一个子样本作为模型测试的
验证
数据
,其余的k−1子样本作为
训练
数据
。然后
交叉
验证
过程被重复k次(褶皱),每个k个子样本精确地使用一次作为
验证
数据
。从褶皱中得到的k值
可以
被平均(或以其他方式组合)
来</
浏览 8
提问于2012-05-03
得票数 29
回答已采纳
1
回答
何时使用
交叉
验证
?
、
、
Cross-validation 嗨,我正在使用
Weka
在
我的MSc论文中部署机器学习模型。我已经注意到,当我
在
训练
数据
集
中使
用10倍
交叉
验证
时,与
在
整个
数据
集
上没有
交叉
验证
的情况下
训练
模型相比,我得到了较低的
评估
指标,如果我
在
测试
数据
集
上测试该模型时获得更好的性能,这将是有
浏览 0
提问于2021-01-23
得票数 0
2
回答
Python scikits SVM网格搜索和分类
、
、
、
第一步是找到合适的支持向量机参数,我使用了嵌套
交叉
验证
的网格搜索(参见)。我
在
“网格搜索”
中使
用了我所有的样本(X)。在网格搜索期间,
数据
被分成
训练
和测试(使用StratifiedKFold)。当我得到SVM参数时,我执行分类,将我的
数据
分为
训练
和测试。在网格搜索
中使
用我将在真正的分类过程
中使
用的相同
数据
可以
吗
?
浏览 3
提问于2012-03-11
得票数 0
回答已采纳
1
回答
如何在
weka
中测试独立
数据
集
?
我有两个
数据
集
,一个是基准
数据
集
,另一个是独立
数据
集
。我
在
weka
中使
用10折
交叉
验证
测试了基准
数据
集
。
我们
可以
在
weka
中测试独立
数据
集
吗
?
浏览 13
提问于2018-01-22
得票数 0
回答已采纳
4
回答
交叉
验证
Vs。列车
验证
测试
、
我对
交叉
验证
方法和
训练
验证
-测试方法有疑问。火车:
我们
训练
模特。测试:以前从未见过
数据
。
我们
得到了一个不偏不倚的最终估计。到目前为止,
我们
已经分成了三个子集。在此之前一
切
都还好。附图如下:然后我遇到了K折叠
交叉
<
浏览 0
提问于2019-05-26
得票数 26
回答已采纳
2
回答
神经网络
训练
时
交叉
验证
?
、
、
训练
神经网络时的标准设置似乎是将
数据
分割成
训练
集
和测试
集
,并一直运行到测试
集
上的分数停止提高为止。现在,问题是:测试分数中存在一定数量的噪声,因此单个最佳分数可能不符合网络状态,而网络状态最有可能是新
数据
上的最佳状态。我见过一些论文指出
训练
中的一个特定时代或迭代是“
交叉
验证
最好的”,但我不知道这是如何确定的(论文没有提供任何细节)。“
交叉
验证
的最佳”点不是有最好的测试分数的点。 如
浏览 0
提问于2016-04-09
得票数 6
回答已采纳
1
回答
“对培训
集
的
交叉
验证
”,而开发和测试
集
与培训是不同的:这有意义
吗
?语义错误?
、
的学术文章“衡量新闻情绪”中的这段文字卡住了:https://www.sciencedirect.com/science/article/pii/S0304407620303535#tbl3 “作为最佳实践,
我们
将标记的
数据
集
分成一个
训练
集
开发和测试
集
各有100个观测值,为
训练
集
留下600个观测值。(.)超参数优化是通过网格搜索进行的,
在
训练
集</e
浏览 0
提问于2022-10-10
得票数 3
1
回答
weka
机器学习分类与预测
、
、
我使用
weka
J48分类
来
预测真假。我几乎有999K的
训练
集
,我用来
训练
模型。采用3倍
交叉
验证
方法对模型进行
训练
,精度达到84%。 我
在
java
中使
用
weka
api。
浏览 7
提问于2015-11-23
得票数 1
4
回答
在
训练
集
上
评估
一个模型是一个好的实践
吗
?
、
、
、
、
对
训练
集
模型进行评价(即
训练
训练
模型,
在
同一
训练
集
上
评估
回归误差/精度),并将评价结果与模型回归误差/
交叉
验证
(
我们
在
同一
训练
集
上进行
交叉
验证
)和测试
集
的精度进行比较,以检查过拟合/不拟合是否是一种很好的做法
吗
据我所知,
我们
不应
浏览 0
提问于2020-08-20
得票数 1
2
回答
交叉
验证
后使用
训练
测试确定最优算法使用?
、
、
我对在
数据
集
上
训练
不同的算法和观察性能指标很感兴趣。目前,我的方法是对
训练
数据
进行不同的算法
训练
,然后
在
测试
集
上进行性能
评估
。然后,我使用带有
交叉
验证
的GridSearch
来
为性能最好的模型找到最优的超参数,然后再用这些参数进行测试。 我对
交叉
验证
有点困惑--这是正确的方法
吗
?还是有一种方法
可以
/应该
浏览 0
提问于2022-04-22
得票数 1
2
回答
交叉
验证
如何确定何时提前停止?
在
神经网络
中使
用“K-折叠
交叉
验证
”时,
我们
是否:将
数据
拆分为$N$相等块GetRevert最后一次回到$W_0$,并使用整个
数据
集
对网络进行培训我意识到7是可能的,因为
我们
对网络将如何在步骤6的帮助下泛化有很好的理解
浏览 0
提问于2018-03-02
得票数 5
回答已采纳
1
回答
超参数的优化与
交叉
验证
评估
、
、
我很难掌握如何使用
交叉
验证
进行超参数优化和
评估
的标准方法。我试着做10倍的简历。下列哪一种方法是正确的? 所有
数据
都用于参数调整(例如,使用带有
交叉
验证
的随机网格搜索)。这将返回最佳的超参数。然后,利用这些超参数构造了一个新的模型,它
可以
通过
交叉
验证
(9倍的
训练
,1倍的测试)
来
评估
,最后,我发现的精度或混淆矩阵获取averaged).Another的方法是首先将
数据</em
浏览 1
提问于2020-04-21
得票数 0
回答已采纳
1
回答
在
Weka
重复
训练
和测试?
、
、
我使用一个文件进行培训(例如train.arff),另一个用于测试(例如,test.atff),
在
Weka
中使
用70-30的比率。我想问,当我有单独的火车和测试
数据
文件时,我如何使用
Weka
的重复培训/测试,问题的第二部分是,如果
我们
使用重复的话,有什么好处,如果
我们
不使用它呢?提前感谢
浏览 0
提问于2019-07-18
得票数 1
回答已采纳
5
回答
交叉
验证
和网格搜索有什么区别?
、
、
、
简单地说,
交叉
验证
和网格搜索的区别是什么?网格搜索是如何工作的?我是不是应该先做
交叉
验证
,然后再做网格搜索?
浏览 17
提问于2013-10-12
得票数 53
2
回答
什么时候
在
Weka
中使
用测试和
训练
集
?
、
、
、
我使用
Weka
已经有一段时间了,
在
我对它的研究中,我发现很多代码示例都使用了测试和
训练
集
。例如,对于离散化和贝叶斯网络,它们的示例几乎总是使用测试和
训练
集
显示的。我可能在这里错过了对
数据
处理的一些基本理解,但我不明白为什么总是这样。我
在
一个项目
中使
用离散化和贝叶斯网络,对于这两个项目,我都没有使用测试或
训练
集
,也不明白为什么我需要这样做。我正在对BayesNet执行
交叉
验证
浏览 1
提问于2013-01-21
得票数 3
1
回答
帮助理解
交叉
验证
。
、
我对
交叉
验证
的理解是,
我们
将
数据
集
划分为第1-k部分,然后使用第1部分作为
验证
集
,第2-k部分作为培训
集
,然后使用第2部分作为
验证
集
,其余部分作为培训
集
等等,直到
我们
使用每个部分作为
验证
集
。我知道
我们
平均要做k轮
交叉
验证
,但是
我们
的输出是什么?我读到过,
在
计
浏览 0
提问于2019-05-07
得票数 2
回答已采纳
2
回答
如何在
交叉
验证
中使
用过采样的
数据
?
、
、
、
我有一个不平衡的
数据
集
。我正在使用SMOTE (合成少数人抽样技术)
来
执行过采样。
在
执行二进制分类时,我在这个过采样的
数据
集
上使用10倍
交叉
验证
。然而,我最近研究了这篇文章;提到
在
交叉
验证
期间使用过采样
数据
集
是不正确的,因为它会导致性能
评估
过于乐观。 我要
验证
正确的方法/过程,即在
交叉
验证</
浏览 2
提问于2018-03-27
得票数 2
回答已采纳
2
回答
Weka
InCompatible
在
文本分类中的
训练
和测试
集
、
、
我有两个关于句子是否包含提到药物不良事件的
数据
集
,
训练
和测试
集
都只有两个字段文本和标签{不良事件,无不良事件}我已经使用
weka
和stringtoWordVector过滤器
在
训练
集
上使用随机森林构建了一个模型我想测试构建的模型,方法是从测试
数据
集中删除类标签,在其上应用StringToWordVector过滤器,并使用它测试模型。当我尝试这样做时,它给我一个错误,说
训练
和测试
集
不兼容,可能是因为过滤
浏览 0
提问于2018-03-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Weka在几分钟内建立决策树
机器学习入门——用Java实现简单的机器学习
机器学习的心腹大患:数据泄漏
算法研习:机器学习中的K-Fold交叉验证
如何自动化机器学习工作流程
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券