腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用于
测试
/
训练
集
的
惊人
大
数组
、
、
、
、
我正在尝试使用线性回归创建一个具有157673个条目的数据
集
的
预测模型。数据(在csv文件中)
的
格式如下:2021-04-13 11:03:13+02:00,3,3,3,12,12我当前
的
代码:df = pd.read_csv(filename , parse_dates=['Timestamp'], header=0) df[
浏览 5
提问于2021-05-17
得票数 1
回答已采纳
1
回答
CNN中激活函数对计算时间
的
影响
、
、
、
、
在这个4.2.3 (激活功能层)中,有以下语句: 有人能解释一下吗。
浏览 0
提问于2018-04-15
得票数 0
回答已采纳
2
回答
训练
集
和
测试
集
的
大小
、
、
在特定情况下,当
训练
集
小于
测试
集
时会发生什么情况。在使用这些类型
的
数据
集
进行预测时,什么是合适
的
方法。谁能给我一些关于管理这些情况
的
介绍,以及每种学习算法将如何执行。
浏览 0
提问于2013-06-21
得票数 0
1
回答
Postgresql -添加2个随机列
我有一个很大
的
数据
集
,我想在开始时根据一些预定义
的
概率将其分为
训练
集
、验证
集
和
测试
集
(例如,以0.8
的
概率,一个元组
用于
训练
,0.1
用于
验证,0.1
用于
测试
。) 我想添加2个布尔列,
训练
和验证。如果现在这个随机数低于0.8,则该元组
用于
训练
,如果它>0.9,则
用于
<em
浏览 5
提问于2016-11-17
得票数 1
3
回答
长曲线形the是什么意思?
、
我使用一维CNN输入1*512
大
小
的
随机分段时间序列数据,输出将输入分为10类。在接受CNN
训练
后,我将the应
用于
我在
测试
数据中输入
的
预测。通常,tsne结果
的
输出形状是球形
的
(例如,应
用于
MNIST数据
集
)。但现在我在自己
的
数据集中应用t。无论我如何及早调整困惑,学习速度或最大迭代次数。它会给我长形状输出
的
结果,就像下面的图一样。长形
的
t-SNE有什么意义吗?
浏览 0
提问于2018-07-08
得票数 10
1
回答
分类中
的
交叉验证
、
、
我有两个不同
的
数据
集
,数据
集
X和数据
集
Y.
用于
分类
的
特征..。Case2。然而,如果我将其中一个数据
集
用于
训练
,另一个
用于
测试
,结果会严重下降,准确性和AUC都会达到50%左右。 我
的
浏览 4
提问于2015-12-05
得票数 1
1
回答
从验证精度到
测试
精度
的
显著下降
、
、
、
、
给我一个
大
的
训练
数据
集
(>70k样本)和一个独立收集
的
测试
集
(~2k)。在
测试
集
上,我始终取得了不错
的
验证精度,但精度却明显较低。现在,为了
测试
这是否是由来自不同分布
的
测试
集
造成
的
,我将
测试
集
(~2k)与
训练
集中大小相等
的
随机部分组合在一起。然后,我将
浏览 0
提问于2019-08-11
得票数 3
2
回答
如何修复Python中
的
"ValueError:发现样本数量不一致
的
输入变量“问题
、
、
我
的
目标是将这些文件分成
训练
和
测试
数据
集
。:为了运行分类算法,这个问题
的
最佳解决方案是什么
浏览 80
提问于2020-12-17
得票数 0
1
回答
在
测试
时替换输入管道(不带占位符
的
tf.contrib.data)
在
训练
期间,我将tf.contrib.data函数
用于
输入管道(没有占位符)。我
的
问题是,如何重用经过
训练
的
模型,并在
测试
时输入新数据?这个问题类似于,除了我也不想在
测试
中使用占位符-我
的
测试
数据
集
可能非常
大
,并且应该避免占位符
的
速度变慢。 有没有办法在
测试
时用新
的
管道替换输入管道?
浏览 1
提问于2017-07-26
得票数 2
26
回答
如何使用pandas从一个数据帧创建
测试
和
训练
样本?
、
、
、
我有一个相当
大
的
dataframe形式
的
数据
集
,我想知道如何将dataframe分成两个随机样本(80%和20%)
用于
训练
和
测试
。 谢谢!
浏览 209
提问于2014-06-11
得票数 431
回答已采纳
1
回答
如何正确地在MRI上进行数据增强,并为深入学习做好准备?
、
、
、
这是由于原始扫描
的
大小为256*256*256。我首先通过调整大小到192*192*192来删除背景,然后将采样降至2倍。首先,96^3
的
输入结果是884 k体素。从我过去
的
经验来看,
训练
样本
的
数量应该远远超过输入单位
的
数量。第三,在
训练
模型时,我常常将输入数据附加到列表中,并使用skl
浏览 2
提问于2019-04-25
得票数 2
3
回答
什么是培训和
测试
数据
集
?
、
、
、
我看到他们每次比赛都上传了培训数据、
测试
数据和原始数据。 有人能解释一下这些数据
集
是什么以及我们如何在解决问题
的
同时使用这些数据
集
吗?
浏览 3
提问于2017-09-15
得票数 1
2
回答
Dataset以及为什么使用度量衡()?
、
、
、
我是从机器学习开始
的
,我对一些概念有疑问。我读过我们需要将数据
集
分成
训练
、验证和
测试
集
。我会问四个与他们有关
的
问题。 1-
训练
集
:在.fit()中
用于
学习神经网络中
的
权值等参数。2-验证
集
:也可
用于
.fit()。验证
集
被使用,这样我们就可以在每个时代结束时验证我们
的
模型(调优一些超参数,比如隐藏层中
的
节点数)?3-如果2是正确<
浏览 0
提问于2021-12-03
得票数 2
回答已采纳
2
回答
数据
集
随机样本上超参数整定
的
缺点
、
、
、
我经常使用非常
大
的
数据
集
,在构建机器学习模型时检查所有相关
的
超参
数组
合是不切实际
的
。我正在考虑随机采样数据
集
,然后使用该示例执行超参数调优。然后,我将使用所选
的
超参数使用完整
的
数据
集
来
训练
/
测试
模型。 这种方法
的
缺点是什么?
浏览 0
提问于2019-01-16
得票数 1
回答已采纳
1
回答
用不同
的
数据集
训练
随机森林,结果完全不同!为什么?
、
我正在处理一个数据
集
,其中包含12个属性,包括时间戳和一个属性作为输出。此外,它有大约4000行。此外,没有重复
的
记录。我正试着
训练
一个随机森林来预测产量。为此,我创建了两个不同
的
数据
集
: 二:根据时间戳对数据
集
进行排序,然后对
训练
的
前80%和
测试
的</e
浏览 3
提问于2015-02-04
得票数 0
回答已采纳
2
回答
深度学习:
训练
中是否使用验证数据
集
?
在有监督学习中,原始数据分为三部分:
训练
数据
集
、验证数据
集
和
测试
数据
集
。
测试
数据
集
用于
最终评估模型,因此不会在
训练
过程中使用。我认为,验证数据
集
用于
在
训练
时调整模型
的
参数。 我想知道
的
是验证数据
集
是否
用于
浏览 27
提问于2020-02-29
得票数 1
1
回答
如何将图像文件夹拆分为
测试
/培训/验证
集
,同时必须为val添加注释文件和一起
测试
?
、
、
、
我有一个非常
大
的
文件夹,包含19个文件夹,每个文件夹都包含单个类
的
图像,我想将它们拆分为培训/
测试
/验证
集
;同时,我还要添加一个注释文件,
用于
验证和
测试
,以
训练
模型?
浏览 5
提问于2022-07-28
得票数 -2
回答已采纳
1
回答
为什么机器学习工程师坚持使用比验证
集
更多
的
数据进行培训?
、
、
、
、
在我
的
同事中,我注意到一种奇怪
的
坚持,就是坚持用70%或80%
的
数据进行培训,并对其余
的
数据进行验证。我对此感到好奇
的
原因是缺乏任何理论推理,而且它带有五倍交叉验证习惯
的
影响。是否有任何理由选择一个更大
的
训练
集
时,试图发现过度拟合在培训期间?换句话说,为什么不使用n^{0.75}进行培训,使用n - n^{0.75}进行验证,如果影响确实来自于从线性建模理论中继承下来
的
交叉验证实践,正如我在这答案中所建议
的<
浏览 0
提问于2020-12-28
得票数 3
回答已采纳
2
回答
训练
集
和
测试
集
大小
、
、
如何正确处理培训/
测试
集
的
生成?我正在做几个实验来
测试
我
的
神经网络模型
的
泛化能力,所以在所有实验中,我
的
测试
集
都不同于我
的
训练
集
(例如,在一个实验中,
训练
集
和
测试
集
之间
的
句子结构是相同
的
,而在
训练
集中我使用一组单词,在
测试
集中使用
浏览 0
提问于2021-07-08
得票数 1
2
回答
validation_curve如何计算test_scores
、
、
我正在浏览validation_curve
的
sci学习文档,并看到它返回了两组不同
的
数据: train_scores:
训练
集
上
的
形状
数组
(n_ticks,n_cv_folds)分数。test_scores:形状
数组
(n_ticks,n_cv_folds)在
测试
集
上得分。在给定
的
函数中,我们只传递一个X和y
数组
,它如何从传递
的
训练
数据中计算test_scor
浏览 6
提问于2020-10-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习的算法测试与验证:训练集、测试集、验证集以及交叉验证
周智伟|用于复合材料结构健康监测算法训练与测试的数据集
Google发布用于训练通用智能助理的架构引导对话数据集
中文在线(300364.SZ):公司的庞大可用于AI大模型训练的数据集已超过60TB
用于语音训练的声音数据集:万句中文标准女声音库,免费
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券