腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
比较
算子
的
拆分
训练
/
测试
、
、
、
我正在试图弄清楚如何根据这些条件
拆分
数据,以便对此进行CNN: 将
训练
/
测试
数据集分成两组:一组具有类标签< 5,另一组具有类标签>= 5。从
训练
和
测试
数据集中打印出结果两组
的
形状。train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.cifar10.load_data() 上面的代码就是我加载数据
的
方式下面是我如何解释它,但我不确定我这样做是正确<e
浏览 18
提问于2020-11-29
得票数 0
1
回答
训练
和
测试
数据
拆分
后,是否需要验证数据集
的
IID,并对相同
的
分布进行统计检验?
、
、
、
、
我知道大多数机器学习算法都是
基于
输入数据是IID(独立同分布)
的
假设。因此,我们通常不会执行统计
测试
来
比较
测试
和
训练
数据
的
统计数据。
训练
和
测试
数据
拆分
浏览 0
提问于2020-01-10
得票数 1
1
回答
特定
训练
/
测试
拆分
的
线性回归系数“爆炸”
、
、
我正在使用"“数据集,
比较
线性回归、岭和套索
的
系数。 我首先进行
训练
/
测试
拆分
,然后标准化数据,然后
训练
三个模型并
比较
系数。对于大多数
训练
/
测试
拆分
随机种子,三个模型
的
系数在相同
的
尺度上,我可以
比较
它们。但是对于一些随机
的
种子,一些线性回归
的
系数“爆炸”,从大约10^4-10^5
的
浏览 0
提问于2020-09-23
得票数 1
1
回答
CreateDataPartition不工作
、
、
、
我正在尝试将数据划分为
训练
集和
测试
集,以便进行交叉验证。我使用以下行来
拆分
表示状态
的
因子变量上
的
数据,该变量具有多个级别。我使用这一行是
基于
其他帖子,这些帖子表明来自caret包
的
createDataPartition应该在因子内
拆分
。,并预测
测试
数据
的
值,但它总是说我在
测试
数据中有新
的
水平。我
比较
了
训练
数据集和
测试
数据集<em
浏览 1
提问于2015-02-14
得票数 2
1
回答
如何在Pyspark Dataframe中
训练
和
测试
拆分
的
时间序列数据
、
、
、
我想对排序后
的
Pyspark数据帧进行
基于
时间
的
训练
测试
拆分
。假设前300行将在
训练
集中,下200行将在
测试
拆分
中。
浏览 14
提问于2019-03-13
得票数 1
1
回答
在Tensorflow中拟合模型时,批量大小和纪元数应该有多大?
、
我正在从事物体检测
的
工作。我
的
训练
集是5984,
测试
集是1496 (KITTI跟踪
训练
数据集)。 在Tensorflow中拟合模型时,批量大小和纪元数应该有多大?有没有什么
基于
数据输入大小
的
经验法则?我应该将其
拆分
为
训练
/val/test,还是继续使用当前
拆分
的
train/val?
浏览 14
提问于2017-07-03
得票数 0
2
回答
随机分割
训练
和
测试
数据
、
、
、
我有大约3000个对象,每个对象都有一个与之相关
的
计数。我想在
训练
和
测试
数据中随机划分这些对象,70%
的
训练
和30%
的
测试
分割。但是,我想根据与每个对象相关联
的
计数来划分它们,而不是
基于
对象
的
数量。举个例子,假设我
的
数据集包含5个对象。Obj 1 => 200Obj 3 => 40Obj 5 => 110 如果我以接近
浏览 25
提问于2016-07-27
得票数 1
1
回答
机器学习--“train_test_split”函数在scikit中
的
作用--学习:我应该重复几次吗?
、
、
我是一个机器学习
的
初学者,我希望有人能帮助我。 在Python
的
“scikit-learn”库中,函数“train_test_split”将数据集分成
训练
集和
测试
集。我想强调
的
是,我知道交叉验证,排除一个,等等。但是,如果我理解正确,这些技术用于模型验证(即模型参数优化)。我
的
问题是,模型
的
最终评估是否应该
基于
重复
的
拆分
/匹配操作。Müller和Sarah Guido,O‘’Reilly)一书中,建议<em
浏览 0
提问于2018-08-22
得票数 6
1
回答
按百分比随机划分和存储SQL表
、
、
、
我正在尝试
拆分
Microsoft
的
SSMS (SQL Server)中
的
数据库,以便在机器学习应用程序中使用数据。 我想将数据分成
训练
表和
测试
表,比例为80/20。不幸
的
是,我知道
的
唯一方法是将表
的
前20%用于
测试
集,然后将其余数据设置为
训练
集(从...中选择前20%)。我不想这样做,因为我
的
测试
和
训练
集完全
基于
它们在SQL中
的
浏览 17
提问于2019-10-25
得票数 1
回答已采纳
1
回答
对每个目标使用不同
的
测试
/
训练
拆分
我计划使用一个包含3个感兴趣
的
目标值
的
数据集。最终,我将在一个二元目标上尝试分类方法,并计划对两个独立
的
连续目标使用回归方法。 对每个目标变量进行不同
的
训练
/
测试
拆分
是不是一种糟糕
的
做法?否则,我不确定如何以一种允许我分别预测每个目标的方式
拆分
数据。
浏览 5
提问于2020-02-20
得票数 1
1
回答
如何从模型中确定要报告
的
精确值?
、
因此,基本上我
的
模型是
基于
带袋
的
ANN,每次我在
测试
数据上运行代码时,我总是得到不同
的
精确值。比如我得到了33.8%(最好
的
),28.5%,26.7%等等。我非常确定这是每次我运行算法时在
训练
和
测试
数据之间
拆分
数据
的
结果。所以我
的
问题是:我是否应该在运行之前将数据
拆分
成
训练
和
测试
数据一次。然后,如果我再次运行算法,它将使用相同
的
浏览 1
提问于2015-07-08
得票数 0
1
回答
Scikit learn有没有
基于
几个变量进行分层
拆分
的
方法?
、
、
、
、
因此,我希望将我
的
数据帧
拆分
到
测试
和
训练
集中,但不是随机
拆分
,而是
基于
这3个变量进行分层
拆分
(以保持
训练
集中与原始数据帧中相同
的
分布)。函数<code>D0</code>是用来处理标签
的
,所以如果我没记错的话,我只能指定一个变量,而不是三个变量。有人能帮我吗?谢谢
浏览 14
提问于2019-03-29
得票数 0
2
回答
如何
拆分
Tensorflow数据集?
、
我有一个
基于
一个.tfrecord文件
的
tensorflow数据集。如何将数据集
拆分
为
测试
数据集和
训练
数据集?例如,70%
的
训练
和30%
的
测试
?编辑: 我
的
Tensorflow版本: 1.8我已经检查过了,在可能
的
副本中没有提到
的
"split_v“函数。另外,我正在使用一个tfrecord文件。
浏览 4
提问于2018-07-02
得票数 36
回答已采纳
1
回答
rpart不
拆分
明显
的
节点
、
我使用
的
数据集大约有54K条记录和5个类别(Pop),其中一个类别是微不足道
的
。0.39 0.068 0 0.54) *很明显,节点5应该进一步
拆分
浏览 2
提问于2014-08-19
得票数 2
3
回答
测试
/培训
拆分
-是否总是有必要(监督学习)?
、
、
我目前正在研究我
的
第一个机器学习模型( Penguins数据集)。我将
训练
三种机器学习模型,每个模型使用不同
的
模型结构(决策树、随机森林和梯度提升),并相互
比较
。我知道,在我
的
特殊情况下,如果我想
比较
三种不同型号
的
精度,
测试
/列车分割将是必要
的
。但是,是否总是需要将数据集划分为
训练
集和
测试
集?让我们以随机森林算法为例--我们可以使用OOB评分来评估我们
的
模型,并在不执行<
浏览 0
提问于2021-12-15
得票数 1
1
回答
当列车/
测试
是真正
的
i.i.d.时,信息泄漏。
、
、
、
、
我非常清楚,为了避免信息泄漏,建议对
训练
数据集上
的
任何转换(例如标准化或
基于
中值
的
估算)进行拟合,并将其应用于
测试
数据集。然而。我不清楚,如果数据是iid,而
训练
/
测试
拆分
确实是随机
的
,那么将这些转换应用于整个数据集
的
风险是什么?例如,如果原始数据集具有一定
的
统计特性(例如,均值、中值和std),那么我将期望随机数据溢出,生成具有相同统计特性
的
训练
和<e
浏览 0
提问于2021-02-04
得票数 2
回答已采纳
1
回答
基于
MFCC和DTW
的
语音识别
、
、
、
、
基本上,我有大量
的
基于
文字
的
数据集。每个数据都有不同
的
时间长度。这是我
的
方法: 由于来自MFCC提取
的
每个数据
的
时间序列是不同
的
,所以我希望使用DTW使所有数据
的
时间维度长度完全相同。然后利用DTW数据对其进行神经网络
训
浏览 6
提问于2021-02-18
得票数 1
回答已采纳
2
回答
比较
与加法
的
区别
加法(+)运算是否比
比较
运算(>)更复杂,无论是整数运算还是浮点运算?在
基于
微处理器和
基于
FPGA
的
系统
的
上下文中,我将不胜感激。我
的
想法是:当我们谈论
基于
微处理器
的
系统时,我认为
比较
和加法是一回事,因为
比较
a>b可以通过检查(a-b)
的
符号位来解决,即加法操作。但是,在
基于
FPGA
的
系统中,我猜
比较
算子
的<
浏览 2
提问于2012-06-25
得票数 1
回答已采纳
1
回答
为什么决策树显示了正确
的
分类,而一些实例却被错误分类
、
、
、
我正在使用WEKA,10折交叉验证或
拆分
66%来创建
训练
和
测试
集。我使用c4.5 (J48)作为分类器。我在我
的
结果中发现一些实例被错误分类,但是,当我可视化树时,我看到
基于
树
的
实例应该已经被正确分类!提前谢谢。
浏览 0
提问于2014-10-22
得票数 0
1
回答
TimeSeriesSplit -如何聚合(或非筒仓)分裂?
、
、
网上有很多例子显示如何使用TimeSeriesSplit创建多个培训/
测试
集。然而,他们并没有展示如何在实践中真正地聚合这些信息。例如,这是从scikit学习文档中提供
的
:X = np.array([[1, 2], [3, 4X_train, X_test = X[train_index], X[test_index]产生
的
浏览 0
提问于2019-03-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用Python玩转统计数据:取样、计算相关性、拆分训练模型和测试
智源FlagAttention:面向多种训练芯片的大模型高性能Triton算子集
基于 AI 的口语训练平台
LUMOS:基于开源LLM的可训练的代理框架
基于对抗训练的图像增强技术研究
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券