腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1628)
视频
沙龙
0
回答
将
数据
集
划
分为
训练
和
测试
后
,
将
标签
转
换为
指标
矩阵
、
、
、
将
Y转
换为
指标
矩阵
效果很好:X, Y = readFile(file)T = np.zeros((N, K)) T[i, Y[i]] = 1 X, Y = shuffle(X, Y) Ntrain = int(
浏览 9
提问于2018-07-11
得票数 0
回答已采纳
1
回答
如何使用
训练
集
评估NMF?
、
、
、
测试
非负
矩阵
分解预测的正确方法是什么?假设
数据
集
是一个包含用户
和
观看过的电影(没有分级)的
矩阵
。首先,我
将
矩阵
分为
训练
集
和
测试
集
(40%
测试
集
)。然后我用NMF分解
训练
矩阵
。然后我使用
测试
矩阵
,删除所有电影条目的一半,看看真正的
测试
浏览 1
提问于2012-09-02
得票数 0
1
回答
Azure AutoML似乎添加了额外的输入?
、
、
在我的
数据
集中,我有4列浮点数
和
1列包含人名的列。我的目标是能够根据这4个浮点数的输入来检测这个人。 ? 我已经成功地基于这些信息
训练
了一些模型。
数据
转换图表如下所示,这是我所期望的: ? 因此,它忽略了一列(我假设是"person“列),并使用剩下的4列作为RandomForrest分类器的输入。到目前为止一切都很好。这个变量似乎对输出
数据
有很大影响 ?
浏览 19
提问于2021-10-15
得票数 0
3
回答
当目标
标签
依赖于多个输入行时,如何应用监督机器学习?
、
、
、
、
这个问题是一个多
标签
分类问题。现在,我知道如何使用带有多个属性的单行进行
训练
和
分类。例如,如果
数据
集
看起来像附加文件中的第一个表。在这里,每一行都与一个
标签
相关联。因此,我可以
训练
和
测试
后
,
将
数据
集
分为
培训
和
测试
集
。但是,当分类
标签
/目标
标签
浏览 0
提问于2020-02-02
得票数 2
1
回答
is分区
和
交叉between的区别是什么?
、
training/testing setscrossvalind用于执行交叉验证,通过返回索引,
将
整个特性
集
X随机分成
训练
和
测试
数据
。利用这些
指标
,我们可以分别生成X(trainIdx,:)
和
X(testIdx,:)的
训练
数据
和
测试
数据<
浏览 1
提问于2018-06-06
得票数 1
回答已采纳
3
回答
是否有必要将
数据
分成三个部分:
训练
、评估
和
测试
?
、
、
、
、
描述了
测试
、
训练
和
验证
集
的区别。在大多数关于
训练
神经网络的文档中,我发现这三个集合是使用的,但是它们通常是预先定义的。 我有一个相对较小的
数据
集
(总共906张3D图像,分布是平衡的)。在我的模型中,我使用sklearn.model_selection.train_test_split函数来拆分火车
和
测试
集中的
数据
,并使用X_test
和
y_test作为验证
数据
。batch_size=
浏览 4
提问于2020-01-09
得票数 1
回答已采纳
1
回答
R中文本的多类分类
、
、
、
、
有6个
标签
,但是在6个类别中,只有3个是分类的,其余的不是分类的。如果有人能告诉我出了什么问题,我会非常感激的。
数据
准备 停止
和
转
换为
更低的情况。 转换计数频率
矩阵
到二进制实例
矩阵
,该
矩阵
将
文档
浏览 2
提问于2018-01-03
得票数 2
1
回答
数据
分区中的类
标签
、
、
假设
将
数据
划
分为
训练
/验证/
测试
集
,以便进一步应用某种分类算法,而
训练
集
并不包含完整
数据
集中存在的所有类
标签
--比如一些
标签
为"x“的记录只出现在验证集中,而不是在培训中。 这是有效的分区吗?以上结果可能会导致混淆
矩阵
不再是正方形,而且在算法中我们可能会评估一个错误,这会受到
训练
集中看不见的
标签
的影响。第二个问题是:
浏览 2
提问于2013-12-07
得票数 2
回答已采纳
1
回答
分类器与精度
、
、
、
、
我想问你如何使用分类器
和
确定模型的准确性。我有我的
数据
集
,我已经清理了文本(删除断点,标点符号,删除空行,.)。然后我把它分成火车
和
测试
。由于我想确定一个电子邮件是否是垃圾邮件,我已经使用了常见的分类器,即朴素贝叶斯,支持向量机
和
逻辑回归。在这里,我只是包括我的火车
和
测试
数据
集
:没有其他!我正在使用Python运行此分析。
浏览 0
提问于2020-08-14
得票数 0
回答已采纳
1
回答
机器学习-
将
数据
分成
测试
组
和
训练
组
、
如何将给定的
数据
集
划
分为
训练
集
和
测试
集
以及它们的正确
标签
。train_test_split 其中df是原始的dataset....for例如:字符串列表 问题是它没有把目标/
标签
和
数据
集
一起带走所以我们无法追踪哪个
标签
属于哪个
数据
点
浏览 5
提问于2015-09-24
得票数 3
回答已采纳
1
回答
创建相似
矩阵
、
、
、
我有一个
训练
集
和
一个向量
测试
集
。所有的向量都有标记。我用余弦距离来计算向量中元素之间的相似性。在图中,我们可以看到在
测试
集
的6个向量
和
训练
集
的18个向量的子集中应用余弦距离相似性的结果。现在,我想创建
标签
的相似性
矩阵
。因此,在这种情况下,我需要一个6x6维的
矩阵</e
浏览 0
提问于2017-09-15
得票数 1
回答已采纳
2
回答
如何在Python的SciKitLearn模块中创建输入字符串
矩阵
?
、
、
、
、
现在,我知道在分类中有以下步骤 现在,我想跳过步骤3(我已经这样做了),从用户那里获取输入,并根据经过
训练
的变量
测试
它。现在我不知道在从控制台输入后下一步是什么,我是否也需要为这个弦建立弓
矩阵
?
浏览 7
提问于2015-11-14
得票数 1
回答已采纳
2
回答
在二进制分类中翻转
标签
会给出不同的模型
和
结果。
、
、
、
、
我有一个不平衡的
数据
集
,我想
训练
一个二进制分类器来对
数据
集
建模。1-我做了一个随机的分裂,以获得火车/
测试
集
。3-我
训练
了模型,然后在test
集
上评估了模型的性能(这是看不见的,而且仍然不平衡)。我得到了相当可以接受的结果,包括precision,recall,f1评分
和
AUC。 后来,我想试一试。因此,我翻转了
训练
集
<
浏览 0
提问于2022-11-03
得票数 4
回答已采纳
2
回答
CNN模型的交叉验证技术
、
、
、
和
往常一样,我用批次
和
时代一起
训练
我的模型。当它完成
训练
和
验证时,最后我使用一个
测试
集
来衡量模型的性能并生成混淆
矩阵
。现在我想用交叉验证来
训练
我的模型。2-如果我使用交叉验证,如何生成混淆
矩阵
?我是否可以
将
数据
集
拆
分为
训练
/
测试
,然后在列车/验证
集
上进行交叉验证(即,除了通
浏览 0
提问于2019-03-22
得票数 10
回答已采纳
1
回答
产品按描述分类
我的
测试
文件
和
培训文件到底是什么?例如:培训文件是否应该是产品描述的条目,以及分配给每个产品的手动输入的代码?而
测试
文件只是产品描述?
浏览 0
提问于2020-07-22
得票数 0
回答已采纳
1
回答
在分类降维时,我是否使用
训练
集中的均值向量来对
测试
集
进行中心化?
、
、
、
、
请告诉我这是问这个问题的合适地点(或者我的
标签
是否错了),或者我是否需要用不同的方式写这个。 在分类降维时,我是否使用
训练
集中的均值向量来对
测试
集
进行中心化?然后,在对
测试
集
的特征向量进行分类之前,在降维的中心部分,我是使用
训练
集
的相同均值向量,还是取
测试
集
的均值向量并减去
测试
集
,还是取
训练
和
测试
集合并的均值向量,从
测试
浏览 0
提问于2020-03-23
得票数 1
回答已采纳
2
回答
训练
精度很高,验证精度很高,但
测试
集
的精度很低。
、
、
、
、
我已经
将
数据
集
(大约28K图像)划
分为
75%的
训练
集
和
25%的
测试
集
。然后,我随机抽取了15%的培训
集
和
15%的
测试
集
来创建验证
集
。目标是
将
图像
分为
两类。精确的图像样本不能共享。但它
和
附件中的那个相似。我使用这个模型:带有imagenet权重的VGG19,最后两层,可
训练
的,
浏览 3
提问于2019-01-16
得票数 2
回答已采纳
1
回答
对于
数据
不平衡的分类器,要使用哪一种度量?
、
、
为了处理这个问题,我用了过量的抽样
和
替换.(正如这里所建议的: )。 然后
将
数据
集
(过采样
集
)划
分为
训练
集
和
测试
集
,并对朴素贝叶斯算法进行了
训练
。当我想
测试
的时候,用精度测量可以吗?混淆
矩阵
是什么意思,在过采样
数据
集
上使用混淆
矩阵
是什么意思?这是一个很好的练习吗?
浏览 3
提问于2016-10-15
得票数 1
0
回答
当新
数据
集
没有覆盖
训练
集
的所有特征时,如何预测新
数据
集
的
标签
?
、
我有一个短信
数据
集
,我想知道一些东西是垃圾邮件或不是。我使用quanteda
将
文本内容转
换为
单词
矩阵
。我还删除了停用词,
将
单词转
换为
词干,并使用 rpart.cv.1 <- train(Label ~ ., data = train_tokens_df, method = "rpart", trControl现在我想预测一下testdata的
标签
。我对
训练
数据
做了所有的预处理步骤。问题是,我
浏览 8
提问于2017-12-13
得票数 0
1
回答
在
数据
分区
和
特征选择之间,需要执行第一步
、
、
、
我需要在我的
数据
集
上执行一个特征选择。我的
数据
集
是一个不平衡的
数据
集
,其中感兴趣的类是少数类。因此,查全率
和
F2测度是评价预测性能的两个重要
指标
。我使用了两种方法来选择特性。首先将
数据
划
分为
训练
集
和
测试
集
,然后应用Info gain属性选择方法选择前30个属性。我在
训练
集中只保留了30个属性,并丢弃了所有其他属
浏览 0
提问于2022-10-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习-kNN实现简单的手写数字识别系统
支持向量机Part5—Python实现
Python从零开始第六章机器学习①逻辑回归实战
9,模型的评估
基于多项式贝叶斯的增量学习的文本分类
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券