腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
当我
有
训练
、
开发
和
测试
集
时
,
我
是否
可以
在
X
或
X_train
上
安装
缩放
器
?
这是
我
的数据y = y.reshape((-1,1))y_test = y_test.reshapetest_size=0.1,
我
可以
在
.fit中
安装
X
浏览 12
提问于2020-02-19
得票数 1
回答已采纳
3
回答
如何正确使用scaler模型?
、
、
])
X
_test[:, :, 2] = scaler.transform(
X
_test[:, :, 2])
X_train
[:, :, 3] = scaler.fit_transform(
X_train</
浏览 0
提问于2019-09-13
得票数 0
1
回答
基于PCA的tensorflow MNIST数据支持向量机
、
、
、
、
我
打算学习使用SVD的PCA,因此实现了它,并试图
在
MNIST数据
上
使用它。P_reduce = self.V[:,0:r] return
X
_proj 现在,随着PCA的实现,
我
尝试将其应用于MNIST数据,以查看使用PCA
和
不使用PCA进行分类
时
使用softmax的性能。print ("Total time taken: %f s
浏览 1
提问于2017-11-10
得票数 1
回答已采纳
2
回答
训练
和
测试
集
的数据
缩放
、
当我
们
缩放
数据
时
,
我
需要一些澄清。因此,为了防止数据泄漏,我们将列车
和
测试
设备分开,然后分别对它们进行
缩放
,对吗?因此,在对火车
和
测试
数据集中的数据进行
缩放
或
标记编码
时
, 由于列车上的fit_transform
和
测试
集
的
缩放
特性不同,如何保证
测试
集
上
的<em
浏览 0
提问于2020-08-27
得票数 0
1
回答
交叉验证
和
测试
集
的
缩放
和数据泄漏
、
、
、
、
我
有
更多的最佳实践问题。
我
正在
缩放
我
的数据,
我
知道
我
应该在
我
的
训练
集
上进行fit_transform,并在
我
的
测试
集
上
转换,因为潜在的数据泄漏。现在,如果
我
想使用两个(5倍)交叉验证
在
我
的
训练
集
,但我使用一个坚持
测试
集
无
浏览 4
提问于2022-06-29
得票数 1
1
回答
交叉验证
集
的特征
缩放
与归一化
、
、
我
有
个问题,通常情况下,
当我
们做一个
训练
集
和
一个最终
测试
集
时
, 利用
训练
数据计算预处理的均值
和
标准差,并将其用于标准化(转换)
测试
数据。那么,
当我
们制作一个
训练
数据,一个交叉验证数据
和
一个最终
测试
数据
时
,我们是不是应该单独计算使用
训练
数据进行预处理的均值
和
s
浏览 0
提问于2018-12-08
得票数 0
回答已采纳
1
回答
“inverse_transform”函数
在
sklearn.preprocessing.MinMaxScalar中的奇怪行为
、
我
使用MinMaxScalar函数
在
sklearn.preprocessing中规范化了
我
的一些变量(数组)的属性,使之在模型(线性回归)中使用,
在
模型创建和
训练
之后,
我
用
x
_test(splitedusind train_test_split)
测试
了
我
的模型,并将结果存储
在
一些variable(say predicted)中。为了评估目的,
我
想用原始数据
集
评估
我
浏览 0
提问于2021-04-13
得票数 0
2
回答
在
交叉验证后对所有
训练
数据进行scikit-learn
训练
、
我
正在使用scikit-learn来
训练
分类
器
。
我
还希望进行交叉验证,但在交叉验证之后,
我
希望对整个数据
集
进行
训练
。
我
发现cross_validation.cross_val_score()只返回分数。 编辑:
我
想用
我
所有的数据来
训练
具有最佳交叉验证分数的分类
器
。
浏览 1
提问于2014-03-24
得票数 2
1
回答
Scikit GridSearchCV - fit()
和
预测()如何与ColumnTranformers
和
管道一起工作
、
、
、
、
对于GridSearchCV的实际工作方式,
我
有点困惑,所以让我们设想一个任意的回归问题,在这里
我
想预测一套房子的价格: 假设我们使用了一个简单的预处理
器
,用于
训练
集
上
的目标编码:目标编码
器
应该在
X_train
上调用fit_transform(),
在
X
_test上调用transform()以防止数据泄漏。gscv.fit(
X_train
, ytrain)
和
gscv.predict(
浏览 3
提问于2021-07-31
得票数 0
回答已采纳
1
回答
如何在PySpark中使用StandardScaler标准化
测试
数据
集
?
、
、
我
有如下的
训练
和
测试
数据
集
:
x_train
: inputs[4,6,12][7,8,14]... inputs列是将VectorAssembler
当我
尝试使用StandardScaler转换
测试
数据
时
,如下所示,
我
得到一个错误,指出它没有transform方法: from pyspark.ml.feature impor
浏览 52
提问于2021-01-02
得票数 0
回答已采纳
2
回答
cross_val_score的准确性很差
、
、
、
对于机器学习分类,
我
使用10折交叉验证:
我
拆分
训练
/
测试
数据:对于一个分类
器
,得到10倍精度平均值: cross_val_score(classifier,
X_train
浏览 115
提问于2020-03-05
得票数 1
1
回答
python中的Kfold交叉验证
、
、
我
对这件事的理解;
我
知道,仅使用
训练
集
来
缩放
和
估算数据是一种很好的做法。因为这有助于避免过
浏览 3
提问于2019-12-11
得票数 0
7
回答
当
缩放
数据
时
,为什么
训练
数据
集
使用“fit”
和
“transform”,而
测试
数据
集
只使用“transform”?
、
当
缩放
数据
时
,为什么
训练
数据
集
使用“fit”
和
“transform”,而
测试
数据
集
只使用“transform”?sample[n] = map(float, line.strip().split(','))scaling = StandardScaler()
X
浏览 152
提问于2017-04-28
得票数 33
回答已采纳
1
回答
Python -遇到
x
_test y_test fit错误
、
、
、
我
已经构建了一个神经网络,它
可以
很好地工作
在
一个包含两个分类变量
和
一个自变量的30万行的小数据集中,但是
当我
将它增加到650万行
时
,它遇到了内存错误。因此,
我
决定修改代码,并且越来越接近,但是现在
我
遇到了一个与fit错误有关的问题。对于1
和
0的因变量,
我
有
两个分类变量
和
一列(可疑
或
不可疑)。首先,数据
集
如下所示: ParentPr
浏览 0
提问于2018-08-24
得票数 2
回答已采纳
1
回答
在
特定步骤
缩放
/规范化数据之间的差异
、
、
、
我
正在使用MinMaxScaler规范化方法,但是
我
已经看到了
可以
这样做的各种方法,
我
想知道
在
以下方面
是否
有
任何实际的区别:代码12.将数据分解为列车
和
测试
后的
浏览 0
提问于2020-10-05
得票数 1
回答已采纳
1
回答
在
加载模型
时
,如何使用最小最大定标
器
对
测试
数据进行拟合?
、
、
、
、
我
正在做自动编码
器
模型,
我
已经保存了模型,在此之前,
我
使用最小最大定标
器
对数据进行
缩放
。,并在给出
测试
数据
时
将其保存为“h5”file.Now,
在
加载保存的模型之后,自然也应该对其进行
缩放
。因此,
我
给了
X
_test_scaled = scaler.fit_transform(
X
_test) (
我
有
一种愚蠢的预感),给出了一个结
浏览 1
提问于2019-02-28
得票数 4
回答已采纳
1
回答
在
测试
时
替换输入管道(不带占位符的tf.contrib.data)
在
训练
期间,
我
将tf.contrib.data函数用于输入管道(没有占位符)。
我
的问题是,如何重用经过
训练
的模型,并在
测试
时
输入新数据?这个问题类似于,除了
我
也不想在
测试
中使用占位符-
我
的
测试
数据
集
可能非常大,并且应该避免占位符的速度变慢。 有没有办法
在
测试
时
用新的管道替换输入管道?
浏览 1
提问于2017-07-26
得票数 2
3
回答
StandardScaler
在
分割数据之前还是之后-哪个更好?
、
、
当我
阅读关于使用StandardScaler的文章
时
,大多数建议都是说
在
将数据分割成火车/
测试
之前,您应该使用StandardScaler,但是
当我
检查一些张贴在网上的代码(使用sklearn)
时
,
有
两个主要的用途from sklearn.preprocessing import StandardScaler
X
_fit = sc.fit(
X
)
X
_std = <
浏览 0
提问于2018-09-18
得票数 48
回答已采纳
2
回答
为什么对整个数据
集
的DataFrame取样比对
我
的
训练
集
进行抽样
有
更好的预测模型的结果?
、
、
、
、
假设
我
有
一个名为original_df的数据格式,它有20,000行。
我
将前18,000行拆分为
我
的
训练
集
,最后2,000行作为
我
的
测试
集
。
在
分割前使用sample函数,
在
训练
集
上
运行分类
器
模型,得到了合理的预测结果:假阳性、假阴性、真阳性
和
真负数。然而,
当我
在
训练<
浏览 9
提问于2022-11-10
得票数 1
2
回答
SVM+HOG目标检测
器
、
、
我
在
训练
SVM+HOG对象检测
器
时
遇到了一个问题,这就是
我
所做的。(features)
X_train
,
X
_test, y_train, y_test = train_test_split因此,问题来了,如果
我
只想在一个新出现的样本
上
测试
经过
训练
的支持向量机,
我
如何应用Standard
浏览 4
提问于2021-06-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习100天-Day2
常见的降维技术比较:能否在不丢失信息的情况下降低数据维度
简单教程:用Python解决简单的水果分类问题
机器学习与Scikit Learn学习库
深度学习中的正则化技术
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券