腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
击打与
标准
化
、
、
、
我把它分为数据和标签,然后
标准
化数据。然后使用train_test_split对训练数据和
测试数据
进行分割,并输出结果。为了做到这一点,我保留了和以前一样的
测试数据
,并且我只将新的合成样本添加到训练数据中。我该如何处理
标准
化工作?简单地假设,既然我使用了已经
标准
化的数据中的点,那么新的合成样本也会
标准
化吗?(不接触
测试数据
) 从预先
标准
化的数据中创建合成样本,
标准
化合成样本并将它们添加到列车数据中?(不接触
测试数据
浏览 0
提问于2016-07-22
得票数 1
回答已采纳
1
回答
StandardScaler变换后ML模型在
测试数据
上的性能
、
、
、
我认为,当我们对
测试数据
进行sklearn预处理转换时,均值不会是0,std也不会是1(原因是我们使用训练数据平均值/std来
标准
化
测试数据
)。我的问题是:如果
测试数据
是这样
标准
化的(不正确地
标准
化为高斯正态分布,平均为0和std 1),那么这会对ML算法的预测产生影响吗?我的理解是,ML预测的准确性很低,因为我们给ML模型提供了一个不正确的
标准
化数据。
浏览 3
提问于2020-02-20
得票数 1
回答已采纳
1
回答
在训练数据上使用MinMaxScaler生成用于
测试数据
的std、min和max
、
、
我将如何使用scikit学习MinMaxScaler来
标准
化熊猫数据框架训练数据集中的每一列,但在我的
测试数据
集上使用完全相同的
标准
差,最小/最大公式?由于我的
测试数据
是未知的模型,我不想
标准
化整个数据集,它将不会是一个准确的模型,对未来的未知数据。相反,我希望使用训练集将0&1之间的数据
标准
化,并对
测试数据
的公式使用相同的std、min和max数字。
浏览 2
提问于2018-01-29
得票数 1
回答已采纳
3
回答
如何评估数据挖掘模型?
、
、
我用什么
标准
来比较? 假设模型选择的
标准
是ASE。训练数据ASE高,
测试数据
ASE低,训练数据ASE低,
测试数据
ASE高。如果您选择一个模型,您会选择哪些模型?
浏览 0
提问于2018-06-02
得票数 1
回答已采纳
1
回答
如何在数据集上使用
标准
的标度模型,其特征比最初训练的原始数据集要少
、
、
、
我使用的是sklearn.preprocessing的
标准
标量模型。我在包含27个特征的数据集上拟合了
标准
标度模型。是否可以在
测试数据
集上使用相同的
标准
标量模型,其中代码片段中的特性少于27个sc=StandardScaler()到目前为止,当我试图转换我的
测试数据
集时,这是起作用的fine.Problem。
测试数据
集中有24个特性
浏览 4
提问于2020-10-07
得票数 2
回答已采纳
2
回答
特性缩放(
标准
化)、LabelEncode和OneHotEncode数据的最佳实践是什么?
、
、
、
、
这里有训练数据(x_train)、
测试数据
(x_test)和all_data,它们结合了培训和
测试数据
。from sklearn.preprocessing import StandardScaler 对列车数据进行
标准
化,然后应用于
测试数据
scaler.fit(x_train) x_train=scaler.transform(x_train) x_test=sc
浏览 5
提问于2017-01-06
得票数 3
1
回答
如何在sklearn model.predict中用单样本进行预测?
、
我应用
标准
标量来训练和
测试数据
,训练模型。但是,如果我想用训练和
测试数据
之外的数据对模型进行预测,我必须对新数据应用
标准
标量,但如果我有单个数据,那么我不能对我想要作为输入的新的单个样本应用
标准
标量。
浏览 17
提问于2019-06-23
得票数 2
1
回答
当列车/测试是真正的i.i.d.时,信息泄漏。
、
、
、
、
我非常清楚,为了避免信息泄漏,建议对训练数据集上的任何转换(例如
标准
化或基于中值的估算)进行拟合,并将其应用于
测试数据
集。然而。例如,如果原始数据集具有一定的统计特性(例如,均值、中值和std),那么我将期望随机数据溢出,生成具有相同统计特性的训练和
测试数据
集。因此,对整个数据集进行
标准
化,然后再进行分割,可以产生与分割数据集、基于列车数据库的
标准
化和转换
测试数据
集相同的结果。对于基于中值的估算,也可以使用相同的参数。 我是不是遗漏了什么?
浏览 0
提问于2021-02-04
得票数 2
回答已采纳
2
回答
用于单元测试的
测试数据
文件路径
、
、
我目前正在使用VS 2008中的
标准
Microsoft单元测试套件。还安装了ReSharper 4.5。我的单元测试依赖于一个预加载数据文件的TestInitialize方法。根据使用
标准
Ctrl+Ctrl命令和Resharper单元测试执行命令在VS 2008中运行单元测试,该
测试数据
文件的路径将有所不同。我的TestInitialize方法如何知道单元
测试数据
文件的正确路径?
测试数据
是足够大的,所以我不想将它推入字符串中,所以更愿意将它作为外部文件保存。我的测试项目的文件结构是用MVC应用程
浏览 1
提问于2009-11-21
得票数 63
1
回答
使用插入符号对训练和
测试数据
进行预处理
、
我还有一个
测试数据
集,我想用训练集中相同的均值和
标准
差进行缩放。通过这种方式,我将
测试数据
视为全新的/看不见的数据,这些数据是根据我基于训练数据观察到的数据进行缩放的。predict(preprocess_values_train, train) test.st = predict(preprocess_values_train, test) 我认为这会将训练均值和
标准
差应用于
测试数据
集如何编辑此代码以基于训练数据细节缩放
测试数据
?train.st正是我需要的,但test.s
浏览 40
提问于2020-06-24
得票数 1
回答已采纳
1
回答
将Sci-Kit学习分类器的预测结果与原始测试集数据相结合
、
我的问题是,现在我有了"Predict_Probas“结果,我已经将其转换为Pandas数据框架,我想将它与我最初的
测试数据
结合起来,稍后我将在CSV中导出
测试数据
。问题是我采取了以下方法- 现在,如果没有
标准
化和一次热编码,那么我如何才能获得原始的
测试数据
(没有完整的列名)?
浏览 0
提问于2018-03-24
得票数 1
回答已采纳
2
回答
应用Sci-kit学习的kNN算法处理新数据
、
、
当我研究Scikit-learn的kNN算法时,我意识到如果我使用sklearn.model_selection.train_test_split,所提供的数据就会根据作为参数提供的比例自动分成火车数据和
测试数据
集然后,基于列车数据,该算法从最接近
测试数据
点的k近邻点出发,确定
测试数据
点是否属于某一准则。我想知道是否有一种方法可以预测
标准
,而不是
测试数据
集,因为
测试数据
集已经是提供数据集的一部分,而是在整个过程中没有提供的全新数据。 有办法用sci学习吗?
浏览 0
提问于2021-05-01
得票数 1
回答已采纳
1
回答
转换是如何工作的?
、
我看了一下MinMaxScaler的源代码。我知道,当您将预处理类安装到dataset时,它会接收数据并为转换做准备。 比方说,我把MinMaxScaler装到了X_train上,并把它改造了。但是,当我使用另一个数据集(比如X_test )时,转换是如何工作的呢?当您调用transform()时,它是否替换了使用中的数据集?
浏览 0
提问于2021-05-04
得票数 1
1
回答
R中的
标准
化/
标准
化试验数据
、
我理解,人们应该
标准
化和规范化
测试数据
(或任何“未标记的”数据)与培训手段和sd。我如何用R语言实现这一点?是否有一种对训练集的“拟合”和一种对
测试数据
的应用?
浏览 0
提问于2016-09-13
得票数 1
回答已采纳
1
回答
空间列车开发和
测试数据
、
、
、
或者开发数据完全不在训练过程中,所以等同于
测试数据
?按照
标准
对进行了很大的解释,验证数据和
测试数据
是不同的。请有人澄清spaCy在下的情况是什么。非常感谢。
浏览 6
提问于2022-09-21
得票数 1
回答已采纳
2
回答
我可以让CNTK检测过拟合吗?
CNTK只有在达到maxEpochs后才会停止,然后运行测试。有没有办法让它在每个时期之后运行测试,以检查它是否严重过度拟合?
浏览 6
提问于2016-09-20
得票数 0
2
回答
用于单元测试的Spring/Hibernate非JPA存储库
、
、
、
我知道我可以在扩展JpaRepository的
标准
存储库中自动更新,但是使用@Repository注释的
标准
类如何使用@PersistentContext与执行em.createNativeQuery(query, Class).getResultList的EntityManager 例如,我正在运行内存数据库,我可以自动生成一个
标准
的JpaRepository,比如getOne或getAll,它将对我的内存
测试数据
库执行并返回一个结果但是有什么方法可以对我的SQL存储库进行同样的处理,让EntityManger对
浏览 5
提问于2017-11-22
得票数 0
回答已采纳
1
回答
异常检测模型的特征归一化
、
、
、
、
对于使用自动编码器进行异常检测/新颖性检测,我有一个关于特征规范化/
标准
化(Standardisation)的问题。通常,在ML问题中,我们分割火车/测试集。在列车上安装普通/
标准
定标器,并使用它来转换(而不是fit_transform )
测试数据
。但是,在异常检测/新颖性检测中,我们如何使用“正常”数据(而不是“异常”)来训练异常检测器?这里的训练数据不代表
测试数据
,因为它只学习“正常”数据,以便在给定“异常”数据时产生重建误差。在这里,我们是否应该对列车数据进行规范化处
浏览 3
提问于2022-10-31
得票数 -1
1
回答
使用fit_transform()和transform()
、
、
、
、
StandardScaler()X_test = sc.transform(X_test)这是否意味着我们正在使用训练数据的均值和
标准
差来转换
测试数据
?
浏览 11
提问于2022-06-16
得票数 2
回答已采纳
1
回答
标准
化模型的培训数据是否真的是现实的?
、
、
、
、
与不
标准
化或规范化培训和
测试数据
相比,
标准
化或规范化培训和
测试数据
可以显著提高网络的预测性能。到现在为止还好。我不太确定我是不是漏掉了什么东西。但是,对于流
浏览 6
提问于2022-07-01
得票数 -1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何准备软件测试数据
Python Web 测试数据
这是一条测试数据
LeetCode测试数据的爬虫
在线测试数据生成器
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券