腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
KNeighborsClassifier .predict()函数不工作
、
、
我正在使用
Python
中的scikit-learn库的KNeighborsClassifier算法。我遵循基本指令,例如将我的数据和标签分割成
训练
和
测试数据
,然后根据
训练
数据
训练
我的模型。现在,我试图预测
测试数据
的准确性,但得到了一个错误。这是我的代码:from
sklearn
.cross_validation import train_test_
浏览 3
提问于2016-10-01
得票数 1
回答已采纳
2
回答
如何使用K最近邻
训练
和
测试数据
?
、
、
我正在尝试做一个机器学习算法,使用k近邻来
训练
程序。我有一个
训练
数据和一个
测试数据
,这是两个独立的csv文档,但大多数机器学习算法都是
训练
测试拆分方法,这不是我所需要的,因为
训练
测试拆分是在一个文档上进行
训练
和测试,但我是在一个文档上进行
训练
,并在一个文档上进行测试,所以我被如何使用
训练
数据和
测试数据
进行
训练
和测试所困扰。谁能告诉我下面这段
python
代码是否正确?有没有人知道k近邻机器学习算法的准
浏览 1
提问于2021-02-20
得票数 0
1
回答
Python
SKLearn
训练
测试数据
、
、
、
我的任务是从
Sklearn
对苹果股票的回报运行Logistic和贝叶斯回归,并将其与线性回归+张量流进行比较。我不确定我的理解是否正确,在我运行Logistic回归之前,我必须
训练
我的数据集。1980-12-29 0.64 0.015748 0.082692 0.053110 0.037041 0.058269 0.040822 当我跑的时候 from
sklearn
.model_selection
浏览 12
提问于2019-06-04
得票数 0
回答已采纳
1
回答
使用
sklearn
显示每个给定
测试数据
中每个类的准确性。
、
、
、
、
我用
Python
训练
了1万次
训练
数据的
sklearn
回归分类器。我有两千个
测试数据
,我用精度分数来表示准确性和混淆矩阵。但这两种方法都只显示出所有
测试数据
的总体准确性。例如,我想要的是:A类
测试数据
的准确性: 80%C类
测试数据
的准确性: 10%A类
测试数据
的准确性: 50% B类试验数据的准确
浏览 2
提问于2016-06-16
得票数 0
回答已采纳
2
回答
用
Python
实现多元多项式回归
、
、
最近我开始学习
sklearn
,numpy和pandas,我做了一个多元线性回归函数。我想知道,有没有可能进行多元多项式回归?import numpy as npimport xlrdfrom
sklearn
.model_selection
浏览 42
提问于2019-02-27
得票数 9
回答已采纳
1
回答
当您将模型应用于实际数据时,如何检查ML中的模型是否对数据集有好处?
、
、
、
、
我有一个
python
脚本,它将文本分为正的或负的。我有一个数据集,在对我得到的文本进行预处理之后,我将它分割成
训练
和
测试数据
。对
训练
数据的准确率为91%
测试数据
的准确性为87%Accuracy: 91.459% {'bow__ngram_range': (1, 2),'tfidf__use_
浏览 6
提问于2020-07-22
得票数 0
1
回答
将
训练
数据中的四分位数切割应用于
测试数据
、
、
、
、
是否有任何现有的
python
函数可以从
训练
数据中获取四分位切割并应用于
测试数据
。我在火车和测试中都有大约1000列。是否可以使用pandas qcut函数来使其可伸缩,或者是否有其他现有的
sklearn
函数? 我希望根据火车上的箱子得到
测试数据
的四分位数(1、2、3或4)。
浏览 10
提问于2018-12-14
得票数 3
1
回答
巨蟒特征选择后的预测
、
、
、
、
我正在尝试使用
python
构建一个预测模型。
训练
和
测试数据
集有400多个变量。在
训练
数据集上使用特征选择,变量数减少到180个。from
sklearn
.feature_selection import VarianceThreshold然后利用梯度增强算法
训练
模型from
sklearn
import ensemble from
sklearn
.cross_valida
浏览 1
提问于2016-04-06
得票数 3
回答已采纳
1
回答
可
训练
的R学习StandardScaler
、
、
、
、
在R中是否有类似的东西允许将 (结果为mean=0和标准的deviation=1特性)与
训练
数据相匹配,并使用这个标度模型来转换
测试数据
?没有提供一种基于
训练
数据的均值和标准差来转换
测试数据
的方法。用于
Python
的片段scaler = StandardScaler() scaler.fit(X_train
浏览 0
提问于2018-03-13
得票数 10
回答已采纳
2
回答
LogisticRegression在
python
2.7和3上的不同结果
、
对于
python
2.7(本地机器)和
python
3 (运行在kaggle上的系统)对LogisticRegression的相同内核,我有不同的结果。怎么可能呢?这可能是因为
python
的版本吗?
浏览 0
提问于2019-12-16
得票数 2
2
回答
在scikit中使用
训练
测试拆分时获取索引
、
为了将我的数据分割成单独的
训练
和
测试数据
,我使用我想从原始数据列表中获取
训练
和
测试数据
元素的索引。提前感谢
浏览 2
提问于2016-02-25
得票数 20
1
回答
有没有办法在sci-kit学习交叉验证中定义我想要的每个标签的分数?
、
、
我已经编写了一个简单的
Python
脚本,它使用
sklearn
.neural_network.MLPClassifier和
sklearn
.model_selection.GridSearchCV对二进制分类数据进行预测在
训练
数据中,大约90%的数据标签为1,10%的数据标签为0。在
测试数据
中,大约35%的标签为1,65%的标签为0。这个比例是已知的,尽管标签是未知的。 我的模型目前过度拟合。我对
训练
数据的交叉验证得分是85-90%,但当我在测试集中运行代码时,得分低于40%。我想过的一个解
浏览 15
提问于2020-05-28
得票数 0
回答已采纳
1
回答
当与TPOT相匹配时,fitted_pipeline_是否对整个数据集进行了再培训?
、
、
、
from tpot import TPOTRegressor verbosity=2,经过优化后,最佳评分
训练
流水线存储在我的问题是:安装好的管道将接受什么
训练
?例如: 在将整个数据集存储在tpot.fitted_pipeline_中之前,tp
浏览 1
提问于2018-08-24
得票数 2
回答已采纳
1
回答
朴素的Bayes未见特性处理scikit学习
、
、
、
我的火车数据有1000个特征,我的
测试数据
有1200个特征。假设500个特性在
训练
和
测试数据
中都很常见。_1/step_4.py", line 60, in <module> File "/Library/
Python
/2.7/site-packages/
sklearn
/naive_bayes.py"
浏览 4
提问于2016-05-08
得票数 0
回答已采纳
3
回答
spark中没有像MinMaxScaler这样的缩放器的"inverse_transform“方法吗?
、
、
、
、
当
训练
一个模型时,比方说线性回归,我们可以在
训练
测试数据
集上进行归一化,比如MinMaxScaler。from
sklearn
.preprocessing import MinMaxScaler from
sklearn
.preprocessing
浏览 5
提问于2017-09-07
得票数 6
1
回答
fit_transform、transform和TfidfVectorizer如何工作
、
、
、
、
awesome_cossim_topimport pandas as pdfrom
sklearn
.feature_extraction.text
浏览 0
提问于2020-03-11
得票数 0
回答已采纳
1
回答
如何将相同的PCA应用于
训练
和测试集
例如,我正在将PCA应用于我的
训练
集,并希望使用SVM进行分类。如何在测试集中自动拥有相同的功能?(与PCA之后的新
训练
集相同)。
浏览 80
提问于2019-03-31
得票数 2
回答已采纳
1
回答
如何对TXT文件进行KFold交叉验证
、
、
、
、
例如,我有10个.txt文件,以便划分测试和
训练
数据。(test_rate = 0.2,即2个
测试数据
和8个列车数据)如何在
python
中做到这一点?使用
sklearn
的KFold函数(下面的代码)或其他方法。非常感谢你的答复。import pandas as pdfrom
sklearn
.model_selection import KFold KFold(n_splits=2, random_s
浏览 4
提问于2022-06-19
得票数 0
回答已采纳
2
回答
值错误:输入数组应具有与目标数组相同的样本数。找到166个输入样本和4个目标样本
、
、
、
我在尝试
训练
模型时遇到了一个错误。 validation_split=validation_split) File "/anaconda3/
浏览 0
提问于2018-12-22
得票数 3
1
回答
我应该使用火车数据集上的MinMaxScaler来转换
测试数据
集,还是使用单独的MinMaxScaler来拟合和转换
测试数据
集?
、
、
、
、
train dataset:用于估计ML模型参数(培训)train.py:用于
训练
和测试ML模型、负载
训练
和
测试数据
集,保存所
训练
的模型,通过网格搜索找到最佳模型。然而,在train.py中,fit是在
训练
数据集上进行的,使用相同的MinMaxScaler来转换
测试数据
集。 我的理解是,
测试数据
集是模型应该在
浏览 4
提问于2020-07-01
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之Sklearn使用教程
Python Web 测试数据
Python sklearn之支持向量机
Python机器学习sklearn模块-聚类
Python机器学习sklearn模块-逻辑回归
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券