腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
scikit
中
使用
训练
测试
拆
分时
获取
索引
、
为了将我的数据分割成单独的
训练
和
测试
数据,我
使用
我想从原始数据列表
中
获取
训练
和
测试
数据元素的
索引
。提前感谢
浏览 2
提问于2016-02-25
得票数 20
1
回答
基于LIBSVM
在
scikit
.smv.SVC
中
启用概率估计
、
、
在
LIBSVM
中
,svmtrain
中
的-b标志用于
训练
svmtrain或SVR模型以进行概率估计。为了获得
测试
集的相应结果,我们还在svmpredict
中
设置了-b结果model = svmtrain(train_labelslearn库
中
的SVC时,我们只能在
训练
时设置-b标志
浏览 10
提问于2018-01-10
得票数 1
1
回答
用于keras model.fit_generator的分割图像数据集
、
、
以下是数据集中动物图像的子文件夹:我想将数据集分成model.fit_generotar()的
训练
集和
测试
集。 我怎么能这么做?
浏览 2
提问于2018-02-11
得票数 0
1
回答
Python Pandas
中
的稀疏矩阵与Dataframe
、
、
、
、
我试图
在
Python 上复制这个项目。如何将稀疏矩阵X_new与Dataframe train“连接”,将其包含在cross_validation
中
,然后将其用于分类器?
浏览 2
提问于2015-10-07
得票数 0
回答已采纳
4
回答
KNN算法
在
训练
阶段做什么?
、
、
与线性回归等其他算法不同,KNN似乎不会在
训练
阶段执行任何计算。就像在线性回归的情况下,它在
训练
phase.But中找到系数,那么KNN呢?
浏览 62
提问于2019-02-04
得票数 9
回答已采纳
3
回答
在
整个数据集上还是仅在
训练
数据上计算TF-IDF?
、
、
、
、
在这本书的第七章"TensorFlow机器学习手册“
中
,作者
在
预处理数据时
使用
了
scikit
learn的fit_transform函数来
获取
文本的tfidf特征进行
训练
。
在
将其分为
训练
和
测试
之前,作者将所有文本数据都提供给该函数。这是真的吗?还是我们必须先分离数据,然后
在
列车上执行fit_transform,
在
测试
上执行transform?
浏览 1
提问于2017-12-13
得票数 17
回答已采纳
1
回答
在
python
中
手动创建
训练
和
测试
数据集
、
、
我试图手动将数据集分割为
训练
和
测试
数据集,这意味着我不想
使用
scikit
learn包。我希望以这样的方式拆分它们:如果行
索引
模块4等于0,则将它们放入
训练
数据集中,否则将它们放入
测试
数据集中。我已经
在
R
中
这样做了: testidx = which(1:nrow(price_accommodates_bedrooms )%%4 == 0) df_train = price_accommodates_bedrooms[-testidx,
浏览 12
提问于2020-03-27
得票数 0
1
回答
滑雪板StratfiedShuffleSplit
、
这个函数是否实际上在数据上添加了一个
索引
来区分
测试
和
训练
,这就是为什么他们会
使用
.loc?它到底是将income_cat列拆分为什么呢?谢谢!
浏览 1
提问于2018-11-13
得票数 1
回答已采纳
1
回答
在
Scikit
上
训练
时如何
获取
权重矩阵
、
、
、
我正在
使用
Scikit
训练
一个MLPClassifier。假设我想在MNIST上
训练
5个时期,其中一个隐藏层由100个神经元组成。但我想要的是
在
训练
过程
中
每个时期后获得的权重矩阵序列。因此,如果我
训练
5个时期,我会想要一个
浏览 0
提问于2020-01-25
得票数 0
1
回答
利用GaussianProcessRegressor
中
的
训练
数据优化核心参数
、
、
、
、
我想
使用
我
在
Scikit
- training的GaussianProcessRegressor
中
的
训练
数据来优化内核参数或超参数。我的
训练
数据集是y:无线电信号强度(RSS)
在
二维坐标点作为观测输出。我已经安装了python和
Scikit
-learn软件。我已经成功地
测试
了样本代码。我能够用
训练
数据预测
测试
点的RSS。我
使用</em
浏览 0
提问于2018-05-04
得票数 1
回答已采纳
2
回答
Scikit
-learn
中
随机森林
训练
前的预随机化
、
、
由于对
训练
集进行了预随机化,我
使用
sklearn.ensemble.RandomForestClassifier获得了令人惊讶的显着性能提升(交叉验证精度增益+10%)。这对我来说非常令人费解,因为(a) RandomForestClassifier假设无论如何都会对
训练
数据进行随机化;以及(b)为什么示例的顺序如此重要? 有什么好的建议吗?
浏览 1
提问于2016-02-16
得票数 0
2
回答
使用
sci-kit
中
的
训练
/
测试
数据学习曲线,而不是交叉验证
、
、
、
我有一个独立的
训练
和
测试
数据(从不同的CSV加载到不同的pandas数据框
中
),我想用这些
训练
和
测试
数据绘制学习曲线,而不是
使用
交叉验证从
训练
集本身生成
训练
和
测试
数据(这似乎是learning_curve似乎
scikit
希望你的
测试
和
训练
数据出现在同一个Dataframe
中
,但这样分类器也会学习
测试
数据,这不是我想要的。 我该如何着手解决这个问题
浏览 3
提问于2015-09-20
得票数 2
1
回答
H2O数据分割成列时行
索引
的
获取
及
测试
、
、
、
到目前为止,对于火车
测试
的分割,我已经
使用
了sklearn的StratifiedKFold()。
在
H2O
中
,我无法理解如何在进行交叉验证时
获取
索引
。=5)train_df = data_split[0]如何获得进入
训练
浏览 1
提问于2017-11-16
得票数 1
回答已采纳
1
回答
包含ID列的
训练
模型
、
、
、
我正在
使用
scikit
-learn
训练
一个模型,其中我的数据集中有一个ID列。当我
使用
测试
数据集
训练
model.But时,我删除了ID列,
在
进行预测后,我需要将其映射回ID列。
在
scikit
-learn
中
构建模型时,我们可以设置一个非预测器列。另外,像TensorFlow,Spark ML这样的其他ML工具又如何呢?它们是否支持此功能?我
在
stackoverflow上找到了这个,但正在寻找其他选择。
浏览 1
提问于2018-04-18
得票数 2
2
回答
使用
sklearn的实时数据
、
、
、
我有一个健康患者数据的实时数据馈送,我用python连接到它。我想在这个数据馈送上运行一些sklearn算法,这样我就可以实时预测某人是否会生病。有没有一种将实时数据连接到sklearn的标准方法?我传统上有静态数据集,从来没有传入的流,所以这对我来说是相当新的。如果任何人有一些通用的规则/流程/工具,那就太好了。
浏览 2
提问于2017-01-28
得票数 2
1
回答
随机森林对看不见的数据做了什么?
、
、
、
当我
在
python中
使用
scikit
learn构建我的随机森林模型时,我设置了一个条件( sql查询
中
的where子句),以便
训练
数据只包含值大于0的值。我很想知道随机森林如何处理值小于0的
测试
数据,这是随机森林模型
在
训练
数据
中
从未见过的。
浏览 11
提问于2016-08-17
得票数 0
回答已采纳
2
回答
标题: SVC-
Scikit
学习问题
、
、
、
我
在
Scikit
学到了这个错误。以前我做过K验证,从来没有遇到过错误。我的数据是稀疏的,
训练
和
测试
集除以90:10。ValueError:不能
使用
在密集数据上
训练
的SVC
中
的稀疏输入 有什么直接的原因和解决办法吗?
浏览 1
提问于2016-12-10
得票数 0
回答已采纳
1
回答
Vectorizer fit信息存储在哪里或如何存储?
、
在
文本挖掘/分类
中
,当
使用
向量器将文本转换为数值特征时,
在
训练
中
使用
TfidfVectorizer(...).fit_transform(text)或TfidfVectorizer(...).fit(text
在
测试
中
,它假设利用以前的
训练
信息,并仅在
训练
拟合后转换数据。 一般情况下,试运行与列车运行是完全分开的。但它需要一些关于
在
训练
阶段获得的拟合的信息
浏览 1
提问于2016-03-09
得票数 0
2
回答
Scikit
-学习数据
索引
和引用
、
我
使用
GridsearchCV
训练
了多个不同的模型。
在
训练
过程
中
,数据排序如下: [feature 1, feature 2, feature 3, feature 4] 我想
使用
保存的(用joblib保存的)模型来预测新数据。新数据/不可见数据的顺序如下: [feature 1, feature 2, feature 4, feature 3]
训练
数据和新数据之间的特征是相同的(即特征1表示两个数据集之间的相同事物)。输入数据的顺序对
scikit<
浏览 16
提问于2019-02-26
得票数 0
1
回答
是否可以将特征学习用于二进制文本分类?
、
、
在
我的阅读
中
,我注意到确实没有一组令人信服的特征来区分这两个已经被发现的特征,所以我突然产生了一个疯狂的想法,试图创建一个可能会更好的特征学习算法。 这个是可能的吗?如果是这样的话,你建议我怎么做呢?从我所做的阅读来看,大多数特征学习都是
在
图像处理上完成的。另一个问题是,我拥有的数据集可能太小,无法让它工作(
在
100年代),除非我找到一种方法从孩子们那里获得更多的抄本。
浏览 0
提问于2016-08-31
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Keras文本分类实战(下)
如何使用 Scikit Learn 为机器学习准备文本数据
Scikit-Learn大变化:合并Pandas
Python从零开始第六章机器学习①逻辑回归实战
yellowbrick:机器学习的可视化分析诊断库
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券