腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
与Orange
python
库的
交叉
验证
、
、
、
我尝试使用
python
包"Orange“进行
交叉
验证。这个库看起来很不错,但我对它有一些问题。在这里,如您所知,在
交叉
验证循环中处理离散化和
特征
选择是很重要的。换句话说,对于每个
交叉
验证循环,(1)仅对训练数据进行离散化,并对测试数据使用相同的装箱切割;(2)从训练数据中获取重要
特征<
浏览 6
提问于2016-12-07
得票数 1
1
回答
稀疏分层KFold (Csr)
特征
矩阵
、
、
、
、
我有一个包含模型
特征
的大型稀疏矩阵(95000,12000)。我想用
python
中的Sklearn.cross_validation模块做一个分层的K折叠
交叉
验证。然而,我还没有找到一种在
python
中索引稀疏矩阵的方法。 有什么方法可以在我的稀疏
特征
矩阵上执行StratifiedKFold吗?
浏览 1
提问于2015-11-08
得票数 0
1
回答
样本随机森林分类的
特征
重要性
、
使用随机森林,是否可以确定哪些
特征
是驱动
特征
,以便将特定样本分类为A类?问一个随机森林的问题有意义吗?关于如何在
python
中使用sklearn实现它的额外积分:)问题已经在这里被
交叉
回答了:https://stats.stackexchange.com/questions/174229
浏览 0
提问于2015-09-25
得票数 2
1
回答
在
特征
选择之前或之后采样
、
、
、
我对
特征
选择、采样和
交叉
验证的顺序感到困惑,我的数据集有468行和23000列,其中269个属于I类,199个属于II类,当拆分训练和测试时,训练.Due中的数据有215个I类和159个II类,以减少样本数量我不得不对训练数据应用I)先应用过采样,然后应用
特征
选择技术,然后进行
交叉
验证:在
交叉
验证过程中,可能会由于过采样导致重复行而导致偏差。II)首先应用
特征
选择技术,然后进行过采样,然后进行
交叉
验证,这将导致与上述相同的偏差。III)首先应用
特征
选择
浏览 133
提问于2020-08-12
得票数 1
1
回答
Sklearn
特征
选择
、
、
、
带有
交叉
验证(RFEVC)的递归
特征
消除(RFEVC)不适用于多层Perceptron估计器(以及其他几个分类器)。 我希望在许多分类器中使用一个
特征
选择,执行
交叉
验证来验证其
特征
选择。
浏览 4
提问于2016-12-11
得票数 2
1
回答
自动
特征
选择-避免数据泄漏的最佳实践?
、
、
、
、
这个问题通常与所有自动
特征
选择方法有关。在我的特定场景中,我们有一个称为茶鲜和多类分类的
python
包。我想实现什么?由于
特征
选择往往是一个相当苛刻的任务,我有很多模型,使用CV与5k倍的分裂大大增加了计算时间。如果我使用tsfresh执
浏览 0
提问于2022-06-20
得票数 1
1
回答
以顺序变量、范畴变量和连续变量为预测变量的
特征
选择
、
、
、
我希望从包含13000+行和162个预测变量的数据集中对贷款违约者进行分类,即0用于非违约者,1用于违约者。预测变量由范畴序数、范畴标称和连续变量以及虚拟变量组成。我希望这能解释这个问题。
浏览 2
提问于2022-06-10
得票数 0
1
回答
的RFECV()评分-学习
、
、
Scikit-learn库支持递归
特征
消除(RFE)及其
交叉
验证版本(RFECV)。RFECV对我非常有用,它选择了一些小的特性,但是我想知道RFE的
交叉
验证是如何完成的。所以我认为RFECV会计算
交叉
验证分数,去掉1乘1的
特征
。 但是如果使用
交叉
验证,我认为每个折叠都会选择其他特性,因为数据是不同的。有人知道在RFECV中如何删除功能吗?
浏览 0
提问于2016-01-10
得票数 1
回答已采纳
1
回答
如何使用(
Python
AHP) numpy.linalg导出最大
特征
值(似乎不收敛?)
、
、
、
我是一个地理空间专家,不是数学家或程序员。所以请不要因为我不正确的措辞或糟糕的编码而责备我。我只是在寻求帮助。A = numpy.array(matrix) eigenvalues, eigenvector=numpy.linalg.eig(A)eigenvalues=numpy.float32(eigenvalues) #float3
浏览 1
提问于2016-11-30
得票数 1
1
回答
使用scikit-learn对文本文档进行分类的
交叉
验证
、
、
在使用scikit-learn对文本文档进行分类时,您是先进行
交叉
验证,然后再进行
特征
提取,还是采用其他方式?FeatureExtractor()), ], n_jobs = -1) 我用下面的方法来做,但是我想知道我是否应该首先提取
特征
并进行
交叉
验证
浏览 2
提问于2015-09-23
得票数 0
3
回答
如何在具有分类
特征
和数值
特征
的数据集上进行
特征
选择?
、
、
为了提高培训效率,我希望在我的数据集上执行
特征
选择。但是,我对如何处理包含分类和数值特性的数据集感到困惑。我试图通过
交叉
验证(RFECV)实现对整个
特征
空间的递归
特征
删除。
python
熊猫科学-学习特性-选择
浏览 0
提问于2020-07-15
得票数 7
1
回答
您是否预测过
交叉
验证(gridsearchcv / KFold)后的测试数据,以及如何预测?
、
、
、
、
我的数据集包含40个测量对象(MO)中每个对象的112个
特征
向量。共有4480个
特征
向量,平均分为4个类别,533个
特征
。(这里有更多关于的信息)在分割数据集(训练:34 MO,测试:6 MO)和减少
特征
数目之后,主要通过主成分分析( PCA ),我用KFold对不同模型的超参数进行了调整。我的教授说不行,
交叉
验证本身就已经过时了。这违背了我对机器学习最佳实践和sklearn
交叉
验证的基本理解。 在预测/评估时,我是否必须考虑测试集中每个MO的
特征</em
浏览 3
提问于2020-12-18
得票数 0
回答已采纳
1
回答
SVM的参数选择
、
、
对于支持向量机的参数选择,可以进行嵌套
交叉
验证。问题是,我最终也需要最佳参数的值。我该怎么做?我不应该做嵌套的
交叉
验证,只循环所有参数并进行
交叉
验证吗? 其次,如果我使用线性支持向量机,然后使用这个加权向量w来确定
特征
的重要性,那么它是否也适用于非线性支持向量机(
浏览 2
提问于2015-06-18
得票数 1
回答已采纳
2
回答
如何表示最终模型(例如随机森林)?
、
、
、
、
我在dataset上运行了随机森林(不平衡的二进制目标类),并使用
交叉
验证来调优参数,并使用递归
特征
消除和
交叉
验证来获得
特征
子集。但是概率阈值呢?
浏览 0
提问于2017-01-18
得票数 1
1
回答
对
特征
选择预处理进行
交叉
验证的动机是什么?
、
、
我看过几篇关于
特征
选择(包装器和嵌入式方法)的文章和例子,他们把样本数据分成训练集和测试集。我理解为什么我们需要使用
交叉
验证(将数据分成训练集和测试集)来构建和测试模型的分数(所提出算法的实际预测)。 但我不明白这样做的动机是什么?我们需要选择哪些
特征
没有真正的结果,那么它如何改进
特征
选择的过程呢? 好处是什么?
浏览 37
提问于2020-04-04
得票数 0
1
回答
如何进行实时数据的
特征
工程?
、
、
、
、
我用以下步骤建立了一个很好的线性回归模型: 我的问题是,如果我们在生产环境中使用这个模型,那么我们如何进行实时数据的
特征
工程,因为这个模型是用
特征
归一化和缩放的来建立的,那么如何对实时数据进行规范化和缩放以得到一个很好的预测呢?对于
交叉
验证和测试步骤,我们不需要显式的
特征
工程,因为在建立模型之前,这可以在数据预处理步骤中完成。实时数据
特征
浏览 2
提问于2017-03-01
得票数 0
1
回答
什么是科学学习中的输出
交叉
验证模型(又名估计)?
、
、
、
、
我在
python
中编写了一段代码,使用scikit-learn模块执行支持向量机分类,并进行递归的
特征
消除和
交叉
验证:rfecv = RFECVStratifiedKFold(y_train, 2), scoring='f1') rfecv.fit(X_train, y_train) 不幸的是,我无法理解为什么使用
交叉
验证模型
交叉
验证的模型是否表示基于预测
浏览 2
提问于2015-03-24
得票数 0
回答已采纳
2
回答
交叉
验证和文本分类
、
、
我有一个在中被问到的同样的问题: 我有一个关于在sklearn中使用
交叉
验证来进行文本分类的问题。在
交叉
验证之前向量化所有数据是有问题的,因为分类器会“看到”测试数据中出现的词汇表。我的意思是,对于每一个折叠,
特征
集将是不同的,因为训练数据是不同的。但是,由于我正在对分类步骤和分类步骤之间的数据进行大量处理,所以不能使用管道.并试图把我自己的
交叉
验证作为整个过程的外部循环.关于这方面的任何指导,因为我对
python
和镰状体学习都相当陌生。
浏览 5
提问于2016-06-25
得票数 2
回答已采纳
1
回答
是否有从不同的
特征
选择技术中选择
特征
的标准方法?
、
我有四种不同的
特征
选择技术,向后消除,拉索,feature_importances和递归
特征
选择。每种技术返回的结果略有不同。例如,拉索:展开移动,然后传播递推:价差 在从不同的模型中选择
特征
时,是否有标准的方法?
浏览 0
提问于2020-12-17
得票数 1
1
回答
带自定义标准的前向
特征
选择
、
、
、
、
我正在尝试为我的数据获取最好的
特征
进行分类。为此,我想尝试使用SVM,KNN,LDA和QDA进行
特征
选择。此外,测试这些数据的方法是留下一个方法,而不是通过将数据拆分成多个部分来进行
交叉
验证(基本上不能拆分一个文件/矩阵,但必须留下一个文件用于测试,同时与其他文件一起训练) 我尝试在Matlab中使用支持向量机的sfs,但一直只得到第一个功能,没有得到其他功能(有254个功能) 有没有办法在
Python
或Matlab中做到这一点?
浏览 15
提问于2020-06-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python基础——6 交叉验证法
Python机器学习-特征工程
python面向对象三大特征
Python面向对象2:继承、多态特征
Python的高级特征你知多少?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券