腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
排列
特征
重要性
、
特征
重要性
和排列
特征
重要性
之间的区别是什么?在python中,我们如何计算
特征
重要性
得分?
浏览 40
提问于2020-02-29
得票数 0
1
回答
决策树的
特征
重要性
、离散化及判别准则
、
、
、
、
我正在处理数值
特征
,我想在sklearn中使用决策树分类器来找到
特征
的
重要性
。
特征
的
重要性
。越高,功能就越重要。
特征
的
重要性
计算为该
特征
所带来的标准的(规范化)总体缩减。它也被称为基尼
重要性
R195。我的问题是,即使我使用信息增益来寻找最佳的分裂,“
浏览 6
提问于2015-05-31
得票数 0
1
回答
关于解释任务回答中对比解释部分
重要性
解释的问题
我想知道在获得解释任务响应时,如何解释对比解释部分中的“
重要性
”值。对于一些与输入
特征
相比没有改变的
特征
,
重要性
似乎很高,而对于与输入
特征
相比值发生变化的一些
特征
,
重要性
似乎较低。我试图理解返回的所有
特征
中哪些是关键的-我首先使用的是那些与输入
特征
相比发生了变化的
特征
,但由于这与
重要性
值不一致,我想更好地理解这种
重要性
代表什么?"importance": &qu
浏览 12
提问于2019-09-05
得票数 0
回答已采纳
1
回答
随机森林
特征
选择的Pearson相关或
特征
重要性
、
我有一个数据集,其中一个
特征
显示了与目标变量的最小显着性关系;然而,在评估了
特征
重要性
之后,它显示了与目标变量的最显著关系,如图像所示。在下面的图像中,名为"diff“的变量是目标,称为”小时“的变量是独立的
特征
。基于Pearson相关性的
特征
是否有可能表现出最小的显着性关系,而基于
特征
重要性
的
特征
表现出最显著的关系?如果是,那么哪一个是
特征
选择的参考?皮尔逊相关性还是
特征
重要性
?
浏览 3
提问于2022-02-03
得票数 0
1
回答
在SciKit-Learn GradientBoostingClassifier中不重新调整的零
重要性
特征
去除
、
、
在SciKit-Learn中安装GradientBoostingClassifier后,其中一些功能的
重要性
为零。当然,我意识到我可以删除零
重要性
特征
,但我不愿改变已经适合的模型。(如果我删除零
重要性
特征
并重新进行拟合,我会得到一个略有不同的模型。) 这是一个bug,模型需要零
重要性
特征</e
浏览 14
提问于2018-08-01
得票数 2
回答已采纳
1
回答
关于分类特性的特性
重要性
的查询
、
、
关于分类特性的特性
重要性
的查询:查询:是否有基本和优雅的方式来选择最重要的特性? 我如何
浏览 0
提问于2018-12-15
得票数 1
1
回答
某些值无关的分类问题的全局
特征
重要性
、
、
我有一个二进制分类问题,其中大多数
特征
都是分类的,有4个可能的值:是的,不,无关的,nan。我试图找出这些特性对目标列(二进制)的模块化全局特性的
重要性
。 这些列表示特定过程中的检查。
浏览 0
提问于2022-06-26
得票数 1
1
回答
Scikit learn SelectFromModel -实际获取潜在预测者的
特征
重要性
得分
、
、
、
我正在尝试估计我手头的分类任务的
特征
重要性
。对我来说,重要的是获得代表每个
特征
重要性
的具体数字,而不仅仅是“挑选最重要的X个
特征
”。显而易见的选择是使用基于树的方法,它提供了很好的feature_importances_方法来获取每个
特征
的
重要性
。但我对基于树的分类器的结果并不满意。我了解到SelectFromModel方法能够根据
重要性
分数消除不重要的
特征
,并成功地对支持向量机或线性模型做到了这一点。我想知道,有没有办法从Selec
浏览 8
提问于2017-07-26
得票数 2
回答已采纳
1
回答
CatBoost LossFunctionChange中的负要素
重要性
值
、
、
我注意到,对于某些功能,功能
重要性
值为负值,我不知道如何解释它们。 它在文档中说,第i个
特征
重要性
计算为损失(不包括第i个
特征
的模型)-损失(模型)之间的差值。因此,负的
特征
重要性
值意味着该
特征
使我的损失增加?那么这意味着什么呢?
浏览 25
提问于2019-04-21
得票数 0
回答已采纳
1
回答
相关性是否会影响ML模型的
特征
重要性
?
、
、
对于彼此高度相关(皮尔逊相关性)的
特征
,我正在考虑使用
特征
重要性
(通过增益来衡量)来丢弃
重要性
较低的
特征
。我的问题: 1:相关性是否会影响/偏差
特征
重要性
(通过增益衡量)?2:对于ML模型,有没有什么好的方法来删除高度相关的
特征
? 例如:a的importance=120,b的importance=14,corr(a,b)=0.8。
浏览 1
提问于2019-07-10
得票数 0
1
回答
两种相似机器学习模型的
特征
重要性
差异
、
、
、
、
我对模型1和模型2返回的概率(以它们作为输入
特征
)使用了随机林分类器,并得到了类似的性能度量(准确性、精确召回)。模型1和模型2的
特征
重要性
分别为49%和51%。情景2: 我使用文本分类模型的概率X作为模型2的输入特性(包含分类和数字
特征
)。其性能与情景1基本相似,但最终模型的
特征
重要性
表明,文本模型概率在68%左右,其余
特征
的
重要性
较小。我想了解这两种情况在
特征
重要性
上的区别。
浏览 0
提问于2021-01-05
得票数 0
回答已采纳
1
回答
数据预处理和
特征
工程
、
、
我一直在读一些关于数据预处理和
特征
工程的文章,包括
特征
选择,
特征
重要性
和
特征
构造。我的理解是在数据预处理阶段应用了
特征
工程。此外,在应用机器学习模型时,有时会检查
特征
重要性
,有时会在模式内部进行检查。 我的问题是:
特征
工程是否总是在预处理阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shosho
浏览 45
提问于2021-04-28
得票数 0
1
回答
特征
重要性
、
、
、
、
我有一个有10个
特征
的数据集。 我已经使用排列
重要性
和eli5交叉验证计算了
特征
的
重要性
,在拟合了一个非常随机的树(ET)分类器后,由Scikit学习。我每次只使用一个
特征
来拟合10个不同的ETs,并使用相同的CV方案计算出平均交叉验证分数。我注意到,当我从排列
重要性
中得到的
特征
的
重要性
顺序与我使用平均CV分数对它们进行排序时,当我一次只用一个
特征
来拟合模型时,有一个
特征
的排列
重要性
等级位于最底层,
浏览 0
提问于2019-09-06
得票数 3
回答已采纳
1
回答
(Caret)包中机器学习模型的
特征
重要性
、
、
、
我有一个关于Caret包中的功能
重要性
函数的问题。 我有一个数据集,它有更多的数值和因子
特征
。我使用下面的命令来获取模型的
特征
重要性
。它给出了因子变量的每个(sub_feature)的
重要性
。然而,我只想知道功能本身的
重要性
,而不是详细说明功能的每个因素。 gbmImp <-插入符号::varImp(xgb1,scale = TRUE)
浏览 19
提问于2020-06-18
得票数 0
回答已采纳
2
回答
线性回归系数与决策树
特征
重要性
的关系
、
、
最近我有一个机器学习(ML)项目,它需要识别
特征
(inputs,a1,a2,a3 ...A)对目标/产出有很大影响。我使用线性回归来获得
特征
的系数,并使用决策树算法(例如随机森林回归)来获得重要的
特征
(或
特征
重要性
)。 我的理解对吗?线性回归中系数大的
特征
应该在决策树算法中
特征
重要性
的最高列表中。
浏览 29
提问于2019-04-18
得票数 1
回答已采纳
1
回答
将SHAP值聚合到特性集是否有效?
、
SHAP值似乎是相加的,例如,总体
特征
重要性
图简单地将每个
特征
的绝对SHAP值相加,并对它们进行比较。这允许我们使用SHAP来表示全局
重要性
和局部
重要性
。我们也可以以同样的方式获得特定数据记录子集的
特征
重要性
。 同样,获取变量集合的聚合Shap值是否有效?
浏览 22
提问于2019-12-05
得票数 2
2
回答
特征
效应与
特征
重要性
的差异
、
、
、
在机器学习术语中,
特征
效应(如SHAP效应)和
特征
重要性
之间是否有区别?
浏览 0
提问于2021-08-03
得票数 2
2
回答
使用LightGBM的特性
重要性
、
、
、
、
问题是这两种算法在
特征
重要性
方面的不一致行为。我使用了默认参数,我知道它们使用不同的方法来计算
特征
的
重要性
,但我认为高度相关的
特征
对模型的预测总是有最大的影响。随机森林
特征
重要性
LightGBM特性
重要性
与目标的相关性
浏览 4
提问于2020-10-21
得票数 3
回答已采纳
1
回答
Adaboost和决策树的
重要性
有何不同?
、
、
、
我有一个多类分类问题,我在杂质减少的基础上提取
特征
重要性
。我比较了一个决策树和AdaBoost分类器,我认为有一个功能在决策树的顶部,而根据AdaBoost,它的
重要性
要低得多。这是正常的行为吗?
浏览 6
提问于2022-04-19
得票数 0
2
回答
是否应该在列车测试拆分之前或之后进行
特征
选择?
、
、
矛盾的回答是,如果只使用从整个数据集中选择的训练集进行
特征
选择,那么
特征
选择或
特征
重要性
评分顺序可能会随着random_state的Train_Test_Split的变化而动态变化。如果任何特定工作的
特征
选择发生变化,那么就无法进行
特征
重要性
的泛化,这是不可取的。其次,如果只使用训练集进行
特征
选择,那么测试集可能包含某些实例,这些实例与仅在训练集上进行的
特征
选择相矛盾,因为没有对整个历史数据进行分析。此外,只有在给定一组实例而不是单个
浏览 0
提问于2019-05-25
得票数 21
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【特征工程系列一】论特征的重要性
如何找到BlackBox的特征重要性
基于随机森林识别特征重要性
特征工程 特征处理
特征工程:特征缩放、选择
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券