腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
中
向量
的
基
尼
杂质
的
计算
、
我正在处理
R
中
的
一个问题,并试图将
基
尼
指数作为二进制分类问题
的
一部分来
计算
,最初是针对所有值都不同
的
向量
。我有点困惑,因为我期望得到
的
结果是1才是完美的ienquality,然而使用
基
尼
函数我得到了不同
的
结果,例如使用DescTools库
中
的
Gini()函数: samplevector <- c(0:20)
浏览 11
提问于2019-02-15
得票数 0
6
回答
基
尼
系数与
基
尼
杂质
决策树
问题涉及决策树
的
建立。根据维基百科
的
说法,'
基
尼
系数‘不应该与'
基
尼
杂质
’混淆。然而,这两种方法都可以在构建决策树时使用--它们可以支持我们在拆分项目集时
的
选择。1)“
基
尼
杂质
”--这是一种标准
的
决策树分裂度量(见上面的链接); 2)“
基
尼
系数”--每一次分裂都可以根据AUC准则进行评估。对于每个分裂场景,我们可以构建一个RO
浏览 0
提问于2014-09-09
得票数 33
1
回答
从随机森林分类器得到
的
变重要度图
的
平均降低精度单位?
、
、
为了了解随机森林中
的
重要变量,我使用了平均减少精度和平均减少
基
尼
值。📷 谢谢
浏览 0
提问于2020-06-19
得票数 0
2
回答
吉
尼
杂质
决策树如何
计算
根节点?
、
、
、
我不知道它是如何用<=7.5选择根节点
的
,它
的
gini
杂质
是0.45,但是我尝试手工
计算
它,但是我得到
的
加权gini
杂质
是0.27。import pandas as pda1 = [1, 0, 1, 0, 0] df = pd.DataFrametarg
浏览 0
提问于2019-07-19
得票数 1
回答已采纳
1
回答
如何理解随机森林模型
中
特征重要性
的
计算
、
、
我想知道用
基
尼
指数
计算
随机森林
的
特征重要性
的
细节。我指的是这个中文博客:https://www.jianshu.com/p/7a876bb876b9。但我不清楚这些数学形式在博客
中
。例如📷📷 我对M集很
浏览 0
提问于2019-12-16
得票数 0
回答已采纳
1
回答
用
基
尼
指数
计算
信息增益
中
的
负值
、
、
我试图在给定数据上确定决策树
的
根节点。annual income目标变量已被重命名为low、mid和high。1-为数据集
计算
基
尼
指数(目标是年收入)2-对每个变量
计算
基
尼<
浏览 0
提问于2020-05-05
得票数 1
回答已采纳
1
回答
雪橇min_impurity_decrease解释
、
、
min_impurity_decrease在sklearn
中
的
定义是 看看吉
尼
指数(
杂质
)= 0.2041
的
绿色方,为什么当我们把min_impurity_decrease =0.1时,
基
尼
指数(
杂质
浏览 0
提问于2019-02-21
得票数 6
2
回答
scikit-learn默认使用哪种决策树算法?
、
scikit-learn会根据数据聪明地选择最好
的
决策树算法吗?
浏览 25
提问于2019-08-21
得票数 2
回答已采纳
1
回答
sklearn RandomForestClassifier
中
的
类权重参数是如何工作
的
?
、
、
类权重参数在算法内部
的
影响
浏览 20
提问于2021-06-01
得票数 0
8
回答
什么时候我应该使用
基
尼
杂质
,而不是信息增益(熵)?
、
、
有人能实际解释
基
尼
杂质
和信息增益 (基于熵)背后
的
原理吗? 在使用决策树时,哪个指标更适合在不同
的
场景中使用?
浏览 0
提问于2016-02-12
得票数 108
1
回答
基
尼
指数
的
含义是什么?
、
、
、
我在研究随机森林模型,但我不明白吉
尼
指数是什么,它是干什么用
的
。谢谢!
浏览 0
提问于2021-09-23
得票数 2
回答已采纳
1
回答
如何在回归树中
计算
特征重要性?
、
、
、
在使用决策树算法或随机森林进行分类
的
情况下,我们使用
基
尼
杂质
或信息增益作为衡量标准,以确定首先选择哪个特征来分割父节点/中间节点,但如果我们使用决策树或随机森林进行回归,那么如何
计算
特征重要性或选择特征
浏览 62
提问于2020-10-22
得票数 1
1
回答
R
:手动
计算
类方法
的
rpart相对误差(虹膜数据集)
、
., data=iris[1:120,], method="class") 我正在尝试手动
计算
下面的黄色数字(0.285714)。 ? 我认为如果树从0到1个节点,这应该是
基
尼
杂质
的
相对减少: pNode1 = c(50,50,20)/120pNode3 = c(0,50,20)/70 #
浏览 26
提问于2019-06-19
得票数 1
回答已采纳
1
回答
决策树
中
的
杂质
测度
、
我最近进入了基于
杂质
的
决策树标准,我只是想知道为什么我们真的需要一个基于
杂质
的
标准模型,比如
基
尼
指数?如果我们可以简单地将实体标记为多数类呢?会对结果产生什么影响?
浏览 0
提问于2020-04-22
得票数 0
1
回答
随机森林和XGB‘回归者’如何
计算
特征重要性
、
、
、
、
我正在寻找随机森林和XGB‘回归者’如何
计算
特性重要性。然而,大多数
的
讨论都集中在分类器上。 我试图在正式文件中找到答案,但有一些问题。在
中
,对get_score
的
描述表明,对于线性模型,只定义了“权重”,它是无偏差
的
归一化系数。它是否意味着特征
的
重要性仅由输入和输出之间
的
系数
计算
?不是由mse还是gini
计算
的
?在
中
,对feature_importances_
的
描述表示“基于<e
浏览 0
提问于2021-06-27
得票数 0
1
回答
特征与树木森林
的
重要性是如何工作
的
?
、
、
有人能解释一下如何使用树木森林来评估功能重要性(feature_importances_)
的
工作原理吗?
浏览 7
提问于2017-10-20
得票数 0
4
回答
特征重要性语境下
的
决策树解释
、
、
、
、
我试图了解如何充分理解决策树分类模型
的
决策过程。我要看
的
两个主要方面是树
的
图形表示和特性重要性列表。我不明白
的
是特性
的
重要性是如何在树
的
上下文中确定
的
。例如,下面是我
的
特性重要性列表:FeatureJ (0.039006)FeatureL (0.008136)然而,当我看到树
的
顶端时,它看起来是这样
的</
浏览 0
提问于2017-02-02
得票数 13
回答已采纳
2
回答
在spark决策树中使用什么算法(是ID3、C4.5还是CART)
、
我有一个关于MLlib
中
决策树
的
问题。Spark中使用
的
是什么算法?是ID3,C4.5还是CART?
浏览 5
提问于2016-12-07
得票数 8
1
回答
何时使用某些度量来分割决策树?
、
因此,我最近才了解到决策树,以及在训练树时确定最佳分割
的
不同度量标准。我似乎找不到在某些情况下使用哪一种度量,或者哪一种更适合于某些类型
的
数据?我比较
的
是:
基
尼
杂质
方差信息增益比 我应该在什么时候使用哪一种,或者说它们之间是否有微不足道
的
区别?
浏览 0
提问于2019-08-05
得票数 1
1
回答
谁写
的
吉
尼
重要性/滑雪
的
特征重要性评分公式?
、
、
我一直在寻找一篇首次提出
基
尼
重要性
的
论文,但我不确定这是否真的是这样
的
。以下是我熟悉并希望在一篇论文中找到
的
公式: N_s =特定节点上
的
样本数i =
杂质
*_l =左子节点
浏览 0
提问于2019-01-02
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R中的向量化计算
R的数据类型:向量与数据框
Python中的向量化编程
计算机的时钟(三):向量时钟
在“质量标准制定依据”里,杂质的限度如何计算?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券