腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
决策树
在
R
中
给
出了
错误
的
分类
?
、
、
作为为Fisher
的
虹膜数据创建
决策树
的
结果,我得到了
错误
分类
错误
率: 0.02667 =4/ 150。但是我
在
我
的
图中只看到了3个
错误
:。如果我们看一下这一点
的
概率-这是可以
的
(virginica-与上图相同): 0 0.1666667 0.83333333你能解释
为什么
会发生这种<em
浏览 13
提问于2017-07-12
得票数 0
回答已采纳
1
回答
SKLearn decisionTreeClassifier不处理稀疏或
分类
数据。
、
是否有一种将decisionTreeClassifier
中
的
SKLearn与稀疏元组相匹配
的
方法?我所拥有的数据是基于大约100个特性,但其中只有少数是用来做决定
的
。实际上,每一行数据都是稀疏元组。我
的
目标是找到一种自动化
的
方法,将其减少到数十个近似于相同行为
的
节点。我需要访问生成
的
结构--这就是我考虑使用SKLearn而不是DataRobot
的
原因。但是,这意味着我必须为每行100个特性
中
的
每一个
浏览 0
提问于2022-01-12
得票数 0
1
回答
利用可视化垂直线对数据点进行
分类
、
、
、
我目前正在做硕士论文,
在
毕业后,我
的
导师提
出了
一些问题。我已经回答了大部分
的
问题,但只剩下一个问题,我不知道如何回答。我
的
硕士论文是将给定
的
医学数据
分类
为癌症或免疫,预处理后
的
数据点
的
可视化看起来如下所示,现在,我已经使用支持向量机与核、
决策树
和随机森林算法对数据点进行
分类
,它们获得了很好
的
精度和F1评分,但我
的
主管提
出了
以下问题我几乎可以
浏览 0
提问于2022-10-30
得票数 1
1
回答
我们能从学习梯度增强
决策树
中提取最终
的
决策规则吗?
、
、
、
、
我必须使用梯度引导
决策树
在
Python
中
构建一个
分类
模型,并获得模型参数(节点处
的
值)以
在
硬件上实现。据我所知,梯度增强
决策树
的
最终结果是一个具有阈值
的
普通
决策树
分类
器,用于对输入数据进行
分类
。我读过以下文章: model.estimators_包含模型所包含
的
所有单个
分类
器。对于GradientBoos
浏览 0
提问于2019-04-23
得票数 0
回答已采纳
1
回答
决策树
桩
、
、
、
、
我想使用AdaBoost实现一个java应用程序,它可以对大象是非洲象还是亚洲象进行
分类
。我
的
Elephant类有字段:int weight;ElephantType type; // (which can be Asian我是AdaBoost
的
新手,我了解到好
的
弱
分类
器是
决策树
桩。我想知道是否支持我只创建两个
决策树
桩(一个用于大小,一个用于重量),或者我是否应该创建更多
的</
浏览 4
提问于2012-08-25
得票数 2
回答已采纳
1
回答
混淆矩阵与
分类
图像
的
不一致性
、
、
、
由于我
的
地理信息系统软件
的
计算能力有限,我试图
在
R
中
实现随机森林,以便进行图像
分类
。我
的
输入是一个多波段TIFF图像,它被训练成一个ArcGIS文件(目标值0和1)。该代码在技术上可以工作,并产生有效
的
输出。然而,当我
在
GIS软件
中
绘制出图像
分类
输出(二值为0和1
的
二值重
分类
tiff )时,它以100%
的
成功率预测了训练数据。换句话说,输出图像没
浏览 6
提问于2019-10-22
得票数 0
回答已采纳
1
回答
如何将Adaboost技术称为集成学习技术?
、
、
我曾读过,
在
集成学习
中
,我们使用各种
分类
器
的
输出来更好地进行预测建模,但在Adaboost
中
,我们只使用一个
分类
器,使它成为一个强大
的
学习者,但它是集成学习
的
一部分。
浏览 0
提问于2019-07-20
得票数 0
1
回答
变量重要性比
决策树
图显示更多
的
变量。
、
、
我用
R
.
中
的
Caret库对我
的
数据安装了一个rpart模型--“离开一个交叉验证”,但是我想了解模型
的
变量重要性和
决策树
图之间
的
区别。怎么可能呢?
为什么
决策树
图没
浏览 6
提问于2021-11-29
得票数 2
回答已采纳
2
回答
如何将单个
分类
器安装在AdaBoost上?
、
、
AdaBoost算法是:我
的
问题是如何训练
分类
器G_m(x),使用权值w_i训练
分类
器意味着什么?它是通过\{w_i,y_i\}_{i=1}^{N}来匹配
分类
器
的
吗?
浏览 0
提问于2021-10-12
得票数 0
2
回答
如果不为每个单独
的
类构建
分类
器,您如何获得所有要预测
的
类
的
概率?
、
、
给定一个
分类
问题,有时我们不仅要预测一个类,还需要返回它是一个类
的
概率。如果不构建新
的
分类
器来预测y=0、y=1、y=2...y=C。因为训练C
分类
器(比方说C=100)可能相当慢。 要做到这一点,可以做些什么?什么
分类
器自然可以很容易地给出所有的概率(我知道
的
一个是使用100个输出节点
的
神经网络)?但是如果我使用传统
的
随机森林,我就无法做到这一点,对
浏览 3
提问于2016-09-28
得票数 1
1
回答
R
程序设计
中
实用机器学习
的
预测模型
请给我一个基本
的
概念,我们可以
在
R
编程中使用哪些不同类型
的
实用机器学习模型,以及每种模型之间很少
的
差异。无论我在哪里找到材料,都是复杂
的
。我只需要一个整体
的
想法。
浏览 4
提问于2016-07-27
得票数 0
回答已采纳
3
回答
文本挖掘
中
的
r
- rpart用于文档
分类
、
、
、
我使用rpart对文件进行
分类
,无论它是属于A类还是b类,我想证明或提供理由,证明或提供该文件被正确或
错误
地
分类
的
依据。我怎么能这么做?请帮帮忙
浏览 0
提问于2015-08-31
得票数 0
1
回答
决策树
分类
器如何在全局约束下工作?
、
、
、
、
我用Python生成了一个使用sklearn
的
决策树
分类
器,该
分类
器
在
准确性方面运行良好。我用线性规划
的
最优解训练
分类
器,它将项目的最优分配返回
给
类,同时考虑全局成本约束(即将项目1分配给A类,代价为x。所有项目和类
的
总结果成本需要小于y值)。
在
使用
分类
器对所有项目进行重新
分类
后,虽然
分类
精度是可以接受
的
,但在大多数
分类
运行过程
浏览 1
提问于2019-01-19
得票数 2
回答已采纳
2
回答
决策树
方法用于数据分析
的
局限性是什么?
、
、
、
据我所知,
决策树
方法用于数据分析
的
主要局限性是:倾向于方差或水平更大
的
预测因子。对于样本容量小
的
响应,预测精度较差。还有其他
的
吗?它们对同质性、正态性、独立性等传统统计假设是否稳健?
浏览 0
提问于2017-12-14
得票数 4
1
回答
RapidMiner模型->输入执行
R
脚本
的
结果
、
、
、
我很抱歉,如果在
错误
的
地方张贴一个问题
的
快速矿工。我只是想试着碰碰运气才能得到答案。
在
端口输入1处传递
的
不兼容数据(
决策树
)。
在
指定端口传递
的</e
浏览 1
提问于2017-04-16
得票数 0
4
回答
决策树
与KNN
、
、
在哪些情况下使用
决策树
更好,而在其他情况下使用KNN更好?有人对此有什么解释或参考吗?
浏览 0
提问于2015-12-05
得票数 17
回答已采纳
1
回答
只有一种情况下生成树叶
的
决策树
、
、
、
、
早些时候,我问过一个关于市场预测分析
的
问题。面向潜在客户
的
营销预测模型(使用熊猫)对此仍有一些怀疑,但我对我为营销数据生成
的
决策树
表示怀疑。我
的
目的是预测一个领先是赢还是输,这取决于他们是如何意识到产品等。我有一个bool变量“韩元”,0销售失败,1-销售。使用
决策树
,我能够生成一个模型,但是,对于导致不获胜
的
情况,没有叶子。这是正常
的
吗?我见过虹膜数据集
的
例子,其中所有三个特性都表示
在
树
中
,因此我
浏览 0
提问于2016-04-28
得票数 3
回答已采纳
1
回答
为什么
决策树
能很好地处理不平衡
的
数据?
、
、
我试验了来自卡格尔
的
欺诈样本。我采取了线性回归和
决策树
。线性回归按预期工作:我们有很高
的
查准率和召回率,而抽样不足会使情况更糟。
为什么
两种模式有这么大
的
区别?
浏览 0
提问于2017-09-07
得票数 1
回答已采纳
1
回答
你能在你
的
最终测试数据
中
重用你
的
火车数据
中
的
观察结果吗?
、
、
对于一个员工群体,我试图根据两年
的
数据来确定员工
中
的
哪些人在未来可能会受伤。
在
大多数机器学习问题中,您尝试根据未观察到
的
数据进行预测,与之不同
的
是,我将处理相同
的
问题,因为您不会在短时间内看到大量
的
员工更替。 我正在使用XGboost实现。
在
整个人群
中
,我
的
标签告诉员工是否受伤。我使用了70%
的
数据作为我
的
训练集,同时测试了其余
的
30%
的
浏览 0
提问于2018-05-25
得票数 2
2
回答
PMML模型
在
不同平台上评分
的
差异
、
、
、
我
在
R
中
构建了一个玩具随机森林模型(使用来自caret包
的
German Credit数据集),并在PMML 4.0
中
导出它,并使用Cascading Pattern库部署到Hadoop上。我遇到了一个问题,Cascading Pattern对相同数据
的
评分(
在
二进制
分类
问题上)与
R
中
的
相同模型不同。
在
200个观察
中
,有2个得到了不同
的
分数。 <e
浏览 6
提问于2014-10-17
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
为什么人类在进化中,把自己的尾巴给弄丢了,故意的还是无意的?
使用Weka在几分钟内建立决策树
集成学习方法bagging,boosting,stacking
风险建模的“利器”(5)梯度提升决策树
从决策树到随机森林
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券