腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
我应该使用
决策树
或逻辑回归来进行分类吗?
、
、
我有一个包含相同数量的分类变量和
连续
变量的数据集。如何在
决策树
和逻辑回归之间决定使用哪种技术? 假设logistic回归更适合
连续
变量,
决策树
更适合
连续
变量和范畴变量,这是否正确?
浏览 0
提问于2015-06-09
得票数 17
回答已采纳
2
回答
为什么
连续
特征在
决策树
模型中比分类特征更重要?
、
、
、
、
我的预测模型中既有分类特征,也有
连续
特征,我希望选择(和排序)最重要的特征。 我使用一个热编码将所有的分类变量转换为虚拟变量(为了更好地解释我的logistic回归模型)。通过这种方式,我将分类变量和
连续
变量都视为最重要的特性。另一方面,当我想使用
决策树
模型(SelectFromModel)对特征进行排序时,他们总是先给
连续
的特征排序(feature_importances_),然后给出分类(虚拟)变量。虽然
决策树
模型的性能远高于Logistic回归的性能(约15%),但我想知道哪些特征排序(
决策
浏览 0
提问于2020-01-15
得票数 9
回答已采纳
1
回答
连续
数据
决策树
阈值的求取方法
、
、
我在Weka中使用
决策树
,我有一些
连续
的数据,所以当我使用Weka时,它会自动为我找到阈值,但是出于某种原因,我想自己实现
决策树
,所以我需要知道用什么方法来找到阈值来离散我的
连续
数据?
浏览 6
提问于2015-11-03
得票数 2
回答已采纳
4
回答
决策树
的缺点
我在博客中看到
决策树
有以下缺点:如果这是真的那为什么?
浏览 0
提问于2018-05-10
得票数 1
1
回答
在sklearn.tree.DecisionTreeClassifier中处理
连续
变量
、
、
、
、
我很好奇sklearn如何处理sklearn.tree.DecisionTreeClassifier中的
连续
变量?我尝试使用一些
连续
变量,而不需要对DecisionTreeClassifier进行预处理,但是它的精度是可以接受的。 下面是一种将
连续
变量转化为范畴变量的方法,但不能获得相同的精度。
浏览 2
提问于2019-12-08
得票数 1
回答已采纳
1
回答
如何计算
决策树
的AUC?
、
假设我有一个只有一个
连续
变量的数据集,我尝试使用
决策树
算法来构建一个模型,该模型从数据集中对+ve和-ve标签进行分类。我运行10折交叉验证。谢谢!
浏览 5
提问于2014-03-12
得票数 1
1
回答
如何使用R处理“rpart”
决策树
中的
连续
变量和离散变量?
、
、
、
我正在使用R中的包rpart创建一些
决策树
,我的数据集中有一些离散变量,如年龄、no.of.children。但是最终的
决策树
有这些变量n个小数。这意味着,它被认为是
连续
变量。如何避免这种情况,以及如何在
决策树
中将这些变量作为离散变量?
浏览 1
提问于2013-03-11
得票数 3
2
回答
在不使用分析服务的情况下,将具有离散和
连续
数据值的一组数据划分为两组之一?
、
、
、
假设我有一个具有以下方案的表(注意:这个示例是假设的,尽管实际用例类似)。=====================================================================================GeoCoord | Location | Lattitude and longitude coordinates string | FullName
浏览 1
提问于2010-07-21
得票数 1
回答已采纳
1
回答
连续
目标变量的
决策树
我正在尝试构建一个
决策树
,其中我在r.which
决策树
中混合了自变量和
连续
因变量,我可以应用吗?我不想使用购物车,因为我想要2个以上的分割。
浏览 7
提问于2015-08-20
得票数 0
1
回答
理解用于机器学习的梯度提升的基本思想
、
、
、
我们可以通过
连续
创建大量
决策树
来使模型变得更加复杂。每个
决策树
都建立在彼此的基础上。每个新树的目标是修复以前树中错误最多的错误。如果我们有3000棵
决策树
,这意味着错误被最小化了3000倍。
浏览 3
提问于2018-04-30
得票数 0
1
回答
SAS购物车分析
、
、
、
、
要开始使用
决策树
,我希望SAS从包含一个依赖的二元变量(疾病0/1)和几个独立的
连续
变量(通常我会对这些数据运行逻辑回归)的数据集生成
决策树
。树应该“决定”哪些变量是疾病的重要风险因素。对于初学者在
决策树
中,但相当有经验的SAS用户(没有访问SAS企业矿工)有任何提示吗?
浏览 2
提问于2016-02-12
得票数 0
2
回答
滑雪
决策树
中分类自变量的处理
、
、
我使用一位编码器将我所有的分类自变量从字符串转换为数字(二进制1和0),但是当我运行
决策树
时,算法认为二进制分类变量是
连续
的。如何将此数字
连续
转换为数字范畴?
浏览 3
提问于2020-02-04
得票数 2
2
回答
决策树
方法用于数据分析的局限性是什么?
、
、
、
据我所知,
决策树
方法用于数据分析的主要局限性是:倾向于方差或水平更大的预测因子。对于样本容量小的响应,预测精度较差。
浏览 0
提问于2017-12-14
得票数 4
1
回答
随机森林:对于一系列值(不是二进制阈值)中的特性,它的效率如何?
每个特性只在一个
决策树
中使用一次,这是正确的吗?然后,如果一个特征(对分类最具决定性意义)决定了一个值范围的分类,该算法能以任何方式检测到这一点,或者它会失败吗?
浏览 0
提问于2020-11-24
得票数 1
回答已采纳
1
回答
在使用类似分类器的
决策树
之前,我们应该把独立的
连续
变量(特征)转换成分类变量吗?
、
、
、
、
我试图预测态度的
决策树
分类器。当树深为15时,我得到了>90%的精度。由于树是在
连续
变量(如年龄、收入和高度)上一次又一次地除以得到纯类别的叶子。是否应该将
连续
变量转换为范畴变量(如范围类)?
浏览 0
提问于2016-07-10
得票数 1
回答已采纳
1
回答
决策树
是使用离散输入还是
连续
输入?
、
、
、
、
我有两个数据集,一个
连续
数据集(75个数据点和14个变量)和一个离散数据集,该数据集是通过将
连续
数据集放入桶中生成的。我已经构建了一个
决策树
分类器(使用python sklearn包),该分类器对于离散数据集比
连续
数据集要好得多。 我还在几篇论文中读到,有时最好使用离散数据集。但我不知道为什么。
浏览 0
提问于2017-09-01
得票数 4
1
回答
有
决策树
的Adaboost (自适应增强)方法的例子是什么?
、
、
、
有什么好的教程可以解释如何在为样本训练集构建
决策树
的
连续
迭代过程中对样本进行加权?我想明确地说,在构建第一个
决策树
之后,如何分配权重。
决策树
是使用信息增益作为锚来设计的,我想知道这是如何由于先前迭代中的错误分类而受到影响的。 任何好的教程/例子都是非常感谢的。
浏览 2
提问于2014-09-21
得票数 3
回答已采纳
1
回答
如何在C4.5
决策树
中确定属性是否是
连续
的
、
、
如何确定属性在实现中是否是
连续
的?
浏览 2
提问于2015-07-22
得票数 0
回答已采纳
1
回答
二值
连续
输入R中的
决策树
、
、
、
我们正在用
连续
输入和二进制输入建立
决策树
的模型。我们正在分析天气对自行车行为的影响。线性回归表明“雨”对自行车数量有很大的影响。我们的雨变量是二进制,表示每小时下雨的状态。使用rpart创建
决策树
并不包括作为节点的“雨”,尽管我们期望它对自行车的数量有很大的决定性作用。这可能是由于雨变量的分类所致。Rpart似乎更喜欢使用
连续
变量(如温度)作为决策节点。对于rpart如何决定是否使用
连续
变量或二进制变量作为决策节点,我们应该知道什么?有可能控制这种变量的选择吗?
浏览 3
提问于2015-12-04
得票数 0
2
回答
决策树
分类器是否适用于这里?
、
、
从需要从前三天的股票价格预测今天的股价的情况:您能使用
决策树
分类器来完成此任务吗?为什么或者为什么不?
浏览 0
提问于2018-10-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
决策树
用手机学JAVA编程——第8课:轻松计算连续整数之和
决策树算法及应用
简单谈谈决策树DT
决策树/DT
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券