腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
一列
的
唯一
值
分离
树
回归
模型
、
、
我有一个20,000,000行
的
数据集。每行有30列。每一行都包含一个单位成本
值
,我希望使用除单位成本之外
的
所有列来预测该
值
。我想要构建一个
唯一
的
决策
树
或决策
树
的
一个
唯一
分支来为每个产品编号建模。 基本上,对每个Product Number
的
行进行分区,并对每个Product Number进行隔离建模。如
浏览 9
提问于2016-08-14
得票数 0
3
回答
决策
树
性能
、
什么时候决策
树
表现良好?我绘制了一些图表,比较了
基于
决策
树
的
模型
和
基于
logistic
回归
的
模型
。决策
树
建立
模型
所需
的
时间较长,而LRclassifier
模型
的
time.Moreover较小,logistic
模型
的
f-score高于决策
树
。所以我想知道什么时候应该使用决策
树
。
浏览 2
提问于2017-09-22
得票数 1
2
回答
在
基于
树
的
模型
中,具有较少变化
的
特征意味着什么?
、
、
、
我正在训练一个
基于
树
的
模型
(例如xgb)。我有一些功能,超过90%
的
值
常数。由于数据
的
变化最小,它是否为
模型
增加了价值?如果我使用线性
回归
模型
,同样
的
影响会是什么?
浏览 0
提问于2022-07-28
得票数 0
回答已采纳
1
回答
在mlr中融合学习者和预处理-使用什么设置?
、
、
、
我正在进行一个基准分析,比较不同
的
学习者(logistic
回归
,梯度提升,随机森林,极端梯度提升)与mlr软件包。然而,我不确定设置。据我正确理解,对于logistic
回归
,我应该用中位数(或平均值)来推断失语,但是对于
基于
树
的
模型
,例如有很大价值<em
浏览 0
提问于2018-10-21
得票数 0
1
回答
有可能提取经过训练
的
ML
模型
的
数学表达式吗?
、
、
、
在Python & R中,线性
回归
模型
在学习训练数据后给出了数学表达式,通常以截距、变量系数和p
值
/t
值
的
形式表示。在训练数据集上对复杂
模型
进行训练后,可以提取
基于
决策
树
、随机森林、XGBoost等复杂
模型
的
数学表示吗?
浏览 0
提问于2022-11-11
得票数 1
1
回答
从sklearn
的
DecisionTreeRegressor
回归
预测是一个简单
的
平均数吗?
、
、
、
、
我正在努力弄清楚决策
树
回归
预测是如何生成
的
。在我所介绍
的
文档中并没有详细解释。 对于分类
模型
,将返回X中每个样本
的
预测类。对于
回归
模型
,返回
基于
X
的
预测
值
。那么,预测是根据新
的
X
值
落入
的
叶节点
的
输出
的
简单平均值,还是以另一种方式进行
的
?
浏览 1
提问于2019-04-02
得票数 1
回答已采纳
1
回答
catboost
回归
/catboost
回归
的
销售预测误差
、
、
、
、
BELT'],df = pd.DataFrame(data=d)第五季
的
期望产量我
的
问题是:如果输入5,6,7,8,我
的
预测
值
不会改变,但是季节是一个连续
值
。我做错了什么,如何预测第六、第七、第八季等等。
浏览 9
提问于2021-02-18
得票数 0
回答已采纳
1
回答
机器学习
的
替代
回归
模型
算法
、
我正在寻找不那么知名
的
回归
模型
,如果可能的话,寻找一个实现它
的
python库。广义线性
模型
,线性,拉索,岭.
基于
决策
树
的
模型
:购物车,随机森林,梯度提升决策
树
(xgb,lightgbm,catboost)Knn
回归
是否有较少人知道
的
回归
算法?我正在寻找替代模式,以增加我
的
箭袋。
浏览 0
提问于2020-07-23
得票数 1
2
回答
线性
回归
与随机森林性能精度
、
如果数据集包含一些特征,其中一些是分类变量,另一些是连续变量,则决策
树
比线性
回归
更好,因为
树
可以根据分类变量准确地划分数据。是否存在线性
回归
优于随机森林
的
情况?
浏览 2
提问于2018-06-26
得票数 3
4
回答
如何在Python中可视化
回归
树
、
、
、
、
我希望可视化一个
回归
树
构建使用任何集成方法在科学学习(梯度提升
回归
,随机森林
回归
,打包
回归
)。靠近,处理分类器
树
。但是,这些问题需要“
树
”方法,这是SKLearn中
的
回归
模型
所不能使用
的
。我遇到了问题,因为这些
树
的
回归
版本没有.tree方法(该方法只存在于分类版本)。我想要一个类似于
的
输出,但是
基于
一个sci工
浏览 4
提问于2017-11-09
得票数 2
回答已采纳
1
回答
是否有办法找到每个预测
的
特征重要性?
、
、
、
clf.fit(X_train, y_train)将给出适合于训练数据集
的
分类器
的
特征重要性但是,我如何使用这个经过训练
的
模型
来给出一个类似的重要
值
,当对每一行看不见
的
数据进行预测时。例如,让 那么,是否有一种方法可以获得每个列
的
重要性,这是特定于这个特定
浏览 2
提问于2021-02-28
得票数 0
1
回答
如何在sklearn
的
拟合函数中选择要优化
的
指标?
、
、
、
在训练支持向量机时,有没有办法在sklearn中做同样
的
事情?假设我想让我
的
分类器只优化灵敏度(不管它
的
感觉如何),我该怎么做呢?
浏览 17
提问于2019-12-09
得票数 0
回答已采纳
1
回答
我能用机器学习
模型
作为优化问题
的
目标函数吗?
、
、
、
、
我有一个数据集,我使用Sklearn决策
树
回归
机器学习包为预测目的建立一个
模型
。随后,我试图利用scipy.optimize包来解决
基于
给定约束
的
最小解。但是,我不确定是否可以将决策
树
模型
作为优化问题
的
目标函数。在这种情况下,应该采取什么办法呢?我曾经尝试过线性
回归
模型
,比如LarsCV,它们工作得很好。但是在线性
回归
模型
中,基本上可以从
模型
中提取系数和截获点。
浏览 1
提问于2019-02-22
得票数 7
1
回答
如何在sklearn
的
HistGradientBoostingClassifier中构造直方图来确定最佳分割点
、
lightgbm和sklearn
的
HistGradientBoostingClassifier估计器都使用直方图来决定连续特征
的
最佳拆分。有没有可能直观地(或用一些例子)解释直方图
的
创建过程,以及它如何帮助在节点上更快地确定分割点。 我在互联网上广泛地寻找了答案,但找不到任何简单或直观
的
方法来构建直方图。
浏览 92
提问于2020-10-23
得票数 0
1
回答
如何在多类分类中找到每个类
的
特征重要性
、
、
、
、
我编写了代码来查找整个数据集中
的
每个特性对于多类分类
的
重要性。现在,我希望找到多类分类中每个类
的
特性重要性,也就是说,我希望找到对于分类更重要
的
特性列表(每个类)。plt.xticks(rotation=90)plt.show()我读了一篇题为“”
的
报纸;引用: 在评估部分,我们首先从数据集中提取出80个流量特征,并利用RandomForestRegressor算法确定最佳
浏览 5
提问于2022-04-28
得票数 -2
1
回答
在验证
模型
之后,如何根据给定
的
输出提取最优输入?
、
、
我环顾四周,找不到类似的问题(至少我用
的
关键词不是这样)。在我训练和测试了一个分类
模型
之后,我明白了如何为它提供一个新
的
输入来生成一个预测
的
输出。但是我如何做反向任务--为它提供一个输出,并提取最佳或最佳
的
输入参数?(即预测会产生给定输出
的
输出)?
浏览 0
提问于2022-08-13
得票数 0
1
回答
XGBoost best max_depth=1
我使用xgboost来训练分类
模型
。GridCVSearch提供了最好
的
max_depth=1,这意味着我
的
成百上千
的
树
在一个节点上被分割。这是否意味着我处理
的
问题/数据集可以使用简单
的
模型
来
分离
,并且我不需要使用复杂
的
模型
,如xgboost?一般来说,如果所有
树
的
深度都为1,那么xgboost是否比SVM/logistic
回归</em
浏览 76
提问于2019-02-28
得票数 2
1
回答
回归
决策
树
-规范化或分割成连续特征
、
、
、
我
的
数据集中有一个名为distances
的
特性,其范围从200到12000 (或多或少)。由于其他特性
的
值
都低于50,所以我需要在distances中进行一些转换。我想到
的
第一件事是将它正常化,例如,将这个特性保持在0到10之间。但是,用这种方法,我可能有很多不同
的
价值,这可能会产生太多
的
分裂。 我考虑
的
另一种方法是确定范围。应以组
的
范围为常数,或至少将范围与分配
的
单位之间
的
关系联系起来。=>
浏览 0
提问于2018-07-07
得票数 1
1
回答
partykit:我如何使用偏移量?
、
、
、
我试图预测一个结果
的
频率,我有很多数据。我已经安装了一个glm
的
数据,现在我试图使用ctree来理解任何复杂
的
交互数据集中,我可能错过了。我没有直接预测残差,而是尝试将ctree
模型
与glm预测相抵消。但是,当我:(a)根本不使用偏移量,(b)在函数中指定偏移量,以及(c)在ctree方程中使用偏移量时,我似乎得到了相同
的
结果。我创建了一些虚拟数据来模拟我正在做
的
事情:set.seed(15) #
浏览 4
提问于2019-07-15
得票数 2
回答已采纳
2
回答
如何将大量
的
分类数据从字符串自动转换为数值?
、
、
我正在尝试建立一个决策
树
回归
来预测汽车
的
MSRP (制造商建议零售价)
的
值
。但是,我在将分类
值
转换为数值时遇到了问题。我
的
问题是:我有8列分类特征,有些列有多达40种不同类型
的
唯一
值
和20,000个实例。我应该使用什么方法来转换分类数据以用于决策
树
回归
?有没有办法自动输入
唯一
的
值
,而不是手动输入?我尝试使用LabelEncode
浏览 1
提问于2019-01-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【Excel】提取一列中的唯一值函数
基于树的机器学习模型的演化
大数据中填充缺失值很有效的树模型算法,MissForest算法
基于贝叶斯推断的回归模型 机器学习你会遇到的“坑”
CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券