首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在提振的背景下,“夸张”意味着什么?

在提振的背景下,“夸张”意味着什么?
EN

Data Science用户
提问于 2019-05-08 20:00:26
回答 1查看 165关注 0票数 3

我正在学习助推,机器学习集成元算法.教授将三个弱分类器组合成一个整体,并说在这个时间点之前,它是很容易理解的。取一个数据集,训练一个简单的模型,找出最小的错误率,如下所示。这种思想很容易实现,例如,梯度下降会使logistic回归到最小的错误率。然后,教授夸大其词地讨论了数据分类器的错误。

我的问题是:这是什么意思?有人可以根据Python或R中的开放数据集提供此操作的示例吗?

EN

回答 1

Data Science用户

发布于 2019-05-10 07:38:25

不确定,但“夸张”可能是谈论“过度适应”的另一种方式。

提升是顺序模型:每次构建新树时,它都会使用前面树的结果,并将重点放在残差上(在这种情况下,先例树表现不佳)。为此,该模型增加了先例错误的权重。

如果你建了太多的树,最后的树就会学到噪音,因为残差会比信息包含更多的噪音。对于您的列车数据集,您将有一个极好的错误率(“夸大错误率”),但是如果您将模型应用于新的数据集,则错误将更低。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/51646

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档