发布于 2019-05-10 07:38:25
不确定,但“夸张”可能是谈论“过度适应”的另一种方式。
提升是顺序模型:每次构建新树时,它都会使用前面树的结果,并将重点放在残差上(在这种情况下,先例树表现不佳)。为此,该模型增加了先例错误的权重。
如果你建了太多的树,最后的树就会学到噪音,因为残差会比信息包含更多的噪音。对于您的列车数据集,您将有一个极好的错误率(“夸大错误率”),但是如果您将模型应用于新的数据集,则错误将更低。
https://datascience.stackexchange.com/questions/51646
复制相似问题