在这种情况下,我们的预计值为连续变量。
决策树相关的重要术语
让我们看看使用决策树的基本术语:
1.根节点:它代表总体或样本,这进一步被分成两个或两个以上的均匀集。...2.不适合连续变量:在处理连续数值变量时,决策树在对不同类别变量进行分类时失去信息。
2.回归树vs分类树
我们都知道,终端节点(或树叶)位于决策树的底部。...⑤这两种树模型都遵循的自上而下的贪婪的方法称为递归二分分裂。我们之所以叫它为“自上而下”,是因为当所有的观察值都在单个区域时它先从树的顶端开始,然后向下将预测空间分为两个分支。...例如:我们可以告诉该算法一旦观察每个节点的数量少于50就停止。
⑦在这两种情况下,分裂过程达到停止标准后就会构建出一个成年树。但是,成年树可能会过度适应数据,导致对未知数据的低准确性。...以上X指的是值,X是实际得值,n是值的数量。
方差的计算方法:
①为每个节点计算方差。
②为每个节点方差做加权平均。
例子:——让我们分配数值1为打板球和0为不玩板球。