p=13546
----
变量重要性图是查看模型中哪些变量有趣的好工具。由于我们通常在随机森林中使用它,因此它看起来非常适合非常大的数据集。...例如,具有两个高度相关变量的重要性函数为
看起来 比其他两个
要 重要得多,但事实并非如此。只是模型无法在
和 之间选择
:有时会
被选择,有时会被选择
。...实际上,我想到的是当我们考虑逐步过程时以及从集合中删除每个变量时得到的结果,
apply(IMP,1,mean)}
在这里,如果我们使用与以前相同的代码,
我们得到以下图
plot(C,VI[2,],type...="l",col="red")lines(C,VI2[3,],col="blue")lines(C,VI2[4,],col="purple")
删除时会显示紫线
:这是最差的模型。...关联度接近1时,与具有相同
,并且与蓝线相同。
然而,当我们拥有很多相关特征时,讨论特征的重要性并不是那么直观。