我正在寻找随机森林和XGB‘回归者’如何计算特性重要性。然而,大多数的讨论都集中在分类器上。
我试图在正式文件中找到答案,但有一些问题。
我认为吉尼杂质是分类的标准,所以上面的说明使我感到困惑。
如果有时间能给我一个如何理解这些文件的指导,这将是有帮助的。例如,如何跟踪运行了哪个函数。
谢谢!
发布于 2022-02-16 11:51:33
RandomForestClassifier() clf.fit(df.drop(‘name,axis=1),df'name')
plt.figure(figsize=(10,10)) plt.bar(df.drop('name',axis=1).columns,height=clf.feature_importances_,底部= 0,width=0.8) plt.xticks(rotation=80)
hight_rate_col = df.drop('name',axis=1).columnsclf.feature_importances_ > 0.1 x_train_rate,x_test_rate,y_train_rate,y_test_rate = train_test_split(dfhight_rate_col,df'name')
https://stackoverflow.com/questions/68150153
复制相似问题