我想在文本挖掘的特征上使用KNN,同时对我的其余特征使用另一种回归。有没有可能以某种方式组合两个回归模型来预测单个标签?我应该把我的数据集分成两个不同的吗?
我目前正在使用pandas和sklearn。
发布于 2019-05-17 19:18:17
您完全可以使用Ensemble模型来做到这一点。
集成模型将来自各种模型的决策组合在一起,以提高整体性能。对于回归问题,我建议使用以下集成模型/技术:
平均
是一种相当简单的集成技术,您需要从所有模型中取预测的平均值,并使用它来进行最终预测。
加权平均
这类似于简单的平均,但是现在所有的模型都被分配了不同的权重,定义了每个模型在最终预测中的重要性/贡献。
打包元估计器
是一种可以在分类(BaggingClassifier
)和回归(BaggingRegressor
)中使用的集成技术。打包meta-estimator执行以下步骤以达到最终预测:
下面是一个使用sklearn
的BaggingRegressor
的非常简单的示例
from sklearn.ensemble import BaggingRegressor
ensemble_model = BaggingRegressor(tree.DecisionTreeRegressor(random_state=1))
ensemble_model.fit(X_train, Y_train)
ensemble_model.score(X_test,Y_test)
https://stackoverflow.com/questions/56192128
复制