如果使用像scikit-learn这样的库,如何将输入中某些特征的更多权重分配给像SVM这样的分类器?这是人们做的事情,还是有其他解决方案来解决我的问题?
发布于 2016-06-26 19:49:26
首先,,你可能不应该这么做。机器学习的整个概念是使用统计分析来分配最优权重。您在这里干扰了整个概念,因此您需要非常有力的证据来证明这是您试图建模的流程的关键,而由于某些原因,您的模型目前缺少它。
话虽如此,但并没有通用的答案。这纯粹是特定于模型的,其中一些将允许你对特征进行加权-在随机森林中,你可以偏向分布,从中采样特征以分析你感兴趣的特征;在SVM中,只要将给定的特征乘以一个常量就足够了-还记得你被告知在SVM中对特征进行归一化吗?这就是为什么-你可以使用特征的尺度来“引导”你的分类器到给定的特征。值高的将被优先考虑。这实际上适用于任何权重正则化模型(正则化逻辑回归、岭回归、套索等)。
发布于 2021-05-28 04:57:57
最好的方法是:假设你有f1,2,..N,并且特定特征的权重是w_f0.12,0.14...N。首先,你需要通过任何特征缩放方法对特征进行归一化,然后你还需要将特征的权重w_f归一化到0-1范围,然后将归一化后的权重乘以f1,2,..N和新的转换后的特征。请记住,您还需要将其转换为测试数据。
现在,您可以检查两种模型的性能:不引入功能和引入功能。
https://stackoverflow.com/questions/38034702
复制相似问题