问特征选择，是否有可能将包装和嵌入式方法结合起来？
EN

Data Science用户

提问于 2019-09-01 09:38:02

回答 1查看 359关注 0票数 0

我用神经网络预测PM10浓度(一个回归问题)。由于包装方法依赖于模型，因此通过对数据集中所有特征进行优化的神经网络模型将不能正常工作(因为包装器每次减少数据集中的特征，就必须重新调整神经网络的隐层大小)。

所以我的问题是，我可以使用嵌入方法(Lasso)作为包装方法中的估计量吗？

这是我要问的特性选择部分：

from mlxtend.feature_selection import SequentialFeatureSelector

feature_selector = SequentialFeatureSelector(LassoCV(),
           k_features=3,
           forward=True,
           verbose=0,
           scoring='neg_mean_absolute_error',
           cv=0)
features = feature_selector.fit(X, y)
filtered_features= cols[list(features.k_feature_idx_)]
print(filtered_features)

我是数据科学和机器学习的新手，所以我想知道这是对是错。

machine-learning

python

regression

feature-selection

回答 1

Data Science用户

回答已采纳

发布于 2019-09-03 19:20:44

我可以用Lasso作为“包装器”特征选择方法中的估计量吗？

这当然会起作用，但是套索的嵌入式功能选择不太可能在你的例子中真正发挥作用。前向顺序特征选择为每个要添加到所选特征集的候选特征建立模型，从没有特征开始。当你只建立三个特征时，拉索的特征选择会产生影响的唯一方法是，当它确定应该保留少于三个变量时，或者如果它以某种方式决定已经选择的特征之一的系数为零。后者将是非常令人惊讶的，前者只有在数据非常简单的情况下才有意义(只有两个变量对预测有任何重要贡献)。

因此，在这里，拉索很可能只是作为正则化，收缩系数，但很可能没有零位它们中的任何一个。

如何对神经网络进行特征选择？

因为Lasso是一个假设特征独立的线性模型，您可能会妨碍网络查找和使用非线性关系或特征交互的能力。

我怀疑这里没有“正确”的答案(没有免费午餐之类的东西)。不过，这里有一些想法。

不要进行特征选择。依靠神经网络，也许是用重正则化的方法(辍学、L1惩罚，尤其是第一层)来确定什么是重要的。
在包装器内进行超参数调优。这是非常昂贵的计算，但可能是最具表现力的方法，并可能是可行的小网。
修复包装器内的体系结构。您说“每次包装器减少数据集中的特性时，必须重新调整神经网络的隐藏层大小”，但这可能不是问题。通常情况下，如果一个网络的神经元数量超过了它所需要的数量，那么有几个网络可能会学习到几乎相同的特性。(您可以尝试将其转换为(2)的折衷版本，方法是应用一些网络剪枝，而不是完全的超参数调优。)
在包装器中使用另一个模型:一个可以捕获非线性和特征交互的模型，而不是线性模型，比如基于树的模型。这可能仍然不能将重要性归因于网络将获得的特性，但它应该比线性模型更接近。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/58509

复制

rabbitmq消息队列——"发布订阅"

rabbitmq 存储缓存

三、”发布订阅” 上一节的练习中我们创建了一个工作队列。队列中的每条消息都会被发送至一个工作进程。这节，我们将做些完全不同的事情——我们将发送单个消息发送至多个消费者。这种模式就是广为人知的“发布订阅

用户1141560

2017/12/26

9840