从sklearn SelectKBest获取实际所选要素的步骤如下:
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_regression
k = 5 # 选择的要素数量
selector = SelectKBest(score_func=f_regression, k=k)
在这个例子中,我们使用f_regression作为评分函数,它适用于回归问题。对于分类问题,可以选择其他适当的评分函数。
X_new = selector.fit_transform(X, y)
这一步会计算每个特征的得分,并选择得分最高的k个特征。
selected_features = selector.get_support(indices=True)
这将返回一个包含所选要素索引的数组。
for i, feature_idx in enumerate(selected_features):
print("Feature {}: {}".format(i+1, X.columns[feature_idx]))
假设特征矩阵X是一个DataFrame,可以使用X.columns[feature_idx]来获取特征的名称。
这样,我们就可以从sklearn SelectKBest获取实际所选要素。根据具体的应用场景和需求,可以进一步使用这些要素进行建模和分析。
推荐的腾讯云相关产品:腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)提供了丰富的机器学习和数据分析工具,可以帮助用户进行特征选择和模型训练。
领取专属 10元无门槛券
手把手带您无忧上云