首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于相关矩阵的特征选择

基于相关矩阵的特征选择
EN

Stack Overflow用户
提问于 2018-06-19 18:37:11
回答 1查看 1.5K关注 0票数 0

在测试Logistic回归、高斯朴素贝叶斯、随机森林和多层感知器等不同算法时,我只是简单地减去平均值,然后除以一个标准差来规范原始数据。并不是所有的人都有这个必要,但我只是想保持一致。但是特征的相关矩阵在归一化前后会发生变化。在决定选择哪些特征以避免输入数据中的冗余时,应该同时考虑相关矩阵还是只考虑规范化后的相关矩阵,因为这是直接提供给机器学习方法的数据?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-19 18:48:12

我认为相关矩阵在“适当”正常化之后应该保持不变。

演示:

代码语言:javascript
运行
复制
In [107]: df = pd.DataFrame(np.random.rand(6,6)) * 100

让我们在归一化之前保存Pearson相关矩阵

代码语言:javascript
运行
复制
In [108]: corr1 = df.corr()

使用sklearn.preprocessing.StandardScaler的规范化

代码语言:javascript
运行
复制
In [109]: from sklearn.preprocessing import StandardScaler

In [110]: scale = StandardScaler()

In [111]: r = scale.fit_transform(df)

归一化后保存Pearson相关矩阵

代码语言:javascript
运行
复制
In [112]: corr2 = pd.DataFrame(r).corr()

比较保存的相关矩阵:

代码语言:javascript
运行
复制
In [114]: np.allclose(corr1, corr2)
Out[114]: True
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50934956

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档