Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >pandas中的相关矩阵不考虑某些列

pandas中的相关矩阵不考虑某些列
EN

Stack Overflow用户
提问于 2021-04-25 10:01:21
回答 2查看 173关注 0票数 1

我正在使用一个包含39个属性(38个独立特征+类属性)的数据集处理一个分类问题。当我尝试计算相关矩阵时,没有考虑class属性。据我所知,它也应该包括在矩阵中。

代码语言:javascript
运行
AI代码解释
复制
len(heartdata.columns)
39

由于我的数据帧中的列数是39,因此相关矩阵的形状应该是(39,39),但我得到的结果是:

代码语言:javascript
运行
AI代码解释
复制
cor = heartdata.corr()
cor.shape
(38, 38)
EN

回答 2

Stack Overflow用户

发布于 2021-04-25 10:23:15

我的class属性有一个分类类型,这就是corr()函数没有考虑它的原因。一个简单的代码就解决了这个问题。

代码语言:javascript
运行
AI代码解释
复制
le = LabelEncoder()
heartdata['class'] = le.fit_transform(heartdata['class'])
票数 1
EN

Stack Overflow用户

发布于 2021-04-25 10:33:33

如果您的要素是分类要素,则应使用LabelEncoding

代码语言:javascript
运行
AI代码解释
复制
from sklearn.preprocessing import LabelEncoder

train = train_df   
label_encoder = LabelEncoder()

for i in range(len(train.columns)):
    column = train_df.columns[i]
    train[column] = label_encoder.fit_transform(train_df[column])
    print(f"train {column} uniques: {len(train[column].unique())} ")

x = train
y = train_df['gender'].to_frame(name='gender')

然后你就可以得到Correlation Matrix

代码语言:javascript
运行
AI代码解释
复制
cor = x.corr()
print(cor)

如果您希望使用plot来显示特征之间的相关性,我建议使用heatmap plot:

代码语言:javascript
运行
AI代码解释
复制
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(10,8),linewidth=10,edgecolor="#04253a" )
sns.heatmap(cor, annot=True, cmap=plt.cm.Reds)
plt.show()

输出

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67252076

复制
相关文章
Python-科学计算-pandas-17-对某些列或行运算
系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2
zishendianxia
2020/11/13
2.2K0
Python-科学计算-pandas-17-对某些列或行运算
pandas’_pandas 删除列
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/10/02
2.7K0
pandas’_pandas 删除列
yml中某些配置不生效的解决方案
最近突然想不开,将springboot项目的properties配置文件改为yml,改完之后redis死活连不上了。
小尘哥
2018/08/15
1.4K0
【Python】基于某些列删除数据框中的重复值
Python按照某些列去重,可用drop_duplicates函数轻松处理。本文致力用简洁的语言介绍该函数。
阿黎逸阳
2020/09/08
21.7K0
【Python】基于某些列删除数据框中的重复值
Pandas 查找,丢弃列值唯一的列
数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如:已支付,已支付,已支付…
萝 卜
2022/05/12
6.2K0
Pandas 查找,丢弃列值唯一的列
pandas中的loc和iloc_pandas获取指定数据的行和列
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/178799.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/27
11.3K0
pandas中的loc和iloc_pandas获取指定数据的行和列
对比Excel,Python pandas删除数据框架中的列
删除列也是Excel中的常用操作之一,可以通过功能区或者快捷菜单中的命令或者快捷键来实现。上一篇文章,我们讲解了Python pandas删除数据框架中行的一些方法,删除列与之类似。然而,这里想介绍一些新方法。取决于实际情况,正确地使用一种方法可能比另一种更好。
fanjy
2022/04/13
7.7K0
对比Excel,Python pandas删除数据框架中的列
在Pandas中更改列的数据类型【方法总结】
有什么方法可以将列转换为适当的类型?例如,上面的例子,如何将列2和3转为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每列的类型?理想情况下,希望以动态的方式做到这一点,因为可以有数百个列,明确指定哪些列是哪种类型太麻烦。可以假定每列都包含相同类型的值。
kirin
2021/04/19
21.2K0
在Pandas中更改列的数据类型【方法总结】
pandas基础:重命名pandas数据框架列
重命名pandas数据框架列有很多原因。例如,可能希望列名更具描述性,或者可能希望缩短名称。本文将介绍如何更改数据框架中的名称。
fanjy
2022/11/16
2K0
pandas基础:重命名pandas数据框架列
通过pandas读取列的数据怎么把一列中的负数全部转为正数?
前几天在Python最强王者群【wen】问了一个pandas数据处理的问题,一起来看看吧。
前端皮皮
2023/08/17
6910
通过pandas读取列的数据怎么把一列中的负数全部转为正数?
正则表达式:匹配不包含某些字符和不包含某些字符串的写法「建议收藏」
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/155140.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/06
6.5K0
Pandas | 如何新增数据列?
在数据分析时,原始数据往往不能满足我们的需求,经常需要按照一定条件创建新的数据列或者修改原有数据列,然后进行后续分析。
生信real
2022/12/20
2.2K0
Pandas中求某一列中每个列表的平均值
前几天在Python最强王者交流群【冫马讠成】问了一道Pandas处理的问题,如下图所示。
前端皮皮
2022/08/17
5.2K0
Pandas中求某一列中每个列表的平均值
Pandas基础:在Pandas数据框架中移动列
有时候,我们需要在pandas数据框架内移动一列,shift()方法提供了一种方便的方法来实现。
fanjy
2022/06/04
3.3K0
Pandas基础:在Pandas数据框架中移动列
Pandas基础:列方向分组变形
但是我发现大部分人在做这个题的时候,代码写的异常复杂。所以我建议你也不要直接看我的代码,而是先思考一下,你会怎么解决这个问题。
朱小五
2021/02/22
1.4K0
Pandas基础:列方向分组变形
pandas操作一列数据
def tt(x): if x.name == "distribution": return [el[0:10] for el in x.values] else: return x test1 = test.apply(tt)
用户1733462
2018/12/05
2K0
用过Excel,就会获取pandas数据框架中的值、行和列
至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。
fanjy
2021/11/29
20.4K0
用过Excel,就会获取pandas数据框架中的值、行和列
Python+Pandas逐行处理DataFrame中的某列数据(无循环)
创建一个包含10行6列随机数的DataFrame,行标签从大写字母A开始,列标签从小写字母u开始。然后从上向下遍历,如果某行u列的值比上一行u列的值大,就把该行x列的值改为上一行x列的值加1,否则保持原来的值不变。
Python小屋屋主
2023/08/29
1K0
Python+Pandas逐行处理DataFrame中的某列数据(无循环)
点击加载更多

相似问题

在python pandas中减去相关矩阵的列

11

Pandas相关矩阵未合并csv文件中的所有列

115

Python Pandas相关矩阵

15

Pandas相关矩阵迭代

110

Pandas表示某些列

4115
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档