我目前正在与我的数据在潘达斯(新的)。我有一个3列dataframe : Categorical_data1,Categorical_data2,Output。(2400行x3列)。
分类数据(输入)都是字符串,输出取决于输入。
Categorical_data1 =‘type6 1’,‘type6 2’,.,'type6‘Categorical_data2 = 'rain1','rain2','rain3','rain4’
所以有24对可能的分类数据。
我想要绘制一个热图(例如,使用海运),在关于分类数据对(Cat_data1,Cat_data2)的输出中绘制0的数量。我用布尔值做了几件事。
我试着想出如何计算0的精确数值。
count = ((df['Output'] == 0) & (df(['Categorical_Data1'] == 'type1') & (df(['Categorical_Data2'] == 'rain1')))).sum()
但失败了。输出属于0,1,大量为0(约1200,超过2400)。我的目标是通过jcdoming拥有类似Source的东西(我不能上传图片.)使用月份=范畴Data1,年份=范畴Data2;以及0的输出数)。
谢谢你的帮助。
发布于 2022-04-27 07:45:14
使用海运计数图。它给出某一特征中出现的分类数据的计数。使用hue将第二个特性添加到可视化中:
import seaborn as sns
sns.countplot(data=dataframe, x='Categorical_Data1', hue='Categorical_Data2')
https://stackoverflow.com/questions/72031352
复制