上期推文推出第一篇基础图表绘制-R-ggplot2 基础图表绘制-散点图 的绘制推文,得到了很多小伙伴的喜欢,也是我更加想使这个系列做的更加完善和系统,我之前也有说过,会推出Python和R的两个版本绘制教程,接下来我们就推出基础散点图的Python绘制版本。本期主要涉及的知识点如下:
由于涉及的图表类型为多类别散点图的绘制,在使用常规matplotlib进行绘制时会显得格外繁琐,所以我们选择了对matplotlib进行了更高级的API封装,使作图更加容易的seaborn包进行图表的绘制,更多seaborn 介绍,大家可以直接去seaborn官网进行相关资料的查阅。数据的读取使用的功能强大的数据处理包 pandas ,这里只是进行简单的删除空值操作,直接使用dropna() 函数操作即可,我们直接预览数据,如下(部分):
由于我们直接使用了seaborn进行图表的绘制,绘图代码也得到了极大的简化,默认的绘图代码如下:
fig, ax = plt.subplots(figsize=(6,5),dpi=200)
scatter = sns.scatterplot(data=penguins_df,x="bill_length_mm",y="bill_depth_mm",hue="species",
size="body_mass_g",ec="k",alpha=.9,ax=ax)
scatter.legend()
ax.text(.91,-.1,'\nVisualization by DataCharm',transform = ax.transAxes,
ha='center', va='center',fontsize = 7,color='black')
可视化效果如下:
这配色、这布局······
,这个图表中主要存在如下问题:
针对以上几个问题,接下来我们对其进行美化操作。
详细的美化操作对于seaborn来说,代码过多,且需记住的绘图函数也较多,这里和R-ggplot2 绘图一样,我们直接选择matplotlib 绘图主题进行设置即可,此外,我们还对图例等图元素进行设置,具体代码如下:
plt.rcParams["font.family"] = "Arial-Narrow"
palette = ("#FF8C00", "#A034F0", "#159090")
plt.style.use('fivethirtyeight')
fig, ax = plt.subplots(figsize=(6,5),dpi=200)
scatter = sns.scatterplot(data=penguins_df,x="bill_length_mm",y="bill_depth_mm",hue="species",size="body_mass_g",
palette=palette,ec="white",alpha=.9,ax=ax)
#自定义图例设置
handles,labels = scatter.get_legend_handles_labels()
labels_size = labels[5:]
labels_size = [str(int(i)/1000)+" kg" for i in labels_size]
scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=1,loc="lower right",
frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(1, 0.0))
scatter.set_xlabel("Bill length (mm)")
scatter.set_ylabel("Bill depth (mm)")
#添加标题
ax.text(-.08,1.1,"Base Charts in Python Exercise 01: Point Charts",
transform = ax.transAxes,color='k',ha='left',va='center',size=15,fontweight='extra bold')
ax.text(.91,-.1,'\nVisualization by DataCharm',transform = ax.transAxes,
ha='center', va='center',fontsize = 7,color='black')
plt.show()
这里注意以下几点:
plt.style.use('fivethirtyeight')
这样就选择了对应的绘图主题。
handles,labels = scatter.get_legend_handles_labels()
labels_size = labels[5:]
labels_size = [str(int(i)/1000)+" kg" for i in labels_size]
scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=1,loc="lower right",
frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(1, 0.0))
该部分代码就实现了图例的定制化操作,具体包括:图例元素选择、位置以及排列方式等.
这里指出一下:由于seaborn是对matplotlib的高度封装,这也导致其对个别图表元素的定制化设置就相对较难(如图例)
最终的可视化效果如下:
当然我们还可以将图例放置在上方并排显示,对应修改代码如下:
scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=8,loc="upper center",
frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(0.5, 1.03))
可视化效果如下:
本期推文我们推出了基础散点图的Python绘制版本,希望可以满足喜欢使用Python绘图的小伙伴。大家有啥意见也可以在文末 读者讨论 区进行谈论交流啊。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有