Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >可视化系列:使用 Python的seaborn 包做出波士顿矩阵图,改善店铺销售水平

可视化系列:使用 Python的seaborn 包做出波士顿矩阵图,改善店铺销售水平

作者头像
咋咋
发布于 2021-09-01 06:42:44
发布于 2021-09-01 06:42:44
1.6K0
举报
文章被收录于专栏:数据大宇宙数据大宇宙

江湖流传一句话:"字不如表,表不如图",在 Python数据可视化有许多选择,但是大多数的库在语法简洁与灵活度不能平衡,本系列将探讨数据探索时如何使用合适的数据可视化库完成工作。

本系列或多或少涉及一些 pandas 的骚操作(网上很难看到相关的资料),其并非可视化的重点,不会多做讲解。

一切技巧与应用,尽在 pandas 专栏中

前言

不管是在数据探索还是报告阶段,数据可视化都是一个非常有用的工具。今天我们来看看如何使用四象限图(波士顿矩阵图),为店铺销售员分门别类。本系列我将尽可能使用不同的工具制作。

计划中的工具:

  • Python 的 seaborn
  • Python 的 altair (能做出动态图,这是目前能比较方便做出图表之间联动的库)
  • Python 的 plotly (能做出动态图,这是一个非常容易学习的库,前提是找到正确的思路)
  • Power BI
  • Tabluea
  • Excel

今天的主角是 seaborn

为什么需要介绍多个 Python 的可视化库?因为他们各有特点,而且我不喜欢太复杂的东西,总是在找一个最简单的可视化库。这也是我为可视化专栏做的准备工作

导入包代码如下:


用你的分析能力,提供改善建议

某商品销售店铺某天的订单数据:

  • 每一行记录表示,某订单的信息(单价多少,数量多少,是哪位销售员负责)
  • 日期列不重要,因为我们只分析一天的数据

每位销售员接待客人的记录:

  • 每个销售员接待的人数

现在你要根据这些数据,得到这些问题的答案:

  1. 换掉其中某几位员工(意味着裁员),应该裁掉谁?
  2. 从中选出某一位员工,对其他员工进行培训和销售技能分享。应该选谁分享,哪些人需要被培训?

分析指标

如果我们只是根据简单的销售数量或销售额:

这些指标不足以看出问题。在零售领域中已经有许多被证明有效的统计指标,今天我们将使用其中2个指标:

  • 客单价:能反映每个顾客的质量,这其实与大环境因素(店铺位置,商品组合等)有关,也能反映销售能力。
  • 成交率:这就能直观反映销售员的能力

假设大环境元素相对固定的情况下,我们就可以使用以上指标分析销售员的水平

如何用 pandas 得到这些指标不是本文重点,反正一顿骚操作如下:

  • 行5-9:其中的 pd.NameAgg 需要 pandas 0.25 或以上的版本才能使用

虽然得到2个重要的指标,但你能通过数据看出啥吗?

不容易吧。因为人对数字的变化不是很敏感。

但是,人对位置却极其敏感。

接下来,我们不妨把数值的差异在位置上展现出来。


散点图加点料

有2个数值指标,刚好对应二维图表的xy轴,于是很容易想到的是使用散点图:

  • 对于 seaborn 来说,散点图是数据关系可视化的一种,rel 实际是 relationships 的缩写
  • relplot 是一个图形级别的函数(意味着我们能使用他做出多种或一次性多个图表的复合图表),用他能做出多种不同的图像,默认情况下是散点图(参数 kind='scatter')

现在能大致看出这些销售员的能力位置!

但这还不够,因为还不能直观看出来哪些处于平均水平以下或以上。

那么,就在2个指标上各自加上一个均值线:

  • 使用 matplotlib 能简单画出直线
  • 行2:plt.axvline 画出垂直线(v 是 vertical 的缩写),自然地,需要在第一个参数中指定该线穿过 x 轴的哪个点
  • 行3:plt.axhline 画出横线(h 是 horizontal 的缩写),自然地,需要在第一个参数中指定该线穿过 y 轴的哪个点

现在还缺点东西,在图上看不出那些点是哪位员工。

把销售员名字加上:

  • 行2:通过 relplot 返回的对象的 axes[0] 中包含多个图表,由于现在我们只是画出简单的一个图表,因此通过索引 0 即可获取其中的图表对象(Axes)
  • 行4-6:遍历数据,通过 ax.text 就可以在图表上写字。前2个参数分别是 x,y 的位置,第3个参数是文本内容

这就是四象限图,他有如下特点:

  • 按2个指标以及指标的均值线,把平面划分出4个代表不同能力的区域
  • 一般情况尽可能使得2个指标越大表示越有优势,这样右上区域就是优秀水平,左下区为次等水平

现在可以回答文章开头的问题:

  • 员工D是最差劲的,A和H同样如此,但是H的成交率距离均值线不远(可以考虑留下考察)
  • 员工C在2项指标都高于平均水平,并且他的成交率是最高的,可以让他对B/G/F/H 做有关提高成交率的销售培训
  • 员工E在客单价方面很低(只推销低端商品),此时可以考虑让F对其培训
  • 员工B应该是最有潜力的员工

总结

seaborn 一般需要配合 matplotlib 才能做出比较复杂的图表。因此,了解 matplotlib 的对象层次是一个比较关键的学习方式。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据大宇宙 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
可视化系列:Python能做出BI软件的联动图表效果?这可能是目前唯一的选择
本系列或多或少涉及一些 pandas 的骚操作(网上很难看到相关的资料),其并非可视化的重点,不会多做讲解。
咋咋
2021/09/01
3.2K0
可视化系列:Python能做出BI软件的联动图表效果?这可能是目前唯一的选择
这3个Seaborn函数可以搞定90%的可视化任务
由于数据可视化的重要性,在数据科学的生态系统中有许多数据可视化库和框架。其中一个流行的是Seaborn,这是一个用于Python的统计数据可视化库。
deephub
2021/03/10
1.5K0
这3个Seaborn函数可以搞定90%的可视化任务
Python Seaborn综合指南,成为数据可视化专家
一个精心设计的可视化程序有一些特别之处。颜色突出,层次很好地融合在一起,整个轮廓流动,整个程序不仅有一个很好的美学质量,它也为我们提供了有意义的技术洞察力。
磐创AI
2019/10/23
3.1K0
Python Seaborn综合指南,成为数据可视化专家
seaborn可视化绘图
今天给大家介绍基于seaborn的4份内置数据集绘制24个精美图形,代码复制即可运行。
皮大大
2024/06/14
2960
python可视化之seaborn
数据可视化的文章我很久之前就打算写了,因为最近用Python做项目比较多,于是就花时间读了seaborn的文档,写下了这篇。 数据可视化在数据挖掘中是一个很重要的部分,将数据用图表形式展示可以很直观地看到数据集的特点(比如正态分布,长尾分布,聚集等),方便下一步怎么对数据进行处理。
vincentbbli
2021/08/18
2.6K0
​再见 Seaborn!Altair 数据可视化已超神
数据可视化对于通过将数据转换为视觉效果来揭示数据中隐藏的趋势和模式非常重要。为了可视化任何形式的数据,我们都可能在某个时间点使用过数据透视表和图表,如条形图、直方图、饼图、散点图、折线图、基于地图的图表等。这些很容易理解并帮助我们传达准确的信息。基于详细的数据分析,我们可以决定如何最好地利用手头的数据,帮助我们做出明智的决定。
数据STUDIO
2021/12/27
10.1K1
​再见 Seaborn!Altair 数据可视化已超神
1行代码完成可视化:Seaborn3个常用方法示例
数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。
deephub
2022/06/04
1.3K0
1行代码完成可视化:Seaborn3个常用方法示例
Python数据分析 | seaborn工具与数据可视化
教程地址:http://www.showmeai.tech/tutorials/33
ShowMeAI
2022/03/08
2.2K0
Python数据分析 | seaborn工具与数据可视化
可视化神器Seaborn的超全介绍
Seaborn是一个用Python制作统计图形的库。它建立在matplotlib之上,并与panda数据结构紧密集成
HuangWeiAI
2019/12/30
2.4K0
Seaborn 可视化
Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
@小森
2024/03/15
3830
Seaborn 可视化
百川归海,四类图统揽统计图:Seaborn|可视化系列03
Matplotlib虽然提供了丰富而强大的接口用于数据的可视化,但在展现多类数据关系时,需要较多数据处理过程,语句就变得繁琐,因此seaborn针对这类需求,基于matplotlib提供了更高层的接口,擅长统计数据的可视化。seaborn可视化的写法和matplotlib基本相同。其代码框架如下:
蛰虫始航
2020/05/12
3.4K0
数据可视化-课堂记录
双变量联合分布于单变量分布图 joinplot 画布 双变量分布图 pairplot
IT从业者张某某
2024/05/26
1180
Python数据可视化,我是如何做出泡泡堆积关联图
有小伙伴说,使用 matplotlib 做出来的图表比不上其他的基于 js 包装的库(pyechart、bokeh、plotly等)漂亮,他们可以还可以交互。同时,基于 matplotlib 包装的 seaborn 似乎也比较省代码。
咋咋
2021/09/01
1.1K0
Python数据可视化,我是如何做出泡泡堆积关联图
盘点12个Python数据可视化库
大家普遍第一次接触到的Python数据可视化库基本上都是Matplotlib。Python还有很多数据可视化库,本文我将简单介绍12款常用的Python数据可视化库,并在文末送出一本数据可视化书籍!
天道Vax的时间宝藏
2021/08/11
4.7K0
python数据分析——数据可视化(图形绘制基础)
数据可视化是指利用图形、表格、图表等方式将数据展示出来,使得数据更加清晰、易于理解和分析。图形绘制是数据可视化的基础,通过绘制各种图形呈现数据,可以更加直观地了解数据之间的关系和趋势。
鲜于言悠
2024/03/20
1K0
python数据分析——数据可视化(图形绘制基础)
Python中得可视化:使用Seaborn绘制常用图表
Seaborn是构建在matplotlib之上的数据可视化库,与Python中的pandas数据结构紧密集成。可视化是Seaborn的核心部分,可以帮助探索和理解数据。
deephub
2020/08/21
7.1K0
Python中得可视化:使用Seaborn绘制常用图表
Python 可视化视频课 - 4. Seaborn 中
统计分析就是去理解一个数据集中变量之间的关系,以及这些关系如何受到其他变量的影响。Seaborn 的主要用处就是可视化这个过程。当数据以恰当的方式展示出来时,读者可以直观地观察到某些趋势并发现变量之间的关系。
用户5753894
2021/07/07
1.2K0
Python 可视化视频课 - 4. Seaborn 中
12个Python数据可视化库
本文盘点了12款常用的Python数据可视化库,挑选适合自己业务的那一款吧!Python有很多数据可视化库,这些数据可视化库主要分为交互式可视化库和探索式可视化库。
生信交流平台
2022/09/21
2K0
数据挖掘从入门到放弃(五)seaborn 的数据可视化
“ 数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,帮助我们更好地解释现象和发现数据价值,做到一图胜千文的说明效果。http://seaborn.pydata.org/index.html”
数据社
2020/05/21
2.3K0
Python数据可视化,完整版操作指南(建议收藏)
让我们看一下使用Python进行数据可视化的主要库以及可以使用它们完成的所有类型的图表。我们还将看到建议在每种情况下使用哪个库以及每个库的独特功能。
龙哥
2021/01/25
2K0
Python数据可视化,完整版操作指南(建议收藏)
推荐阅读
相关推荐
可视化系列:Python能做出BI软件的联动图表效果?这可能是目前唯一的选择
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档