首页
学习
活动
专区
圈层
工具
发布

Pandas进阶|数据透视表与逆透视

在实际数据处理过程中,数据透视表使用频率相对较高,今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。...数据基本情况 groupby数据透视表 使用 pandas.DataFrame.groupby 函数,其原理如下图所示。...默认聚合所有数值列 index 用于分组的列名或其他分组键,出现在结果透视表的行 columns 用于分组的列名或其他分组键,出现在结果透视表的列 aggfunc 聚合函数或函数列表,默认为'mean'...与 GroupBy 类似,数据透视表中的分组也可以通过各种参数指定多个等级。...crosstab 是交叉表,是一种特殊的数据透视表默认是计算分组频率的特殊透视表(默认的聚合函数是统计行列组合出现的次数)。

5.4K11

在pandas中使用数据透视表

什么是透视表? 经常做报表的小伙伴对数据透视表应该不陌生,在excel中利用透视表可以快速地进行分类汇总,自由组合字段聚合计算,而这些只需要拖拉拽就能实现。...透视表是一种汇总了更广泛表数据的统计信息表。 典型的数据格式是扁平的,只包含行和列,不方便总结信息: ? 而数据透视表可以快速抽取有用的信息: ? pandas也有透视表?...pandas作为编程领域最强大的数据分析工具之一,自然也有透视表的功能。 在pandas中,透视表操作由pivot_table()函数实现,不要小看只是一个函数,但却可以玩转数据表,解决大麻烦。...参数aggfunc对应excel透视表中的值汇总方式,但比excel的聚合方式更丰富: ? 如何使用pivot_table? 下面拿数据练一练,示例数据表如下: ?...总结 本文介绍了pandas pivot_table函数的使用,其透视表功能基本和excel类似,但pandas的聚合方式更加灵活和多元,处理大数据也更快速,大家有兴趣可探索更高级的用法。

3.8K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    在pandas中使用数据透视表

    经常做报表的小伙伴对数据透视表应该不陌生,在excel中利用透视表可以快速地进行分类汇总,自由组合字段聚合计算,而这些只需要拖拉拽就能实现。...透视表是一种汇总了更广泛表数据的统计信息表。 典型的数据格式是扁平的,只包含行和列,不方便总结信息: 而数据透视表可以快速抽取有用的信息: pandas也有透视表?...pandas作为编程领域最强大的数据分析工具之一,自然也有透视表的功能。 在pandas中,透视表操作由pivot_table()函数实现,不要小看只是一个函数,但却可以玩转数据表,解决大麻烦。...它们分别对应excel透视表中的值、行、列: 参数aggfunc对应excel透视表中的值汇总方式,但比excel的聚合方式更丰富: 如何使用pivot_table?...pivot_table函数的使用,其透视表功能基本和excel类似,但pandas的聚合方式更加灵活和多元,处理大数据也更快速,大家有兴趣可探索更高级的用法。

    4K20

    对比Excel,学习pandas数据透视表

    Excel中做数据透视表 ① 选中整个数据源; ② 依次点击“插入”—“数据透视表” ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从不同维度展示结果 ⑤ 结果如下 pandas...用pivot_table()做数据透视表 1)语法格式 pd.pivot_table(data,index=None,columns=None, values=None,aggfunc..."; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc 相当于上述"结果"中的计算类型...案例说明 1)求出不同品牌下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas中的操作如下 df = pd.read_excel(r"C:\Users\黄伟\Desktop\...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 2)求出不同品牌下,每个地区、每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas

    2.1K10

    对比Excel,学习pandas数据透视表

    Excel中做数据透视表 ① 选中整个数据源; ② 依次点击“插入”—“数据透视表” ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从不同维度展示结果 ⑤ 结果如下 pandas...用pivot_table()做数据透视表 1)语法格式 pd.pivot_table(data,index=None,columns=None, values=None,aggfunc..."; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc 相当于上述"结果"中的计算类型...案例说明 1)求出不同品牌下,每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas中的操作如下 df = pd.read_excel(r"C:\Users\黄伟\Desktop\...values="销售数量",aggfunc=np.sum) display(df1) 结果如下: 2)求出不同品牌下,每个地区、每个月份的销售数量之和 ① 在Excel中的操作结果如下 ② 在pandas

    2K20

    【数据处理包Pandas】数据透视表

    import numpy as np import pandas as pd 一、通过多级索引创建数据透视表 利用多级索引产生学生成绩表: r_index = pd.MultiIndex.from_product...数据透视表的效果可以通过groupby来实现,但有时候直接使用pivot_table方法建立数据透视表可能更方便些,而且额外提供了汇总功能。...第1个参数是data参数,提供了绘制数据透视表的数据来源,可以是整个 DataFrame,也可以是 DataFrame 的子集;index和columns参数指定了行分组键和列分组键;values指定想要聚合的数据字段名...(相当于sql里的聚合函数操作的列),默认使用data参数指定的数据;aggfunc参数指明进行聚合运算的函数,默认是mean;margins=True参数提供了数据汇总功能。...'年份','课程'])['富强','李海','王亮'].max().unstack() 三、交叉表 交叉表是一种用于计算分组频率的特殊透视表,可以pivot_table实现同样的功能,因此更建议掌握好pivot_table

    93700

    利用excel与Pandas完成实现数据透视表

    数据透视表是一种分类汇总数据的方法。本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作。...1,制作数据透视表 制作数据透视表的时候,要确定这几个部分:行字段、列字段、数据区,汇总函数。数据透视表的结构如图1所示。...图2 Excel制作数据透视表 Pandas里制作数据透视表主要使用pivot_table方法。...4,对数据透视表中的数据进行分组 在Excel中还支持对数据透视表中的数据进行分组,例如可以把风扇和空调的数据分为一组来计算,如图14所示。...图14 对数据透视表中的数据进行分组 用Pandas也可以实现类似的统计,示例代码如下: 代码11-9 对数据透视表中的数据进行分组统计 import pandas as pd import xlwings

    3K40

    左手pandas右手Python,带你学习数据透视表

    数据透视表是数据分析工作中经常会用到的一种工具。Excel本身具有强大的透视表功能,Python中pandas也有透视表的实现。...本文使用两个工具对同一数据源进行相同的处理,旨在通过对比的方式,帮助读者加深对数据透视表的理解。 数据源简介: 本文数据源来自网络,很多介绍pandas的文章都使用了该数据。...后台回复“透视表”可以获得数据和代码。...目标9:对Price和Quantity使用不同的汇总方式 1.pandas实现 通过字典的方式,为不同的字段传入不同的聚合函数。...2.Excel 实现 只需在目标7的基础上,将Price和Quantity的值字段设置成相应的聚合方式即可。如下图所示。 ? 注:同一个字段可以用列表方式传多个函数。

    4.1K40

    熟练掌握 Pandas 透视表,数据统计汇总利器

    你还可以指定用"总和"、"均值"等聚合函数来汇总每个格子的数据。 拥有了这张透视表,数据就井然有序了。你可以一览无余地观察每个类别、每个地区的销售情况,发现潜在规律和异常。...语法和对应的参数含义: import pandas df = pandas.pivot_table( data="要进行汇总的数据集(DataFrame)", values="要聚合的列或列的列表...", index="要作为行索引的列或列的列表", columns="要作为列索引的列或列的列表", aggfunc="用于聚合数据的函数或函数列表,默认是 numpy.mean...pandas.fillna 妙招拨云见日 熟练掌握 Pandas 离散差分,数据变化一目了然 学完本系列你可以掌握下面这些能力: 灵活创建和管理数据集,通过自定义创建 DataFrame ,可以方便地将各种格式的数据转化为...多维度数据透视与总结,透视表功能可以按任意的行列索引对数据进行高效切割与聚合,全方位统计各维度的关键信息。

    92900

    数据透视表:动态计算近N天数据变化

    在Excel中,我们可以使用Power Pivot和数据透视表相结合的方法来动态计算近N天的数据变化的情况。比如,我们按选择一个日期,计算当前日期的前7天、前15天,前30天等近期的数据变化情况。...如图所示: 这种方法不仅可以提高数据透视表的效率,还可以打造更多的分析的维度。 初始的数据源和数据模型如下图所示: 在这个模型中,我们新建一个日期表,用来筛选订单表中的下单日期。...为了当我们选择一个日期的时候,在我们透视表中和数据透视图中能显示选择的近N天的数据,我们还需要做两件事: (1)新建一个用于切片器的近N天的表。如图所示。...插入一个数据透视表,日期列来自于切片日期表中的日期列,放入度量值salestotal。如图所示,当我们选择一个日期的时候,就可以自动计算这个日期的近N天的总金额。...如图所示: 全部勾选连接到数据透视表和数据透视图,这样就能正常地工作了。 但是还有一个问题就是图表的标题要随着选择的近N天的值变化,可以结合度量值,CUBE类函数以及文本框和公式的方法来解决。

    2.2K30

    小蛇学python(18)pandas的数据聚合与分组计算

    对数据集进行分组并对各组应用一个函数,这是数据分析工作的重要环节。在将数据集准备好之后,通常的任务就是计算分组统计或生成透视表。...pandas提供了一个高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 groupby的简单介绍 ?...image.png 通过函数进行分组 这是一个极具python特色的功能。 ? image.png 如果你想使用的自己的聚合函数,只需要将其传入aggregate或者agg方法即可。 ?...我们可以利用以前学习pandas的表格合并的知识,但是pandas也给我专门提供了更为简便的方法。 ?...这时候我们再自定义函数。 ? image.png 这样就实现了,people表格里的数据减去同类型数据平均值的功能。这个功能叫做距平化,是一个经常使用的操作。

    2.9K20

    手把手教你用Pandas透视表处理数据(附学习资料)

    介绍 也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。...数据 使用pandas中pivot_table的一个挑战是,你需要确保你理解你的数据,并清楚地知道你想通过透视表解决什么问题。...使用Pandas透视表将是一个不错的选择,应为它有以下优点: 更快(一旦设置之后) 自行说明(通过查看代码,你将知道它做了什么) 易于生成报告或电子邮件 更灵活,因为你可以定义定制的聚合函数 Read...pd.pivot_table(df,index=["Manager","Rep"]) 可以看到,透视表比较智能,它已经开始通过将“Rep”列和“Manager”列进行对应分组,来实现数据聚合和总结。...我一般的经验法则是,一旦你使用多个“grouby”,那么你需要评估此时使用透视表是否是一种好的选择。 高级透视表过滤 一旦你生成了需要的数据,那么数据将存在于数据帧中。

    3.6K50

    懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 本系列上一节文章最后我随手使用了 pandas 中的透视表操作,之后有些小伙伴询问我相关的问题。...正好 pandas 的 pivot_table 也是与 Excel 透视表对应。本文简单教你入门使用 pandas 完成透视表功能。...> 接下来不再显示 Excel 透视表操作 pandas 要做出透视表的效果,实际与 Excel 透视表的概念基本一致: - 参数 index 就是 Excel 透视表中的 行标签 - 参数 columns...2个参数,因为 pandas 中添加这2列是非常简单 "Excel 透视表是百分比呀" pandas 透视表功能没有参数设置,因为本身透视出来的还是一个 DataFrame ,这可以利用之前学到的一切技巧来为这个...下面是 Excel 透视表结果: 接着是 pandas 实现: - 修改 index 参数为 pclass,即可按船舱等级汇总 - 行9:不想再重复编写那段"非人"看的占比计算,直接调用一个自定义的函数

    1.4K50

    一行Pandas代码制作数据分析透视表,太牛了

    相信大家都用在Excel当中使用过数据透视表(一种可以对数据动态排布并且分类汇总的表格格式),也体验过它的强大功能,在Pandas模块当中被称作是pivot_table,今天小编就和大家来详细聊聊该函数的主要用途...导入模块和读取数据 那我们第一步仍然是导入模块并且来读取数据,数据集是北美咖啡的销售数据,包括了咖啡的品种、销售的地区、销售的利润和成本、销量以及日期等等 import pandas as pd def...,读者也可以根据自己的习惯来进行数据的读取 df = load_data() df.head() output 通过调用info()函数先来对数据集有一个大致的了解 df.info() output...index、values、columns以及aggfunc,其中每个数据透视表都必须要有一个index,例如我们想看每个地区咖啡的销售数据,就将“region”设置为index df.pivot_table...又或者我们想要看一下净利润,代码如下 df.pivot_table(index=['region'], values=['net_profit']) output 另外我们也提到了aggfunc,可以设置我们对数据聚合时进行的函数操作

    1.1K40

    懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 本系列上一节文章最后我随手使用了 pandas 中的透视表操作,之后有些小伙伴询问我相关的问题。...正好 pandas 的 pivot_table 也是与 Excel 透视表对应。本文简单教你入门使用 pandas 完成透视表功能。...> 接下来不再显示 Excel 透视表操作 pandas 要做出透视表的效果,实际与 Excel 透视表的概念基本一致: - 参数 index 就是 Excel 透视表中的 行标签 - 参数 columns...pandas 中添加这2列是非常简单 "Excel 透视表是百分比呀" pandas 透视表功能没有参数设置,因为本身透视出来的还是一个 DataFrame ,这可以利用之前学到的一切技巧来为这个...下面是 Excel 透视表结果: 接着是 pandas 实现: - 修改 index 参数为 pclass,即可按船舱等级汇总 - 行9:不想再重复编写那段"非人"看的占比计算,直接调用一个自定义的函数

    2K20
    领券