首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

盘点66个Pandas函数,轻松搞定“数据清洗”!

此外,isnull().any()会判断哪些”列”存在缺失值,isnull().sum()用于将列中为空的个数统计出来。...英文大小写转换 pad/center 在字符串的左边、右边或左右两边添加给定字符 repeat 重复字符串几次 slice_replace 使用给定的字符串,替换指定的位置的字符 split 分割字符串,将一列扩展为多列...df.rename(columns={'mark': 'sell'}, inplace=True) 输出: 行列转置,我们可以使用T属性获得转置后的DataFrame。...melt()方法可以将宽表转长表,即表格型数据转为树形数据。...df.melt(id_vars="姓名", var_name="科目", value_name="成绩") 输出: pivot()方法可以将长表转宽表,即树形数据转为表格型数据。

3.8K11
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    左手pandas右手Python,带你学习数据透视表

    2.Excel实现 选中数据区域,插入,数据透视表,将Name字段拉倒“行”区域,Account,Price,Quantity拉入“值”区域,并将三者的字段汇总方式设置为平均值。...2.Excel实现 在上面的基础上,将Product拉到“列”的位置即可。 ? 可以看到,有些位置没有对应的值,Pandas默认用NaN填充,Excel则采用置空处理。...目标7:使用行索引和列索引,同时查看多个字段(Price,Quality)的汇总值 1.Pandas实现 pd.pivot_table(df, index=['Manager', 'Rep'], columns...目标8:行列索引的转换,把Product由列索引改为行索引 1.pandas实现 pd.pivot_table(df, index=['Manager', 'Rep', 'Product'], values...2.Excel实现 在上一步的基础上,将Product从“列”位置拖到“行”位置即可。 ?

    3.6K40

    python数据科学系列:pandas入门详细教程

    考虑series和dataframe兼具numpy数组和字典的特性,那么就不难理解二者的以下属性: ndim/shape/dtypes/size/T,分别表示了数据的维数、形状、数据类型和元素个数以及转置结果...前者是将已有的一列信息设置为标签列,而后者是将原标签列归为数据,并重置为默认数字标签 set_axis,设置标签列,一次只能设置一列信息,与rename功能相近,但接收参数为一个序列更改全部标签列信息(...由于该方法默认是按行进行检测,如果存在某个需要需要按列删除,则可以先转置再执行该方法 异常值,判断异常值的标准依赖具体分析数据,所以这里仅给出两种处理异常值的可选方法 删除,drop,接受参数在特定轴线执行删除一条或多条记录...两种分组聚合形式 pivot,pivot英文有"支点"或者"旋转"的意思,排序算法中经典的快速排序就是不断根据pivot不断将数据二分,从而加速排序过程。用在这里,实际上就是执行行列重整。...以SQL中经典的学生成绩表为例,给定原始学生—课程—成绩表,需重整为学生vs课程的成绩表,则可应用pivot实现: ?

    15.1K20

    R&Python Data Science 系列:数据处理(4)长宽格式数据转换

    长格式数据:每一行数据记录的是ID(Player)的一个属性,形式为key:value,例如上图左表中,第一行数据记录Player1选手的name信息,name为key,Sulie为value;...宽格式数据:每一行数据为是一条完整的记录,记录着ID(Player)的各种属性;例如上图右表中,第一行就是一条完整的记录,分别记录Player1选手的name叫Sulie,sex为male,education...特别说明:不要将长宽格数据转换为宽格式数据理解为数据透视表,长转宽只是数据存储形式发生变化,并不对操作对象进行计算,而数据透视表一般对操作对象进行某种操作计算(计数、求和、平均等)。...3 长转宽函数 Python实现 两种方法: 1 pandas库中的pivot()和privot_table()函数; 2 dfply库中的spread()函数; 方法一: ##构造数据...这里不能使用透视表pivot_table()函数,因为pivot_table()函数对value进行计算(求和、平均等),但这里Message列都是字符型的,无法进行计算;若value为数值型数据,可以使用

    2.5K11

    《Python for Excel》读书笔记连载12:使用pandas进行数据分析之理解数据

    引言:本文为《Python for Excel》中第5章Chapter 5:Data Analysis with pandas的部分内容,主要讲解了pandas如何对数据进行描述性统计,并讲解了将数据聚合到子集的两种方法...本节首先介绍pandas的工作原理,然后介绍将数据聚合到子集的两种方法:groupby方法和pivot_table函数。...index和columns分别定义数据框架的哪一列将成为透视表的行和列标签。...Region)的唯一值,并将其转换为透视表的列标题,从而聚合来自另一列的值。...如果要反过来将列标题转换为单个列的值,使用melt。从这个意义上说,melt与pivot_table函数相反: 这里,提供了透视表作为输入,但使用iloc来去除所有的汇总行和列。

    4.3K30

    (三、四)Superset 1.3图表篇——透视表-Pivot Table

    Pivot Table设置 我们依然选择之前王者英雄的数据。 在指标中选择count英雄。并通过主要定位进行分组。列选择英雄。 此时查询就可以将图表结果进行展示了。...在这里可以设置聚合功能,显示总计,整合指标,转置透视表。 我们进行相关设置,再次RUN。 此时,在All一行,增加了分组的统计信息。...Pivot Table v2设置 前文已经说过,Pivot Table已经不在进行更新和维护。将由Pivot Table v2替代。 我们将图表类型换成Pivot Table v2。...Pivot Table v2的查询设置就非常的方便。可以对行,列,指标进行设置。并可以指标应用于行还是列。 当然还有过滤,行限制,排序,降序等设置。 在透视表设置中,也是有聚合功能设置。...同时设置行统计,列统计,转置,并排显示指标。 经过设置后,得到最终的结果显示。 同时,此版本增加了定制化配置的选项。可以对字符格式化,排序,配色进行设置。

    2.3K20

    (三、四)Superset 1.3图表篇——透视表-Pivot Table

    Pivot Table设置 我们依然选择之前王者英雄的数据。 在指标中选择count英雄。并通过主要定位进行分组。列选择英雄。 此时查询就可以将图表结果进行展示了。...在这里可以设置聚合功能,显示总计,整合指标,转置透视表。 我们进行相关设置,再次RUN。 此时,在All一行,增加了分组的统计信息。...Pivot Table v2设置 前文已经说过,Pivot Table已经不在进行更新和维护。将由Pivot Table v2替代。 我们将图表类型换成Pivot Table v2。...Pivot Table v2的查询设置就非常的方便。可以对行,列,指标进行设置。并可以指标应用于行还是列。 当然还有过滤,行限制,排序,降序等设置。 在透视表设置中,也是有聚合功能设置。...同时设置行统计,列统计,转置,并排显示指标。 经过设置后,得到最终的结果显示。 同时,此版本增加了定制化配置的选项。可以对字符格式化,排序,配色进行设置。

    1.2K20

    加速数据分析,这12种高效Numpy和Pandas函数为你保驾护航

    在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Pandas 适用于以下各类数据: 具有异构类型列的表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 的时间序列数据; 带有行/列标签的任意矩阵数据(同构类型或者是异构类型...对象的过程,而这些数据基本是 Python 和 NumPy 数据结构中不规则、不同索引的数据; 基于标签的智能切片、索引以及面向大型数据集的子设定; 更加直观地合并以及连接数据集; 更加灵活地重塑、转置...Isin () 有助于选择特定列中具有特定(或多个)值的行。...这个函数的参数可设置为包含所有拥有特定数据类型的列,亦或者设置为排除具有特定数据类型的列。

    7.5K30

    加速数据分析,这12种高效Numpy和Pandas函数为你保驾护

    在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Pandas 适用于以下各类数据: 具有异构类型列的表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 的时间序列数据; 带有行/列标签的任意矩阵数据(同构类型或者是异构类型...对象的过程,而这些数据基本是 Python 和 NumPy 数据结构中不规则、不同索引的数据; 基于标签的智能切片、索引以及面向大型数据集的子设定; 更加直观地合并以及连接数据集; 更加灵活地重塑、转置...Isin () 有助于选择特定列中具有特定(或多个)值的行。...这个函数的参数可设置为包含所有拥有特定数据类型的列,亦或者设置为排除具有特定数据类型的列。

    6.7K20

    12 种高效 Numpy 和 Pandas 函数为你加速分析

    在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Pandas 适用于以下各类数据: 具有异构类型列的表格数据,如 SQL 表或 Excel 表; 有序和无序 (不一定是固定频率) 的时间序列数据; 带有行/列标签的任意矩阵数据(同构类型或者是异构类型...对象的过程,而这些数据基本是 Python 和 NumPy 数据结构中不规则、不同索引的数据; 基于标签的智能切片、索引以及面向大型数据集的子设定; 更加直观地合并以及连接数据集; 更加灵活地重塑、转置...Isin () 有助于选择特定列中具有特定(或多个)值的行。...这个函数的参数可设置为包含所有拥有特定数据类型的列,亦或者设置为排除具有特定数据类型的列。

    6.3K10

    NumPy、Pandas中若干高效函数!

    在本文中,数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。...Pandas 适用于以下各类数据: 具有异构类型列的表格数据,如SQL表或Excel表; 有序和无序 (不一定是固定频率) 的时间序列数据; 带有行/列标签的任意矩阵数据(同构类型或者是异构类型); 其他任意形式的统计数据集...DataFrame对象的过程,而这些数据基本是Python和NumPy数据结构中不规则、不同索引的数据; 基于标签的智能切片、索引以及面向大型数据集的子设定; 更加直观地合并以及连接数据集; 更加灵活地重塑、转置...Isin()有助于选择特定列中具有特定(或多个)值的行。...这个函数的参数可设置为包含所有拥有特定数据类型的列,亦或者设置为排除具有特定数据类型的列。

    6.6K20

    复杂表源的清洗方法

    第二张表,只有单一的维度,是为一维表。每一行即代表了一家公司一种产品的金额,行与行之间相互独立没有纵向的关系。 回顾上篇推文我们详细提到,数据复合交织的表格,复用性差,不适合作为数据源。...将一维表转化为二维表,叫做透视(Pivot)。在Excel、Power Query、SQL和Python里,都有同样叫法的功能。...在Power Query 中,关键是选中锚定的维度(列),本例为公司列。然后选择【转换】——【逆透视列】——【逆透视其他列】即可。...解决方式的核心仍然是围绕透视(Pivot)和逆透视(Unpivot)。初始数据加载后我们会发现,第一行和第一列有很多空值。而直接逆透视会把空值开头的行或列给删除过滤掉。...我们不妨把表倒转过来——转置,那么横向的问题就转化为纵向问题,就可以重复上述步骤解决了。转置、填充并合并列后如下图所示。 经过这几步,复杂的2*2维表已经转为普通的二维表了!

    2.1K20

    R绘图 | 表达矩阵画箱线图

    主要函数为geom_boxplot()。 本期我们以表达矩阵为例来做箱式图。 1 原始数据 常规的表达矩阵每一行为一个基因,每一列为一个样本,如果拿到的数据不符合上述规则,首先需要对数据进行调整。...如果每一行为一个样本,每一列为一个基因则需要使用t()进行转置。...,相当于linux中的“|” as.data.frame() %>% # 只有数据框才能使用将行名变成一列的命令 rownames_to_column() %>% # 将行名变成一列 mutate...(group = rep(c("control","treatment"),each = 4)) # 新增group列 转置后的表达矩阵 2.2 宽数据转换长数据 宽数据是比较常用的数据收集与储存样式...pdat = pivot_longer(data = dat, cols = starts_with("gene"), # 宽变长 选择以"gene"为开头的行

    2.6K20
    领券