首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

(数据科学学习手札69)详解pandas中的map、apply、applymap、groupby、agg

3.1 利用groupby()进行分组   要进行分组运算第一步当然就是分组,在pandas中对数据框进行分组使用到groupby()方法,其主要使用到的参数为by,这个参数用于传入分组依据的变量名称,...当变量为1个时传入名称字符串即可,当为多个时传入这些变量名称列表,DataFrame对象通过groupby()之后返回一个生成器,需要将其列表化才能得到需要的分组后的子集,如下面的示例: #按照年份和性别对婴儿姓名数据进行分组...可以看到每一个结果都是一个二元组,元组的第一个元素是对应这个分组结果的分组组合方式,第二个元素是分组出的子集数据框,而对于DataFrame.groupby()得到的结果,主要可以进行以下几种操作: ●...3.2 利用agg()进行更灵活的聚合   agg即aggregate,聚合,在pandas中可以利用agg()对Series、DataFrame以及groupby()后的结果进行聚合,其传入的参数为字典...● 聚合groupby()结果 data.groupby(['year','gender']).agg({'count':['min','max','median']}).reset_index(drop

5.1K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    不再纠结,一文详解pandas中的map、apply、applymap、groupby、agg...

    3.1 利用groupby()进行分组 要进行分组运算第一步当然就是分组,在pandas中对数据框进行分组使用到groupby()方法。...当为多个时传入这些变量名称列表,DataFrame对象通过groupby()之后返回一个生成器,需要将其列表化才能得到需要的分组后的子集,如下面的示例: #按照年份和性别对婴儿姓名数据进行分组 groups...可以看到每一个结果都是一个二元组,元组的第一个元素是对应这个分组结果的分组组合方式,第二个元素是分组出的子集数据框,而对于DataFrame.groupby()得到的结果。...3.2 利用agg()进行更灵活的聚合 agg即aggregate,聚合,在pandas中可以利用agg()对Series、DataFrame以及groupby()后的结果进行聚合。...聚合groupby()结果 data.groupby(['year','gender']).agg({'count':['min','max','median']}).reset_index(drop=

    5K10

    不再纠结,一文详解pandas中的map、apply、applymap、groupby、agg...

    3.1 利用groupby()进行分组 要进行分组运算第一步当然就是分组,在pandas中对数据框进行分组使用到groupby()方法。...当为多个时传入这些变量名称列表,DataFrame对象通过groupby()之后返回一个生成器,需要将其列表化才能得到需要的分组后的子集,如下面的示例: #按照年份和性别对婴儿姓名数据进行分组 groups...','gender']).apply(find_most_name).reset_index(drop=False) 3.2 利用agg()进行更灵活的聚合 agg即aggregate,聚合,在pandas...中可以利用agg()对Series、DataFrame以及groupby()后的结果进行聚合。...聚合groupby()结果 data.groupby(['year','gender']).agg({'count':['min','max','median']}).reset_index(drop=

    5.9K31

    数据科学的原理与技巧 三、处理表格数据

    我们将提出一个问题,将问题分解为大体步骤,然后使用pandas DataFrame将每个步骤转换为 Python 代码。...DataFrame的标签称为DataFrame的索引,并使许多数据操作更容易。 索引、切片和排序 让我们使用pandas来回答以下问题: 2016 年的五个最受欢迎的婴儿名字是?...几乎总是有一种更好的替代方法,用于遍历pandas DataFrame。特别是,遍历DataFrame的特定值,通常应该替换为分组。 分组 为了在pandas中进行分组。...baby.groupby('Year') # pandas.core.groupby.DataFrameGroupBy object at 0x1a14e21f60> .groupby()返回一个奇怪的...the same result: # # year_counts = baby[['Year', 'Count']].groupby('Year').count() # # pandas has shorthands

    4.6K10

    《利用Python进行数据分析·第2版》第14章 数据分析案例14.1 来自Bitly的USA.gov数据14.2 MovieLens 1M数据集14.3 1880-2010年间全美婴儿姓名14.4

    对时区进行计数 从原始记录的集合创建DateFrame,与将记录列表传递到pandas.DataFrame一样简单: In [25]: import pandas as pd In [26]: frame...= pd.DataFrame(records) In [27]: frame.info() pandas.core.frame.DataFrame'> RangeIndex: 3560...将该数据从zip文件中解压出来之后,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中: import pandas as pd # Make display...grouped = names.groupby(['year', 'sex']) top1000 = grouped.apply(get_top1000) # Drop the group index,...为此,我们先对候选人进行分组,然后使用本章前面介绍的类似top的方法: def get_top_amounts(group, key, n=5): totals = group.groupby(

    3.1K50
    领券