首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas的groupby问题

先给出一个很基础的链接:https://www.jianshu.com/p/fad96eac8630; 通过这个链接可以了解groupby函数的基本用法。下面是我在看Robert Layton的《Python数据挖掘入门与实践》一书时总结的一些基本知识。

1:首先frozenset() 返回一个冻结的集合,冻结后集合不能再添加或删除任何元素;

2:groupby函数的使用:

注:#后的注释为相应的输出结果

import pandas as pd

import numpy as np

print(df)

# data1 data2 key1 key2

# 0 -0.074640 0.351577 a one

# 1 1.419406 1.999888 a two

# 2 -0.029690 0.839932 b one

# 3 -2.540797 -0.753175 b two

# 4 -0.069440 0.076043 a one

print('first:\n',df.groupby('key1')['key2'].size())

# first:

# key1

# a 3

# b 2

# Name: key2, dtype: int64

print('second:\n',df.groupby(['key1', 'key2']).size())

# second:

# key1 key2

# a one 2

# two 1

# b one 1

# two 1

# dtype: int64

favorable_reviews_by_users = dict((k, frozenset(v.values)) for k, v in df.groupby('key1')['key2'])

print('third:\n',favorable_reviews_by_users)

# third:

# {'a': frozenset({'two', 'one'}), 'b': frozenset({'two', 'one'})}

print('fourth:\n',df.groupby('key1').mean())

# fourth:

# data1 data2

# key1

# a 0.371597 0.884543

# b 0.318975 -0.412998

for k, v in df.groupby('key1')['key2']:

print(k)

print('haha')

print(v)

#a

# haha

# 0 one

# 1 two

# 4 one

# Name: key2, dtype: object

# b

# haha

# 2 one

# 3 two

# Name: key2, dtype: object

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180315G1SM8O00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券