01
Pandas的基本排序
Pandas的主要数据结构有2个:DataFrame,Series,针对这两个类型的排序Demo如下:
#coding=utf-8
import pandas as pd
import numpy as np
#以下实现排序功能。
series=pd.Series([3,4,1,6],index=['b','a','d','c'])
frame=pd.DataFrame([[2,4,1,5],[3,1,4,5],[5,1,4,2]],columns=['b','a','d','c'],index=['one','two','three'])
print(frame)
print(series)
#series的排序API
print('series通过索引进行排序:')
print(series.sort_index())
print('series通过值进行排序:')
print(series.sort_values())
#dataframe的排序API
print('dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数):')
print(frame.sort_index(ascending=False))
print('dataframe根据列索引进行排序:')
print(frame.sort_index(axis=1))
print('dataframe根据值进行排序:')
print(frame.sort_values(by='a'))
print('通过多个索引进行排序:')
print(frame.sort_values(by=['a','c']))
02
输出
b a d c
one 2 4 1 5
two 3 1 4 5
three 5 1 4 2
b 3
a 4
d 1
c 6
dtype: int64
series通过索引进行排序:
a 4
b 3
c 6
d 1
dtype: int64
series通过值进行排序:
d 1
b 3
a 4
c 6
dtype: int64
dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数):
b a d c
two 3 1 4 5
three 5 1 4 2
one 2 4 1 5
dataframe根据列索引进行排序:
a b c d
one 4 2 5 1
two 1 3 5 4
three 1 5 2 4
dataframe根据值进行排序:
b a d c
two 3 1 4 5
three 5 1 4 2
one 2 4 1 5
通过多个索引进行排序:
b a d c
three 5 1 4 2
two 3 1 4 5
one 2 4 1 5
Pandas是具有行索引和列索引的表格,可以对这两个维度的索引分别排序。
03
Pandas分组
# data是DataFrame的实例
group_column1 = data.groupby('column1')
注意group_column1是一个Groupby类型的实例,它是可迭代的,元素为元包,第一个元素是组名称,第二个元素是子DataFrame。
04
Pandas组内排序
因为第二个元素是子DataFrame,所以:
for group_name, group_eles in group_column1:
group_eles.sort_values(by='column2',ascending=False)
这样就实现了组内排序
以上总结了Pandas的基本排序,分组,组内排序,希望有用,更好的API请留言
本文分享自 程序员郭震zhenguo 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!