01
Pandas的基本排序
Pandas的主要数据结构有2个:DataFrame,Series,针对这两个类型的排序Demo如下:
#coding=utf-8
import pandas as pd
import numpy as np
#以下实现排序功能。
series=pd.Series([3,4,1,6],index=['b','a','d','c'])
frame=pd.DataFrame([[2,4,1,5],[3,1,4,5],[5,1,4,2]],columns=['b','a','d','c'],index=['one','two','three'])
print(frame)
print(series)
#series的排序API
print('series通过索引进行排序:')
print(series.sort_index())
print('series通过值进行排序:')
print(series.sort_values())
#dataframe的排序API
print('dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数):')
print(frame.sort_index(ascending=False))
print('dataframe根据列索引进行排序:')
print(frame.sort_index(axis=1))
print('dataframe根据值进行排序:')
print(frame.sort_values(by='a'))
print('通过多个索引进行排序:')
print(frame.sort_values(by=['a','c']))
02
输出
b a d cone 2 4 1 5two 3 1 4 5three 5 1 4 2b 3a 4d 1c 6dtype: int64series通过索引进行排序:a 4b 3c 6d 1dtype: int64series通过值进行排序:d 1b 3a 4c 6dtype: int64dataframe根据行索引进行降序排序(排序时默认升序,调节ascending参数): b a d ctwo 3 1 4 5three 5 1 4 2one 2 4 1 5dataframe根据列索引进行排序: a b c done 4 2 5 1two 1 3 5 4three 1 5 2 4dataframe根据值进行排序: b a d ctwo 3 1 4 5three 5 1 4 2one 2 4 1 5通过多个索引进行排序: b a d cthree 5 1 4 2two 3 1 4 5one 2 4 1 5
Pandas是具有行索引和列索引的表格,可以对这两个维度的索引分别排序。
03
Pandas分组
# data是DataFrame的实例
group_column1 = data.groupby('column1')
注意group_column1是一个Groupby类型的实例,它是可迭代的,元素为元包,第一个元素是组名称,第二个元素是子DataFrame。
04
Pandas组内排序
因为第二个元素是子DataFrame,所以:
for group_name, group_eles ingroup_column1:
group_eles.sort_values(by='column2',ascending=False)
这样就实现了组内排序
以上总结了Pandas的基本排序,分组,组内排序,希望有用,更好的API请留言。
领取专属 10元无门槛券
私享最新 技术干货