) 所有列的唯一值和计数
选择
df[col] 返回一维数组col的列
df[[col1, col2]] 作为新的数据框返回列
s.iloc[0] 按位置选择
s.loc['index_one'] 按索引选择...df.iloc[0,:] 第一行
df.iloc[0,0] 第一列的第一个元素
数据清洗
df.columns = ['a','b','c'] 重命名列
pd.isnull() 检查空值,返回逻辑数组...,按col1中的值分组(平均值可以用统计部分中的几乎任何函数替换)
df.pivot_table(index=col1,values=[col2,col3],aggfunc=max) 创建一个数据透视表...data.apply(np.max,axis=1) 在每行上应用一个函数
加入/合并
df1.append(df2) 将df1中的行添加到df2的末尾(列数应该相同)
df.concat([df1,...df.describe() 数值列的汇总统计信息
df.mean() 返回所有列的平均值
df.corr() 查找数据框中的列之间的相关性
df.count() 计算每个数据框的列中的非空值的数量
df.max