Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库
Pandas的两大核心数据结构
Series(一维数据)
允许索引重复
DataFrame(多特征数据,既有行索引...,又有列索引)
# 创建一个3行4列的DataFrame类型数据
data_3_4 = pd.DataFrame(np.arange(10, 22).reshape(3, 4))
# 打印数据
print...usecols: 指定读取的列名
返回的类型: DataFrame
Dataframe通过布尔索引过滤数据
# 布尔索引(查询) 找出年龄大于23岁的人
result[result["age.../train.csv", nrows = 10)
# 将数据中的time转换为最小分度值为秒(s)的计量单位
train["time"] = pd.to_datetime(train["time"],...)
# 交叉表, 表示出用户姓名,和商品名之间的关系
user_goods = pd.crosstab(u_o_g["姓名"],u_o_g["goods_name"])
Pandas的分组和聚合(重要)