前言
上次给大家介绍了一下Series,只是非常基础的一些内容,方便大家对pandas进行了解。这次,为大家带来的是DataFrame,DataFrame是多维数据构成的,与Series不同的是,DataFrame有两个索引组,第一个索引组与行相关,第二个索引组与列相关,跟excel表格非常相似。
首先来学习怎么创建一个DataFrame对象,先导入pandas模块:import pandas as pd。
如果我们没有明确的指定标签,pandas会自动为其添加一个以0为起始的数值的索引。当我们想用标签作为DataFrame的索引,使用index就可以把标签添加到DataFrame中。
说道创建矩阵,在这里想给大家介绍numpy生成矩阵的几个相关函数,用起来非常的方便,比较熟悉的包括arange,zeros,eye,ones。
用到创建DataFrame矩阵中就方便许多了,添加上行名和列名就能构建一个DataFrame。
学会了构建DataFrame对象之后,接下来当然要学习选取元素了,使用columns和index可以查看DataFrame的列名和行名,values能查看数据结构中的所有元素。
选取一列的内容有两种方式,用列名作为索引或者用列名作为DataFrame的属性。
查看行的话,要使用ix属性和行的索引就可以,选取多列的话,使用数组指定多列就可以了。
还可以对矩阵进行转置(行变为列,列变为行),使用T属性就可以了。
如果要删除一列的所有数据,使用del命令就可以办到。
这些是今天所用的命令,虽然只有短短的十几条,但是还是希望这些内容会对大家有帮助!
人生苦短,我用python
往期「精彩内容」,点击回顾
精彩会议及课程,点击回顾
CEPI感谢您的支持!
(IOS系统用户专用通道)
领取专属 10元无门槛券
私享最新 技术干货