上一篇文章介绍了Python中如何导入文本文件,本篇继续介绍如何导出文本文件,在pandas中,利用DataFrame的to_csv方法,可以将数据写到一个以逗号分隔的文件中。
还是以titanic数据集为例,
通过透视表方法,求出不同性别、仓位乘客的平均年龄,并将数据保存到df中,
最后把df导出到我们要保存的文件夹中,假如现在要把df导出到桌面,同样把导出文件命名为df,使用to_csv方法:
“C:/Users/aaa/Desktop/”是导出文件所在的路径,如果对路径不确定,可以先在该位置,通过其他文件复制为路径的方法找出要复制的路径,再粘贴到Python代码中,同样要将“\”改为“/”。
现在我们在桌面上找到导出的文件df,
打开文件:
也可以用Excel打开:
数据格式与我们在Python中看到的基本是一样的,行标签是Sex、Pclass,列标签缺省,但提供了列标签的值,即0、1。以上是导出层次化索引的情形,下面再介绍导出无层次化索引的DataFrame的一点注意事项。
df1是计算出的不同仓位乘客的平均年龄,现在要将df1还是导出到桌面,然后打开文件:
导出的数据格式与在python中看到的是一样的,0、1、2是所有,表头是Pclass、Age。假如导出时不需要看到索引和列名,在上面代码中增加“index=False、header=False”即可,
再次打开df1,
可以看到,现在打开的df1文件已经没有了索引和列名,1、2、3表示的是仓位等级。
如果需要导出txt格式的文本文件,只需把上述代码中的csv改为txt即可。
以上是Python中pandas库导出文本文件的操作方法,关于文本文件格式数据读入读出的介绍就告一段落,这两篇介绍的read_csv、to_csv方法中的参数都是我在工作中使用较为频繁的参数,其他参数的用法如有兴趣可查阅相关数据或官方文档。以后如有时间再介绍Pyton中读入Excel和数据库文件的方法。
前面介绍的分组、透视表、交叉表方法都是基于单个表的操作,下一篇将介绍跨表间的操作—数据合并,包括纵向、横向合并。
领取专属 10元无门槛券
私享最新 技术干货