前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python pandas read_excel 参数详解 to_excel 读写Excel

python pandas read_excel 参数详解 to_excel 读写Excel

作者头像
acoolgiser
发布2021-01-04 10:36:01
8K0
发布2021-01-04 10:36:01
举报
文章被收录于专栏:acoolgiser_zhuanlanacoolgiser_zhuanlan

Python 读写 Excel 可以使用 Pandas,处理很方便。但如果要处理 Excel 的格式,还是需要 openpyxl 模块,旧的 xlrd 和 xlwt 模块可能支持不够丰富。Pandas 读写 Excel 主要用到两个函数,下面分析一下 pandas.read_excel() 和 DataFrame.to_excel() 的参数,以便日后使用。

1. pandas.read_excel

代码语言:javascript
复制
pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skip_footer=0,skipfooter=0,convert_float=True,mangle_dupe_cols=True,**kwds)

常用参数:

  • io:文件路径 io = r’C:\Users\ss\Desktop\ppp.xlsx’
  • sheetname:表名,单表、多表、全部表 sheetname = None # 读取全部表,得到 OrderDict:key为表名,value为 DataFrame sheetname = 1 / “Sheet1” # 读取单个表,返回 DataFrame sheetname = [0, 1] / [“Sheet1”, “Sheet2”] # 读取多表,返回一个OrderDict
  • header:指定列名行
  • names:设置列名,必须是list类型,且长度和列数一致 names = [“Name”, “Number”, “Score”]
  • usecols:使用的行 usecols = range(1, 3) # 使用 [1, 3) 行,不包括第 3 行 usecols = [4, 7] # 使用 4和7 行
  • skiprows:指定跳过的行数(不读取的行数) shiprows = 4 # 跳过前 4 行,会把首行列名也跳过 skiprows = [1, 2, 4] # 跳过 1,2,4 行 skiprows = range(1, 10) # 跳过 [1,10) 行,不包括第10行,可以留下首行列名
  • skipfooter:指定省略尾部的行数,必须为整数 skipfooter = 4 # 跳过尾部 4 行
  • index_col:指定列为索引列,索引从 0 开始 index_col = 1 index_col = “名称”
代码语言:javascript
复制
# 读取多个表
import pandas as pd
order_dict = pd.read_excel(r'C:\Users\sss\Desktop\test.xlsx',header=0, usecols=[2, 3] names=["Name", "Number"], sheet_name=["Sheet1", "Sheet2"], skiprows=range(1, 10), skipfooter=4)
for sheet_name, df in order_dict.items():
    print(sheet_name)
    print(df)

2. DataFrame.to_excel

代码语言:javascript
复制
DataFrame.to_excel(excel_writer,sheet_name="Sheet1",na_rep="",float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep="inf",verbose=True,freeze_panes=None)

常用参数:

  • excel_writer:文件路径,不存在会自动生成
  • sheet_name=“Sheet1”:指定写的表
  • columns=None:指定输出某些列 columns = [“Name”, “Number”]
  • header=True:是否保存头行列名
  • index=True:是否保存索引列
  • startcol=0:起始行
  • merge_cells=True:是否合并单元格
  • encoding=None:指定编码,常用 utf-8
  • float_format=None:浮点数保存的格式,默认保存为字符串 float_format=’%.2f’ # 保存为浮点数,保留2位小数
  • engine=None:保存格式,指定io.excel.xlsx.writer、 io.excel.xls.writerio.excel.xlsm.writer.
代码语言:javascript
复制
# 简单示例
df.to_excel(r'C:\Users\sss\Desktop\test.xlsx', columns=["Name", "Number"], encoding="utf8")

3. 官方API

https://pandas.pydata.org/pandas-docs/version/0.22/generated/pandas.read_excel.html#pandas.read_excel

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/12/30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. pandas.read_excel
  • 2. DataFrame.to_excel
  • 3. 官方API
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档