前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python 中批量提取 Excel 数据的详细指南

Python 中批量提取 Excel 数据的详细指南

作者头像
sergiojune
发布2024-06-25 08:53:28
2510
发布2024-06-25 08:53:28
举报
文章被收录于专栏:日常学python日常学python

更多Python学习内容:ipengtao.com

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandasopenpyxlxlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据

pandas 是一个强大的数据分析库,它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas

首先,确保已安装 pandasopenpyxl

代码语言:javascript
复制
pip install pandas openpyxl

2. 读取单个 Excel 文件

代码语言:javascript
复制
import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 显示前几行数据
print(df.head())

3. 批量读取多个 Excel 文件

假设有多个 Excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

代码语言:javascript
复制
import os

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 DataFrame
all_data = pd.DataFrame()

# 逐个读取并合并
for file in file_list:
    df = pd.read_excel(file)
    all_data = all_data.append(df, ignore_index=True)

# 显示合并后的数据
print(all_data.head())

使用 openpyxl 批量提取 Excel 数据

openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

代码语言:javascript
复制
pip install openpyxl

2. 读取单个 Excel 文件

代码语言:javascript
复制
from openpyxl import load_workbook

# 加载 Excel 文件
wb = load_workbook('data.xlsx')

# 选择活动工作表
ws = wb.active

# 读取所有数据
data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

代码语言:javascript
复制
import os
from openpyxl import load_workbook

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    wb = load_workbook(file)
    ws = wb.active
    for row in ws.iter_rows(values_only=True):
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

使用 xlrd 批量提取 Excel 数据

xlrd 是一个用于读取 Excel 文件的库,适用于 .xls.xlsx 格式的文件。

1. 安装 xlrd

代码语言:javascript
复制
pip install xlrd

2. 读取单个 Excel 文件

代码语言:javascript
复制
import xlrd

# 打开 Excel 文件
workbook = xlrd.open_workbook('data.xls')

# 选择工作表
sheet = workbook.sheet_by_index(0)

# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印数据
for row in data:
    print(row)

3. 批量读取多个 Excel 文件

代码语言:javascript
复制
import os
import xlrd

# 存放 Excel 文件的文件夹路径
folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表
all_data = []

# 逐个读取并合并
for file in file_list:
    workbook = xlrd.open_workbook(file)
    sheet = workbook.sheet_by_index(0)
    for row_idx in range(sheet.nrows):
        row = sheet.row_values(row_idx)
        all_data.append(row)

# 打印合并后的数据
for row in all_data:
    print(row)

总结

本文详细介绍了如何使用 pandasopenpyxlxlrd 三种库批量提取 Excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 Excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 日常学python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 使用 pandas 批量提取 Excel 数据
    • 1. 安装 pandas
      • 2. 读取单个 Excel 文件
        • 3. 批量读取多个 Excel 文件
        • 使用 openpyxl 批量提取 Excel 数据
          • 1. 安装 openpyxl
            • 2. 读取单个 Excel 文件
              • 3. 批量读取多个 Excel 文件
              • 使用 xlrd 批量提取 Excel 数据
                • 1. 安装 xlrd
                  • 2. 读取单个 Excel 文件
                    • 3. 批量读取多个 Excel 文件
                    • 总结
                    相关产品与服务
                    数据保险箱
                    数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档