前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python+Excel+Word一秒制作百份合同

Python+Excel+Word一秒制作百份合同

作者头像
刘早起
发布于 2020-08-12 06:53:21
发布于 2020-08-12 06:53:21
2.5K01
代码可运行
举报
文章被收录于专栏:早起Python早起Python
运行总次数:1
代码可运行

前言

大家好,又到了Python办公自动化系列。

今天我们继续分享一个真实的办公自动化需求:如何使Python+Excel+Word批量生成指定格式内容的合同。

主要涉及的知识点有:openpyxl模块的综合运用与Word文档的两种遍历逻辑。

需求描述

你是乙方建筑公司,手上有一份空白合同模板的Word文件,如下图:

另外还有一份Excel合同信息表,其中是所有甲方(发包人)在合同中需要填写的内容

可见一行为一个公司的全部信息,现在需要把Excel中每一个公司的信息填入空白Word合同模板中,生成各公司的合同,最终结果如下

步骤分析

原本我们需要将Excel汇总表中每一行的信息填进word模板中,生成相应的合同。

现在我们需要交给Python来实现,就引出了一个问题:程序如何知道要将某个信息填到哪个下划线? 为了解决这个问题,我们需要对模板进行修改。

即将下划线改成某种标识,让程序可以看到标识就明白此处应该放什么信息,这里采取的策略是:将需要填写的下划线改成汇总表中的列名,即下图所示

这样程序就可以识别需要填写什么内容了。所谓的识别在这里可以换一个特别简单的词,即文本替换。只要检索到#xxxx#(excel中的列名),把这个替换成具体的信息就可以了。

出于这种策略,列名就需要用#xxxx#的格式,否则正常的无关文本中的信息也会被替换,就破坏了原有的需求,最后模板被修改成如下:

通过Excel表我们可以看到,一行为一个公司的信息,而每一列的列名就存在于模板中,用各个公司的实际信息替换到模板中的列名(程序识别和文本替换的依据)

用这样的方法就可以完成这个需求。整个大需求的实现可以按照下面的步骤:

分析后的步骤:

  1. 将 空白合同 调整成 合同模板,需要填写的下划线改成专属的列名
  2. 打开Excel表,按行循环,然后按单元格逐个循环各个信息,每个信息都找到模板中存在的对应列名并将其替换(如果不理解下文还有解释)
  3. 每次循环完一行的全部单元格后保存合同,生存各个公司单独的合同

分析清楚后逻辑就非常简单了,但有一个隐含的知识点没有提到,让我们边写代码边说!

代码实现

首先导入模块,设置路径,建立文件夹,本例中涉及Excel表的打开和Word的创建,因此需要从openpyxl导入load_workbook,而Word无论打开还是创建,用docx模块的Document均可

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from docx import Document
from openpyxl import load_workbook
# 利用os模块建立文件夹,用于存放生成的合同
import os

# 给定合同模板和汇总表所在的文件夹路径,方便复用
path = r'C:\Users\chenx\Desktop\合同'

# 结合路径判断生成文件夹,规避程序报错而终止的风险
if not os.path.exists(path + '/' + '全部合同'):
    os.mkdir(path + '/' + '全部合同')

接着打开Excel文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
workbook = load_workbook(path + '/' + '合同信息表.xlsx')
sheet = workbook.active

现在遍历Excel,生成合同。前面也反复提到,Excel的每一行是一份特定合同的信息,因此docx针对Word文件的实例化和保存一定是在循环体里的,而不像Excel的实例化是在循环体外面

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 有效信息行是从第二行开始的,第二行是表头,包含列名,也是文本替换的依据
for table_row in range(2, sheet.max_row + 1):
    # 每循环一行实例化一个新的word文件
    wordfile = Document(path + '/' + '合同模板.docx')
    # 单元格需要逐个遍历,每一个都包含着有用的信息
    for table_col in range(1, sheet.max_column + 1):
        # 旧的文本也就是列名,已经在模板里填好了,用于文本替换,将row限定在第一行后就是列名
        old_text = str(sheet.cell(row=1, column=table_col).value)
        # 新的文本就是实际的信息,table_col循环到某个数值时,实际的单元格和列名就确定了
        new_text = str(sheet.cell(row=table_row, column=table_col).value)
        # 加上这个判断是因为日期信息读进程序是“日期 时间”格式的,如果要保留日期信息可以用字符串方法或者用time/datetime模块处理
        if ' ' in new_text:
            new_text = new_text.split()[0]

通过下图进一步理解这个替换:

例如程序已经进入第3个循环(循环到第3个公司),针对单元格的循环进入第4个循环,那么此时获取的实际值是建设C公园,对应的列名是#工程内容#

此时就明确了需要被替换的内容了,只要在模板中找到#工程内容#把它替换为建设C公园即可!了解了这个替换后,下一步就是遍历Word模板,找到对应列名替换!

之前我们说过docx模块,Word文本存在文档Document-段落Paragraph-文字块Run的三级结构,需要遍历文本可以用以下代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
all_paragraphs = wordfile.paragraphs
for paragraph in all_paragraphs:
    print(paragraph.text)
    for run in paragraph.runs:
        print(run.text)

针对段落和文字块均可用.text获取到文字信息。本需求隐含的陷阱就在这里,注意一下合同最后需要填写的内容:

这部分内容如果用上述代码是遍历不到的。为什么?因为这是Word文档中的表格!

遍历表格需要有专门的遍历逻辑:文档Document-表格Table-行Row/列Column-单元格Cell,遍历表格中文本的代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
all_tables = wordfile.tables
for table in all_tables:
    # 也可按列遍历
    for row in table.rows:
        for cell in row.cells:
            print(cell.text)

有了这些补充的知识之后,本案例中最核心的代码就可以这么写

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
for table_row in range(2, sheet.max_row + 1):
    wordfile = Document(path + '/' + '合同模板.docx')
    for table_col in range(1, sheet.max_column + 1):
        old_text = str(sheet.cell(row=1, column=table_col).value)
        new_text = str(sheet.cell(row=table_row, column=table_col).value)
        if ' ' in new_text:
            new_text = new_text.split()[0]
        
        # 文档Document - 段落Paragraph - 文字块Run
        all_paragraphs = wordfile.paragraphs
        for paragraph in all_paragraphs:
            for run in paragraph.runs:
                run.text = run.text.replace(old_text, new_text)

        # 文档Document - 表格Table - 行Row/列Column - 单元格Cell
        all_tables = wordfile.tables
        for table in all_tables:
            for row in table.rows:
                for cell in row.cells:
                    cell.text = cell.text.replace(old_text, new_text)

    # 获取公司名用以生成合同的名称
    company = str(sheet.cell(row=table_row, column=1).value)
    wordfile.save(path + '/' + f'全部合同/{company}合同.docx')

写在最后

本次的案例具有较强的实用性,并且需求可以延伸成为:将一份信息汇总表Excel中的每一个单独信息(每一行或者每一列为个人、公司或者其他的信息)填写到指定的模板Word中,生成单独的文档,不过在写自动化脚本之前也要先拆分任务,明确思路再进行!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 早起Python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python办公自动化 | 批量word生成工具2.0
近日有粉丝表示太好用了,问能不能添加批量添加图片的功能,粉丝的需求就是我输出的动力,安排!
披头
2022/08/22
1.5K0
Python办公自动化 | 批量word生成工具2.0
python自动化办公——python操作Excel、Word、PDF集合大全
本文是鉴于有些粉丝的工作需求,有时候需要遇到这些文件的处理。因此,我写了一个文章集合,供大家参考,整篇文章已经整理成册(如下图所示)。由于文档获取人数太多,大家如有需求,请关注公众号:【数据分析与统计学之美】,回复关键词:【自动化文档】!
用户7886150
2021/01/24
2K0
Python办公自动化 | 批量word报告生成工具
有时候我们需要按照某种规则生成一种固定模板的word报告,python能够很好的完成这项工作。本文通过一个小示例说明一下如何通过Python实现自动生成word报告。
披头
2020/01/14
8.9K1
Python办公自动化 | 批量word报告生成工具
Python自动化办公之Word,全网最全看这一篇就够了
使用Python操作word大部分情况都是写操作,也有少许情况会用到读操作,在本次教程中都会进行讲解,本次课程主要用到以下4个库,请大家提前安装。
Python小二
2020/11/24
2.7K0
Python自动化办公之Word,全网最全看这一篇就够了
利用python自动写docx报告
最近在做一些数据方面的东西。虽然处理 excel 很方便。有时候为了不写周报,可以用自动化来写。 比如可以从jira 里面捞数据。比如可以统计excel 里面数据,生成图表,生成doc, 自动发出来。
赵云龙龙
2020/08/10
2.7K0
<自动化办公> Python 操控 Word
虽然Word不好用, 但还必须得用它, python-docx是专门用于编辑Word文档的一个工具库, 它有两大用途, 自动化生成word文档 and 自动化修改文档 python word
zhaoolee
2018/04/19
6.1K2
<自动化办公> Python 操控 Word
用Python写几行代码,一分钟搞定一天工作量,同事直呼:好家伙!
前几天有一个读者说最近要整理几千份文件,头都要整秃了,不知道能不能用Python解决,我们来看一下,你也可以思考一下。
刘早起
2021/01/22
9250
用Python写几行代码,一分钟搞定一天工作量,同事直呼:好家伙!
python自动化高效办公第二期,带你项目实战【一】{excel数据处理、批量化生成word模板、pdf和ppt等自动化操作}
我们在读取文件的时候,excel的列是字母我们不容易直观看出来是第几列,下面对excel进行设置。
汀丶人工智能
2022/12/21
3K0
python自动化高效办公第二期,带你项目实战【一】{excel数据处理、批量化生成word模板、pdf和ppt等自动化操作}
Python处理excel的强大工具-openpyxl
首先,Python处理excel的第三方库有:xlrd,xlwt,openpyxl等。
吾非同
2020/10/13
2.2K0
Word自动化排版画图,Python还能这么玩?
故这次我们将利用Python的一些基本绘图库、计算库、操作Word库等库去实现我们这次的自动化Word生成程序。最终生产的Word效果如下:
AI科技大本营
2020/12/18
1.5K0
Python办公自动化| word 表格转excel
之前写过一篇 Python办公自动化 | 批量word报告生成工具 ,有小伙伴提出了逆向需求,即:从批量word中获取内容并写入excel,需求背景是汇总一些材料,举例:实习鉴定表、个人简历、档案等。
披头
2020/07/06
3.1K1
再也不用复制粘贴了!自动读取Word文件并写入Excel
在做数据分析时,虽然操作docx并不是常用操作,但有些时候,数据分析师拿到的文件是docx或doc的Word文件,尤其是对数据具有至关重要的数据字典。接下来以一个数据字典为例来介绍下python-docx读取Word文件的基本操作。并将Word中的表格内容写入excel中。
数据STUDIO
2021/06/24
2.8K0
Python处理Excel数据的方法[通俗易懂]
当Excel中有大量需要进行处理的数据时,使用Python不失为一种便捷易学的方法。接下来,本文将详细介绍多种Python方法来处理Excel数据。
全栈程序员站长
2022/11/18
6.1K0
Python读取excel三大常用模块到底谁最快,附上详细使用代码
之前分享过python调用过ppt和word,作为一家人的excel当然要整整齐齐的安排上
行哥玩Python
2020/07/14
86.7K1
最全总结 | 聊聊 Python 办公自动化之 Word(中)
通过章节对象的 left_margin、top_margin、right_margin、bottom_margin 属性值可以获取当前章节的左边距、上边距、右边距、下边距
AirPython
2020/11/19
2.2K0
最全总结 | 聊聊 Python 办公自动化之 Word(中)
Python自动化办公 | 同事要我帮忙补写178份Word日报!别闹!
首先让我们来看看数据样本和输出文档的需求(敏感数据已做和谐处理):原始 excel 文件中有 n 个子表,每个子表为一天的数据,存在无记录和有记录(部门数 ≥ 1,每个部门记录数 ≥ 1)两种情况,需分别整理成两种日报,一为纯文本描述,二为附带表格的文档。
朱小五
2020/09/24
1K0
Python自动化办公 | 同事要我帮忙补写178份Word日报!别闹!
Python自动化办公系列之Python操作Excel
③ 在python中使用excel函数公式(很有用)         
磐创AI
2020/05/16
2.4K0
[实用][更新中]Java Apache POI 打印Word文档工具(含文本替换,动态表格功能)
你好!这是由一个刚毕业的学生,由于项目所需,需要通过Java后台的方式打印Word文档,因此在对大量能操作word的Java API中,选择了Apache POI。以下将简单分享一下这个在学习和开发这个基于POI的word文档打印工具时,一些心得:
RRT冻羊
2022/11/03
4.4K0
[实用][更新中]Java Apache POI 打印Word文档工具(含文本替换,动态表格功能)
Python文件自动化处理
获取一系列格式   sheet[‘A1:A5’]    sheet[‘A’]     sheet[‘A:C’]    sheet[5]   .rows
@小森
2024/03/15
1460
Python文件自动化处理
一文学会用Python操作Excel+Word+CSV
数据处理是 Python 的一大应用场景,而 Excel 又是当前最流行的数据处理软件。因此用 Python 进行数据处理时,很容易会和 Excel 打起交道。得益于前人的辛勤劳作,Python 处理 Excel 已有很多现成的轮子,比如 xlrd & xlwt & xlutils 、 XlsxWriter 、 OpenPyXL ,而在 Windows 平台上可以直接调用 Microsoft Excel 的开放接口,这些都是比较常用的工具,还有其他一些优秀的工具这里就不一一介绍,接下来我们通过一个表格展示各工具之间的特点:
Python小二
2020/12/18
3.3K0
一文学会用Python操作Excel+Word+CSV
推荐阅读
相关推荐
Python办公自动化 | 批量word生成工具2.0
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档