首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python+Excel+Word一秒制作百份合同

前言

大家好,又到了Python办公自动化系列。

今天我们继续分享一个真实的办公自动化需求:如何使批量生成指定格式内容的合同。

主要涉及的知识点有:模块的综合运用与Word文档的两种遍历逻辑。

需求描述

你是乙方建筑公司,手上有一份空白合同模板的文件,如下图:

另外还有一份合同信息表,其中是所有甲方(发包人)在合同中需要填写的内容

可见一行为一个公司的全部信息,现在需要把Excel中每一个公司的信息填入空白Word合同模板中,生成各公司的合同,最终结果如下

步骤分析

原本我们需要将汇总表中每一行的信息填进word模板中,生成相应的合同。

现在我们需要交给来实现,就引出了一个问题:程序如何知道要将某个信息填到哪个下划线?为了解决这个问题,我们需要对模板进行修改。

即将下划线改成某种标识,让程序可以看到标识就明白此处应该放什么信息,这里采取的策略是:将需要填写的下划线改成汇总表中的列名,即下图所示

这样程序就可以识别需要填写什么内容了。所谓的识别在这里可以换一个特别简单的词,即文本替换。只要检索到(excel中的列名),把这个替换成具体的信息就可以了。

出于这种策略,列名就需要用的格式,否则正常的无关文本中的信息也会被替换,就破坏了原有的需求,最后模板被修改成如下:

通过表我们可以看到,一行为一个公司的信息,而每一列的列名就存在于模板中,用各个公司的实际信息替换到模板中的列名(程序识别和文本替换的依据)

用这样的方法就可以完成这个需求。整个大需求的实现可以按照下面的步骤:

分析后的步骤:

将 空白合同 调整成 合同模板,需要填写的下划线改成专属的列名

打开Excel表,按行循环,然后按单元格逐个循环各个信息,每个信息都找到模板中存在的对应列名并将其替换(如果不理解下文还有解释)

每次循环完一行的全部单元格后保存合同,生存各个公司单独的合同

分析清楚后逻辑就非常简单了,但有一个隐含的知识点没有提到,让我们边写代码边说!

代码实现

首先导入模块,设置路径,建立文件夹,本例中涉及Excel表的打开和Word的创建,因此需要从导入,而Word无论打开还是创建,用模块的均可

接着打开Excel文件

现在遍历Excel,生成合同。前面也反复提到,Excel的每一行是一份特定合同的信息,因此针对Word文件的实例化和保存一定是在循环体里的,而不像Excel的实例化是在循环体外面

通过下图进一步理解这个替换:

例如程序已经进入第3个循环(循环到第3个公司),针对单元格的循环进入第4个循环,那么此时获取的实际值是,对应的列名是。

此时就明确了需要被替换的内容了,只要在模板中找到把它替换为即可!了解了这个替换后,下一步就是遍历模板,找到对应列名替换!

之前我们说过模块,Word文本存在文档Document-段落Paragraph-文字块Run的三级结构,需要遍历文本可以用以下代码:

针对段落和文字块均可用获取到文字信息。本需求隐含的陷阱就在这里,注意一下合同最后需要填写的内容:

这部分内容如果用上述代码是遍历不到的。为什么?因为这是Word文档中的表格!

遍历表格需要有专门的遍历逻辑:文档Document-表格Table-行Row/列Column-单元格Cell,遍历表格中文本的代码如下:

有了这些补充的知识之后,本案例中最核心的代码就可以这么写

写在最后

本次的案例具有较强的实用性,并且需求可以延伸成为:将一份信息汇总表Excel中的每一个单独信息(每一行或者每一列为个人、公司或者其他的信息)填写到指定的模板Eord中,生成单独的文档,不过在写自动化脚本之前也要先拆分任务,明确思路再进行!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201001A02IGW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券