“
在刚刚结束的星火国创立项中,咱们机电学院共有50组申请了2018年度的星火国创计划,我们虽然已经多次强调命名的规范,但是还是有相当数量的申请书文档的命名是不标准的。我们的工作就是将这些回收的电子版文件命名规范,再一个个把文件打开,一个个复制其项目的有效信息(如项目名称、申请人、联系电话、指导老师、团队信息等等)到汇总表格。全过程我们动用了整个部门的全部人力来合作完成,可以说是一个非常枯燥的工作,那么,我们能不能解放我们的双手都交给程序完成?
”
星火国创申请信息自动处理系统
Power by Python
程序语言:Python3.x
依赖第三方库:win32com
GUI平台:tkinter
脚本大小:15KB
使用方法
1.直接将申请书的回收文件夹拖入脚本程序
2.选择汇总Excel表格的保存位置与名称
3.保存后系统自动进入批处理模式
4.打开保存的总表检查信息是否抓取正确
本脚本全过程均自动化处理,不需要任何人工干预,可以抓取下列11项基本信息以满足学校总表的填写要求:
申请人学号 项目类别 学院及专业 申请人 指导教师职称 项目成员姓名、学号 项目类型 电子信箱 联系电话 项目名称 指导教师姓名
同时还可以根据申请文档内容自动规范命名,具有很高的信息抓取准确率。
值得注意的是,在使用本脚本的时候,不能开启office另外的word和excel否则会报错或闪退
关于win32com
win32com可以帮助python脚本在windows操作系统下读取或写入MS Word和Excel文件。我们可以通过pip的方式进行自动安装(当然我失败了)也可以手动安装,其下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pywin32
选择一个对应的版本下载whl文件。下载完成后,运行cmd的pip命令(注意把Path环境变量设置到你的Python\Scripts目录下)
pip install E:\XXX.whl
系统即可自动安装
关于infread
考虑到程序的不完善(毕竟就一两天突发奇想弄的。。。)所以我就直接上开源版本了,懒得打包成exe弄得文件太大。本脚本里面主要是infread这个类用于读取、处理、输出信息。
infread类
入口参数:
folder【遍历文件夹地址】
fileoutput【表格输出地址】
fileinput【单一文件输入地址,批处理模式下可不输入】
方法:
wordread()【获取申请表有效文字内容】(错误返回值1)
texthdl()【抓取申请信息】(错误返回值2)
xlswrite()【输出表格】
doit()【批量处理函数】
总结及获取
还是想说我python大法好,由于其丰富的拓展库,可以非常简单的实现你的想法,后期我将加入星火国创公邮自动读取功能,这样连下载附件也一并解决了,彻底实现人力解放。。。
领取专属 10元无门槛券
私享最新 技术干货