大家好,这里是程序员晚枫
上一篇文章给大家更新了受欢迎的功能:入门案例!批量识别发票自动保存为Excel文件,1行Python代码实现,但之前的文章对于发票识别有一个遗留问题:
只能识别图片格式的发票,但系统下载下来的往往是PDF格式,所以还需要把PDF转为图片,才能进行批量识别。
本周末在多位观众的督促下,加班加点更新了直接识别PDF的功能,下面介绍一下使用方法~(基本没变化,看一眼就会了),文末也有配套的视频教程,不想看文字的朋友可以直接去看视频。
看过之前视频教程的朋友请注意,在Terminal里更新一下poocr
,更新命令如下:
pip install poocr -U
有任何疑问也欢迎大家在本文的评论区和我交流~
为了不给大家增加使用难度,使用代码和原来批量识别图片发票的一样。
import poocr
SecretId = '腾讯云OCR:https://curl.qcloud.com/v0BcWo7t:'
SecretKey = '腾讯云OCR:https://curl.qcloud.com/v0BcWo7t'
pdf_path = r'C:\work\程序员晚枫的发票文件夹'
poocr.ocr2excel.VatInvoiceOCR2Excel(input_path=pdf_path, id=SecretId, key=SecretKey, file_name=True)
参数说明:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。