我试图从我从pdf文件中提取的文本中搜索一个单词,这是OCR的格式。这个pdf文件有多个页面,所以对于每个页面,我都在搜索这个单词,如果找到了这个单词,然后编写文件名,或者不存在),找到它的 page ,以及它找到的 word 。","west","para")tc=c()x=list()Status="Present"
valoare="";tessnet2.Tesseract ocr= new tessnet2.Tesseract();
ocr.Init(@"F:\Manipulare pdf\bin(1)\Release32\tessdata", "eng", false);var rect = new System.
我试图使用python自动化pdf- to -docx的过程。如果我用MS Word打开PDF文件,pdf Reflow将自动打开。因此,我将其用作OCR工具。我已经使用word_app.DisplayAlerts=0和try-except从Word中取消了消息框。但是,有时仍会弹出消息框"Microsoft PDF Reflow已停止工作“。有什么方法可以抑制PDF回流中的错误吗?= win32com.client.gen