有没有人有经验,如何OCR几个图像,并创建一个输出PDF文件与识别的文本在C#中的Nicomsoft OCR?看起来它可以做到,但是我的C#代码由于某些原因没有生成任何PDF:
NSOCRLib.NSOCRClass NsOCR = new NSOCRLib.NSOCRClass();
NsOCR.Engine_InitializeAdvanced(out CfgObj, out OcrObj, out ImgObj);
for (i = 0; i < ImageCnt; i++)
{
NsOCR.Img_LoadFile(ImgObj, ImageFiles[i]);
N
我已经获得了以下用于将pdf文件上传到google docs的实现(取自gdata API示例):
def UploadResourceSample():
"""Upload a document, and convert to Google Docs."""
client = CreateClient()
doc = gdata.docs.data.Resource(type='document', title='My Sample Doc')
# This is a convenient MS
下午好,我在我的项目中有一个问题,这是PDF压缩,过程如下:提取图像从一个PDF Hang OCR压缩股票OCR +合并图像和转换PDF每页结合所有生成的pdf格式与光学字符识别,光学字符识别PDFcon作为最终产品之一。我的原始文件大小为11MB,压缩后为4.2MB。整个过程运行得很完美,但我遇到的问题是OCR过程的速度。我在网上查看,我看到了一种方法来规避该过程,这是获得的原始PDF的文本层,并将其传递到最终的PDF是压缩的,尝试一些代码,如删除所有图像的PDF和单独与文本层,并插入我的压缩图像,但问题相比于上面提供的正常过程中,该文件的重量增加了超过4.2MB,这对我来说并不方便。当我寻
正如标题所述,有没有办法使用Python对一个文件夹中的所有pdf文件进行OCR?我有下面的代码,但它只有一个文件的OCR一次和提取文本。我想做一个文件夹中所有的pdf的一般光学字符识别。如果可以的话,请让我知道。
from wand.image import Image
from PIL import Image as PI
import pyocr
import pyocr.builders
import io
tool = pyocr.get_available_tools()[0]
lang = tool.get_available_languages()[1]
req_image
我有一个包含pdf文件的目录。我已经编写了在将文件名传递给wand.image类的对象时执行光学字符识别的代码。我现在想做的是循环遍历pdf文件的目录,为每个pdf生成一个OCR的txt文件,并将其保存在某个目录中。到目前为止,我写的代码如下: import io
from PIL import Image
import pytesseract
from wand.image import Image as wi
pdf = wi(filename = r"D:\files\aba7d525-04b8-4474-a40d-e94f9656ed42.pdf", reso
我正在捆绑一个PDF转换成一个图像,以便我可以OCR它。但在转换过程中,质量正在下降。
使用Python-和/将PDF转换为映像(JPG/PNG)似乎有两种主要方法。
#pdf2image (altering dpi to 300/600 etc does not seem to make a difference):
pages = convert_from_path("page.pdf", dpi=300)
for page in pages:
page.save("page.jpg", 'JPEG')
#Image