我在一个历史目录中使用了光学字符识别(OCR),并试图用Microsoft来清理文本。具体来说,我需要一些帮助来编写正则表达式,以便将两行合并在一起。例如,某物
John Smith,87银行
Bldg
实际上应该是
John Smith,87 Bldg
我尝试过几种方法,但都没有成功。有人能帮我吗?
我正在尝试使用android ML Kit文本识别库进行文本识别,但在运行时遇到错误,没有返回任何文本。错误: W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found.
I/DynamiteModule: Considering local module com.google.and
我在我的项目中使用AspriseOCR从图像中识别文本。aspriseOCR.jar文件被正确地配置为我的Eclipse库,但是得到了下面的错误。有人能指点我怎么解决这个问题吗?
java.lang.UnsatisfiedLinkError: no AspriseOCR in java.library.path
at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1860)
at java.lang.Runtime.loadLibrary0(Runtime.java:845)
at java.lang.System.loadLibrary
我下载了tesseract-OCR的可执行文件并安装了它。另一方面,我还从下载了一个轻子子的压缩文件。它包括两个目录,即lib和include。
接下来,我尝试在python虚拟环境中执行pip install tesserocr,然后它返回了错误。
tesserocr.cpp(460) : fatal error C1083: Cannot open include file: 'leptonica/allheaders.h': No such file or directory
我注意到,allheaders.h位于我之前下载的轻子文件的include目录中。我该怎么解决