我在一个历史目录中使用了光学字符识别(OCR),并试图用Microsoft来清理文本。具体来说,我需要一些帮助来编写正则表达式,以便将两行合并在一起。例如,某物
John Smith,87银行
Bldg
实际上应该是
John Smith,87 Bldg
我尝试过几种方法,但都没有成功。有人能帮我吗?
我正在尝试使用android ML Kit文本识别库进行文本识别,但在运行时遇到错误,没有返回任何文本。错误: W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found.
I/DynamiteModule: Considering local module com.google.and
下面是我测试Tesseract性能的非常简单的程序。我得到的结果并不像预期的那样,尽管这张照片质量很高,截图也很清晰(不是一张复杂的彩色图片)。请看我的代码和下面的结果。我不知道我是不是做错了什么事,或者说,魔兽世界的引擎不能处理这个问题?
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Drawing.Imaging;
using