我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?
我希望客户端能够上传bmp/jpg/tif任何(我可以指定)的打印pdf的图像,并将其转换为csv/tab/具有这两列的值的任何文件。谁能推荐一个我可以从php web PHP访问的ocr包,或者我可以从win32应用程序(Delphi9)使用的Windows?这不一定是免费的套餐;我愿意付钱。我知道,您可以在PDF格式的表单,并重新处理这些…这不是我需要的。我需要有问题地对打印文档进行OCR。
我正在使用PHP,并希望使用(而不是版本2)对几幅图片执行ORC (文本检测)。如您所知,在版本3中不再存在insert方法,我必须使用create或copy来执行ORC。下面是我使用的代码:
function GetORC($filename){ require_once 'google-api-php-client-2.0.0-RC7/vendor/autoload.php'; $client = new Google_C