我必须检测图像中的一些字母数字区域,然后使用Tesseract和OpenCV将它们与OCR进行转换。一个典型的例子可能是高速公路上的车牌识别(但在我的项目中,速度是没有问题的)。为了估计相机的分辨率,我需要知道镜头的距离和焦距,这可能是文本像素中的最小高度,以获得可靠的OCR转换。
利用薄透镜方程,得到了文本高度( mm )与文本高度(像素)之间的关系。出于这个原因,我想知道OpenCV和Tesseract库是否为文本的最小可靠大小设置了一些约束以获得良好的识别。我读过不同的商业
我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?例如,下面的图片是