我想知道YOLO (任何版本,特别是具有准确性的版本,而不是速度)是否可以对文本数据进行培训。我要做的是在文本图像中找到任何方程都存在的区域,。我问这个问题是因为:First of all I还没有找到用于文本数据的YOLO。第二,我们如何定制低分辨率不像(416,416),因为所有的图像要么是裁剪或水平主要以(W=2H)格式。请帮帮忙。任何一个Keras,Tensorflow或PyTorch都可以。
我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?例如,下面的图片是