我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?
我正在向我的节点快速服务器添加一个新功能,它将允许我上传一个驱动程序ELD每日日志,并从该图像/ pdf中获取时间驱动、启动时间、结束时间、午餐等信息。我已经研究过将pdf转换成csv / json / html,但问题是,这是一个没有标签的混乱。因此,我正在计算,试图以某种方式读取和创建一个图表,类似已经在eld日志上的图表。
IF line exists in segment call proceed and log data ELSE check segments "SB" "D" "