我正在尝试制作一个“测验扫描器”,它使用OCR在线扫描测验,这样我就可以自己从在线来源汇编测验,以便能够离线回答它们。我厌倦了复制和粘贴的事情,只使用OCR代替。我对光学字符识别部分没有问题,因为我现在遇到的问题是,我需要将问题从选择中分离出来,从正确和错误的选择中分离出来。下面是我尝试分离它们的一个过于简化的代码。真的需要你的帮助,一如既往的堆栈溢出社区 import re
scannedmcq = 'Insert Question Here @ A(correct) > B > C > D
我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或检测不正确的文本?例如,下面的图片是