我正在使用OCR输出,并在其中搜索特殊的单词。
由于输出不干净,我根据低于特定阈值的字距查找与输入匹配的元素。然而,我认为Levenshtein距离或Hamming距离并不是最好的方法,因为OCR似乎总是犯同样的错误:I表示1,0表示O,Q表示O。例如,这些“经典”错误似乎不如"A for K“那么重要。是否有专门为OCR设计的字距算法,我可以使用它更适合我的情况?还是应该根据文字的视觉差异来实现我的自定义单词距离呢?
我使用OCR读取难以辨认的表格数据。来自OCR的数据包含大量的排印和错误提取的项。应该从表中提取正确的数据结构的定义。我的任务是找到一个过程来清理来自OCR的数据并提取尽可能多的有用的数据点。例如:宽度-以米表示的0.01至10.0范围内的十进制值颜色字符串我从OCR得到:
weion: 14 ko
欧洛威: