我有很多文件,有些是手写的,有些是电脑打印的(扫描图像/pdf)。我想把它们分成两组,电脑打印的和手写的。你能指导我做这件事的方法吗?我正在使用Google Vision API进行数据提取,但是我只想从手写文档中提取数据。
添加更多细节,我通过RPA工具UiPath调用google vision api,我被限制只能使用google vision api从图像中提取数据/文本。我不寻找像Auto ML或自定义机器学习项目这样的机器学习解决方案。我正在寻找一种方法,我可以建立一个小程序,以确定文件是电脑打印或手写。程序将接受图像或pdf作为输入和输出,无论它是计算机打印或手写图像还是pdf。
任何帮助都将不胜感激。
发布于 2020-07-05 16:55:19
你可以查看opencv的template match。因为手写的单词几乎不一样,和电脑打印的单词一样,每次都可以得到一个字母模板,并检查模板的结果点。如果它包含您的模板与高度信任,它是计算机打印的。
https://stackoverflow.com/questions/62576060
复制