OCR简称Optical Character Recognition,它是指对于纸上的打印的文字字符进行识别,将识别结果以文本方式存储在计算机器中。根据识别的字符类型通常可分为印刷体识别和手写体识别两大类。
字符识别原理:通过对特征点形状的提取,分离器分离字符,然后进行文本的输出。
我们以手写字体为例进行讲解,识别的步骤如下:
1.打开机器视觉软件。
2.采集图像。点击软件界面“工具箱”-->“图像处理”-->“采集图像”,将采集图像工具拖至流程栏,如图一所示。采集图像的方式有文件、目录、相机三种方式,我们选择“文件”下采集,如图二所示。在电脑的文件夹中,选择格式为JPG或BMP格式的图片。
图一
图二
3.字符识别工具添加。添加“字符读取”和“字符集合”工具至流程栏,如图三所示
字符读取:用于读取字符文本,需要将标准的字符录入字符集合中。
字符集合:配合“字符读取”工具使用,用于存储字库模板。
图三
4.选择输入图像。点击流程栏的“字符读取”,选择输入的图像为“Task.1采集图像”。如图四所示。
图四
5.设置检测区域。在区域设置中,选择矩形方框,拖动到检测的字符区域,如图五所示。
图五
6.衔接“字符集合”,参数设置。进行分割参数设置(阈值、字符极性、字符宽度、字符 高度)和识别参数设置(最小分数设置)。如图六所示。
图六
通过调整参数来达到将字符逐个分割,如图七所示。
图七
7.学习字符。如图八所示,选择单个学习或全部学习,如图久所示,将图像中的字符逐个输入在学习字符的对话框内,然后“执行”。
图八
图九
8.结果显示。将“系统工具”下的“数据显示”,将拖至流程栏,点击“数据显示”,添加数据文本为“字符读取”的文本,点击确定。
图十
最终的识别结果如下图所示。
以上为手写字符识别的全部过程,由于手写字体具有随机性、自由化程度高,识别起来比印刷字符困难,因此需要大量的学习才能达到快速正确的识别。
总结:
字符识别流程如下图所示
想了解更多的机器视觉知识,欢迎关注我们的公众号,后续会定期的更新内容。
关于文章中所使用的视觉识别软件,可以撩我们的客服小姐姐获取
还不快来撩我,获取机器视觉资料!!!
End
领取专属 10元无门槛券
私享最新 技术干货