背景
我国作为制造业大国,智能制造升级需求旺盛。近年,相关部委围绕智能制造接连推出政策,促进产业向强向优升级。以人工智能、5G、大数据为主的技术在制造升级的过程中扮演关键作用,例如,在智能装备制造的感知层面,以深度学习为基础的目标检测、文字识别、语义分割等技术在工业制造的各场景中应用广泛。
文字识别技术(OCR)在制造业中的应用场景大多分布在产品追溯、智能监控、仓储物流、缺陷检测等,通过算法自动批量完成图片信息中的文字提取,降低企业人力重复手动录入信息的人力成本,增加生产效率。
图1 OCR应用场景全景图
在这些场景中,图片的获取方式往往通过对真实场景拍照,属于自然场景下的文字识别技术,其特点在于文字形态和设备类型涉猎广泛,面临的问题包括:
这些场景属于自然场景下的文字识别技术的应用范畴,图片的获取方式往往通过对真实场景拍照,特点在于文字形态和设备类型涉猎广泛,面临的问题包括:
图2 电表场景下的数据出现遮挡、光照不足、类型多样、模糊等问题
解决方案:
飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3,经过海量数据训练,达到产业级SOTA效果,在垂类场景中泛化性好。同时,PaddleOCR配套数据合成、标注及22种训练部署方式,打造全流程开发体验,助力产业界快速落地OCR应用。
图3 PP-OCRv3效果动图
图4 PaddleOCR全景图
项目地址:
https://github.com/PaddlePaddle/PaddleOCR
场景1:
PCB质量监控中的小尺度文字识别
印刷电路板(PCB)是电子产品中的核心器件,对于板件质量的测试与监控是生产中必不可少的环节。在一些场景中,通过PCB中信号灯颜色和文字组合可以定位PCB局部模块质量问题,这其中裁剪出的PCB图片宽高比例较小,文字区域整体面积也较小。针对本场景,PaddleOCR基于全新 PP-OCRv3通过合成数据、微调以及其他场景适配方法完成小字符文本识别任务,满足企业上线要求。
图5 PCB小尺度文本识别示意图
场景2:
光功率计数码管字符识别
光功率计是测量光纤系统中的光功率仪器,通信公司会留存大量光功率计图片并记录功率计数值。通常,光功率计的字符以数码管形式呈现,与一般文字的形态有所差异。PaddleOCR基于PP-OCRv3的识别模型 和顶会算法SVTR_Tiny分别在本场景数据上进行微调与对比训练,择其最优,最终实现针对数码管字符的识别模型,识别精度满足生产需求。
图6 手持光功率计(左)与OCR识别效果(右)
PaddleOCR项目地址:
Github:https://github.com/PaddlePaddle/PaddleOCR
Gitee:https://gitee.com/PaddlePaddle/PaddleOCR
注:上述图片均来源于网络