前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >工业常见PCB、数码管字符识别难?这个OCR工具你值得拥有!

工业常见PCB、数码管字符识别难?这个OCR工具你值得拥有!

作者头像
threeQing
发布2022-11-08 13:57:57
1.9K0
发布2022-11-08 13:57:57
举报
文章被收录于专栏:机器视觉那些事儿

背景

我国作为制造业大国,智能制造升级需求旺盛。近年,相关部委围绕智能制造接连推出政策,促进产业向强向优升级。以人工智能、5G、大数据为主的技术在制造升级的过程中扮演关键作用,例如,在智能装备制造的感知层面,以深度学习为基础的目标检测、文字识别、语义分割等技术在工业制造的各场景中应用广泛。

文字识别技术(OCR)在制造业中的应用场景大多分布在产品追溯、智能监控、仓储物流、缺陷检测等,通过算法自动批量完成图片信息中的文字提取,降低企业人力重复手动录入信息的人力成本,增加生产效率。

图1 OCR应用场景全景图

在这些场景中,图片的获取方式往往通过对真实场景拍照,属于自然场景下的文字识别技术,其特点在于文字形态和设备类型涉猎广泛,面临的问题包括:

这些场景属于自然场景下的文字识别技术的应用范畴,图片的获取方式往往通过对真实场景拍照,特点在于文字形态和设备类型涉猎广泛,面临的问题包括:

  • 自然场景下文字形态丰富多样,透视变换、模糊、光照、干扰问题多;
  • 一些场景中设备器材、文字排列类型丰富,对模型泛化性要求高
  • 实际采集数据受限于设备或场景,数据量有限
  • 垂类数据集中缺乏针对性的模型调优技巧

图2 电表场景下的数据出现遮挡、光照不足、类型多样、模糊等问题

解决方案:

飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3,经过海量数据训练,达到产业级SOTA效果,在垂类场景中泛化性好。同时,PaddleOCR配套数据合成、标注及22种训练部署方式,打造全流程开发体验,助力产业界快速落地OCR应用。

图3 PP-OCRv3效果动图

图4 PaddleOCR全景图

项目地址:

https://github.com/PaddlePaddle/PaddleOCR

场景1:

PCB质量监控中的小尺度文字识别

印刷电路板(PCB)是电子产品中的核心器件,对于板件质量的测试与监控是生产中必不可少的环节。在一些场景中,通过PCB中信号灯颜色和文字组合可以定位PCB局部模块质量问题,这其中裁剪出的PCB图片宽高比例较小,文字区域整体面积也较小。针对本场景,PaddleOCR基于全新 PP-OCRv3通过合成数据、微调以及其他场景适配方法完成小字符文本识别任务,满足企业上线要求

图5 PCB小尺度文本识别示意图

场景2:

光功率计数码管字符识别

光功率计是测量光纤系统中的光功率仪器,通信公司会留存大量光功率计图片并记录功率计数值。通常,光功率计的字符以数码管形式呈现,与一般文字的形态有所差异。PaddleOCR基于PP-OCRv3的识别模型 和顶会算法SVTR_Tiny分别在本场景数据上进行微调与对比训练,择其最优,最终实现针对数码管字符的识别模型,识别精度满足生产需求。

图6 手持光功率计(左)与OCR识别效果(右)

PaddleOCR项目地址:

Github:https://github.com/PaddlePaddle/PaddleOCR

Gitee:https://gitee.com/PaddlePaddle/PaddleOCR

注:上述图片均来源于网络

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器视觉那些事儿 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档