Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >超级好用的OCR工具,GitHub Star 7.2K,强烈推荐!

超级好用的OCR工具,GitHub Star 7.2K,强烈推荐!

作者头像
肉眼品世界
发布于 2021-01-08 02:54:35
发布于 2021-01-08 02:54:35
2K00
代码可运行
举报
文章被收录于专栏:肉眼品世界肉眼品世界
运行总次数:0
代码可运行

OCR 方向的工程师,一定需要知道这个 OCR 开源项目:PaddleOCR。短短几个月,累计 Star 数量已超过 7.2K,频频登上 Github Trending 日榜月榜,称它为 OCR 方向目前最火的 repo 绝对不为过。

12 月,它又带来四大新发布与升级,核心内容先睹为快:

  • 全新发布数据合成工具 Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升 15% 以上。
  • 全新发布半自动数据标注工具 PPOCRLabel:有了它数据标注工作事半功倍,相比 labelimg 标注效率提升 60% 以上,社区小规模测试,好评如潮。
  • 多语言识别模型效果升级:中文、英文、韩语、法语、德语、日文识别效果均优于 EasyOCR。
  • PP-OCR 开发体验再升级:支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。

PaddleOCR 历史表现回顾

先看下 PaddleOCR 自今年开源以来,短短几个月在 GitHub 上的表现:

  • 6 月,8.6M 超轻量模型发布,GitHub Trending 全球趋势榜日榜第一。
  • 8 月,开源 CVPR2020 顶会 SOTA 算法,再上 GitHub 趋势榜单!
  • 10 月,发布 PP-OCR 算法,开源 3.5M 超超轻量模型,再下 Paperswithcode 趋势榜第一

这个含金量,广大的 GitHub 开发者们自然懂,3.5M 超超轻量模型的效果图大家直接看,绝对杠杠的。

火车票、表格、金属铭牌、翻转图片、外语都是妥妥的,3.5M 的模型能达到这个识别精度,绝对是良心之作了!

传送门:https://github.com/PaddlePaddle/PaddleOCR

那么最近的 12 月份更新,又给大家带来哪些惊喜呢?

全新发布 OCR 数据合成工具:Style-Text

相比于传统的数据合成算法,Style-Text 可以实现特殊背景下的图片风格迁移,只需要少许目标场景图像,就可以合成大量数据,效果展示如下:

1、相同背景批量数据合成

2、相同文字批量数据合成

3、图片分离前景背景

除了拉风的效果,采用这样的合成数据和真实数据一起训练,可以显著提升特殊场景的性能指标,分别以两个场景为例:

怎么样,绝对是黑科技了吧。这项能力核心算法是基于百度自研的文本编辑算法《Editing Text in the Wild》。

论文地址:https://arxiv.org/abs/1908.03047

不同于常用的基于 GAN 的数据合成工具,Style-Text 主要框架包括 ①文本前景风格迁移模块 ②背景抽取模块 ③融合模块。经过这样三步,就可以迅速实现图片文字风格迁移啦。

超强 OCR 数据标注工具:PPOCRLabel

除了数据合成,数据标注也一直是深度学习开发者关注的重点,无论是从成本还是时间上面,提高标注效率,降低标注成本太重要了。PPOCRLabel 通过内置高质量的 PPOCR 中英文超轻量预训练模型,可以实现 OCR 数据的高效标注。CPU 机器运行也是完全没问题的。话不多说,直接看 PPOCRLabel 效果演示:

用法也是非常的简单,标注效率提升 60%-80% 是妥妥的。只能说,真的太香了。

最好的多语言模型效果

简单对比一下目前主流 OCR 方向开源 repo 的核心能力:

中英文模型性能及功能对比

其中,多语言识别模型准确率对比(仅 EasyOCR 提供)

测试数据及环境说明:

  • 中英文场景:针对 OCR 实际应用场景,包括合同,车牌,铭牌,火车票,化验单,表格,证书,街景文字,名片,数码显示屏等,收集的 300 张图像,每张图平均有 17 个文本框,PaddleOCR 的 F1-Score 超过 0.5,这个性能已经很不错了。
  • 多语言场景:PaddleOCR 选择了开源数据 ICDAR2017 – MLT(多语言文本识别测试集),并抽取其中的法语、德语、日语、韩语数据作为评测集合。其中测试图片大多来自于自然场景,例如广告牌、路标、海报等。

PP-OCR 开发体验再升级

动态图和静态图是深度学习框架常用的两种模式。在动态图模式下,代码编写运行方式符合 Python 程序员的习惯,易于调试,但在性能方面, Python 执行开销较大,与 C++ 有一定差距。

相比动态图,静态图在部署方面更具有性能的优势。静态图程序在编译执行时,预先搭建好的神经网络可以脱离 Python 依赖,在 C++ 端被重新解析执行,而且拥有整体网络结构也能进行一些网络结构的优化。

飞桨动态图中新增了动态图转静态图的功能,支持用户使用动态图编写组网代码。预测部署时,飞桨会对用户代码进行分析,自动转换为静态图网络结构,兼顾了动态图易用性和静态图部署性能两方面优势。

良心出品的中英文文档教程

别的不需要多说了,大家访问 GitHub 点过 star 之后自己体验吧:

https://github.com/PaddlePaddle/PaddleOCR

代码语言:javascript
代码运行次数:0
运行
复制
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 肉眼品世界 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Github Star 8.4K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!
n全新发布数据合成工具Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升15%以上。
abs_zero
2021/01/28
1.4K0
Github Star 8.4K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!
Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级
频频登上Github Trending和Paperswithcode 日榜月榜第一,
黄博的机器学习圈子
2021/04/16
1.3K0
Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级
免费的OCR识别工具就是香!
经常在网上查询文档资料的朋友一定有过这样的经历:好不容易找到了需要的内容,可是别说下载了,连复制一句话都不给复制的。尤其是 PDF 文档和图片类资料,就算我们充值下载到本地,很多也无法复制文本,只能手动敲出来。
永恒君
2022/12/06
6.3K0
免费的OCR识别工具就是香!
它会不会成为OCR领域霸主?经过一个月的分析,我得出了这些结论
文章目录 《这是我见过最强的OCR开源算法模型了》 前言 一、来吧,展示! 二、OCR简介 (一)什么是OCR (二)应用举例 (三)OCR难点 三、PaddleOCR介绍 (一)总结介绍 (二)相关地址总结 四、PaddleOCR的使用 (一)PaddleOCR项目介绍 (二)测试自己的数据 五、多维度对比分析 (一)教程的完备性对比 (二)易用性对比 (三)运行速度对比 (四)精度对比 (五)多角度对比 (六)其他分析 六、总结 《这是我见过最强的OCR开源算法模型了》 前言 最近参加“中国软件杯”的一
手撕代码八百里
2020/10/26
3.5K2
开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这四款产品。
zstar
2024/05/24
3.2K0
开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
王炸:这个GitHub 20000+ Star的OCR项目迎来四大重磅升级
机器之心发布 机器之心编辑部 PaddleOCR 可称得上 OCR 方向目前最火的 repo。 OCR 方向的工程师,之前一定听说过 PaddleOCR 这个项目,累计 Star 数量已超过 20000+,频频登上 GitHub Trending 和 Paperswithcode 日榜月榜第一,在 Medium 与 Papers with Code 联合评选的《Top Trending Libraries of 2021》,从百万量级项目中脱颖而出,荣登 Top10!在《2021 中国开源年度报告》中被评
机器之心
2022/05/10
6550
王炸:这个GitHub 20000+ Star的OCR项目迎来四大重磅升级
GitHub 大热!也许会成为你心中的OCR开源工具NO1!
前几天,小编的一个朋友跟小编吐槽, 说起最近国内一些银行科技内部在用的比较流行的几种高科技技术,其中OCR一定是逃不过去的, 但凡哪家银行想做数字化转型,从行长到老总肯定第一句就说要做OCR,但到底什么是OCR,能做什么,可能说出的人并不知道,只是知道这个名字说出来就代表着智能项目。 OCR,全称optical character recognition,意思是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析
程序猿DD
2023/04/04
1.4K0
GitHub 大热!也许会成为你心中的OCR开源工具NO1!
吊打一切现有开源OCR项目!PP-OCRv2效果再升7%,速度提升220%!
OCR方向的工程师,之前一定听说过PaddleOCR这个项目,其主要推荐的PP-OCR算法更是被国内外企业开发者广泛应用,短短半年时间,累计Star数量已超过15k,频频登上Github Trending和Paperswithcode 日榜月榜第一,在《Github 2020数字洞察报告》中被评为中国Github Top20活跃项目,称它为 OCR方向目前最火的repo绝对不为过。
用户1386409
2021/09/27
1K0
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
随着人工智能技术的逐渐成熟,计算机视觉、语音、自然语言处理等技术在金融行业的应用从广度和深度上都在加速,这不仅降低了金融机构的运营和风险成本,而且有助于提升客户的满意度,比如:利用OCR技术快速处理海量表格做信息结构化抽取和存储,大幅提升从业人员工作效率;利用NLP技术实现智能问答解决方案,帮助用户即使没有复杂的金融背景知识也能快速找到自己需要的信息。
用户1386409
2022/09/01
8570
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
关于easyocr、paddleocr、cnocr之比较
cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。cnocr目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。
python与大数据分析
2022/03/11
2.9K0
关于easyocr、paddleocr、cnocr之比较
厉害了!21.5K star,一款功能强大的自动化开源OCR识别工具!
在信息化社会,文字识别技术(OCR)发挥着日益重要的作用。无论是处理文档、识别图片中的文字,还是自动化录入信息,OCR技术都为我们提供了极大的便利。
测试开发技术
2024/07/31
6780
厉害了!21.5K star,一款功能强大的自动化开源OCR识别工具!
让OCR更简单 | PaddleOCR+OpenCV实现文字识别步骤与代码演示
本期将介绍并演示PaddleOCR+Python+OpenCV实现车牌识别、身份证信息识别和车票信息识别的步骤与效果。
Color Space
2021/03/10
9.6K2
【AI测试】已落地-python文字图像识别PaddleOCR
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
梦无矶小仔
2023/09/08
2.5K0
【AI测试】已落地-python文字图像识别PaddleOCR
用Python写了一个图像文字识别OCR工具
最近在技术交流群里聊到一个关于图像文字识别的需求,在工作、生活中常常会用到,比如票据、漫画、扫描件、照片的文本提取。
快学Python
2021/12/24
5K0
用Python写了一个图像文字识别OCR工具
GitHub Trending第一之后,PaddleOCR再发大招:百度自研顶会SOTA算法正式开源!
要说生活里最常见、最便民的AI应用技术,OCR(Optical Character Recognition,光学字符识别)当属其中之一。寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。
CV君
2020/08/21
1.6K0
GitHub Trending第一之后,PaddleOCR再发大招:百度自研顶会SOTA算法正式开源!
本周AI热点回顾:RTX3080被黄牛炒上天;百度资本助力AI 制药,已有十几位博士加入;百度联手打造AI沉浸互动展中国首秀
9 月 25 日,一家名为 "百图生科"(英文简称为 BioMap)的生命科学平台公司宣布成立;其中,百度创始人、董事长兼 CEO 李彦宏确定作为牵头发起人,并担任该公司的董事长。
用户1386409
2020/10/09
4990
本周AI热点回顾:RTX3080被黄牛炒上天;百度资本助力AI 制药,已有十几位博士加入;百度联手打造AI沉浸互动展中国首秀
Github项目推荐 | 超全预训练模型,深度学习开发工具-PaddleHub
这个项目的github地址为:https://github.com/PaddlePaddle/PaddleHub
机器学习之禅
2022/07/11
1.6K0
Github项目推荐 | 超全预训练模型,深度学习开发工具-PaddleHub
OCR产业应用实战,多类别电表读数识别方案详解
我国电力行业发展迅速,电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中,表的种类多达十几种,过去依赖人工抄表,成本很高。如果能够采集到大量电表图片,借助人工智能技术批量检测和识别,将会大幅提升效率。
用户1386409
2022/03/31
8780
OCR产业应用实战,多类别电表读数识别方案详解
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
机器之心专栏 作者:百度飞桨 最近,机器之心报道过的 PaddleOCR 项目迎来更新,发布了最新的 PP-OCR,又一次在 OCR 方向引起了大家的关注。 论文地址:https://arxiv.org/abs/2109.03144 项目地址:https://github.com/PaddlePaddle/PaddleOCR 从效果上看,PP-OCRv2 主要有三个方面提升: 在模型效果上,相对于 PP-OCR mobile 版本提升超 7%; 在速度上,相对于 PP-OCR server 版本提升超过
机器之心
2023/03/29
3.4K0
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
程序员小抄——GitHub 热点速览 Vol.44
这周热点是什么?youtube-dl!就是那个超过 72k+ star,又因为版权问题被 GitHub 关闭的项目,GitHub Trending 上一篇“哀嚎”,凡是带有 youtube-dl 字眼的项目开源当天基本上都能在 Trending 榜单上。不过,本周的热点速览并未收录 youtube-dl 相关 Repo,相比这个视频资源小抄,cheat.sh 这个 Linux / UNIX 让你可以快速了解到遗忘命令用法的“小抄”更深得我意。除了 cheat.sh 之外,vscode-stories 这个让你“窥探”到其他研发人员的编程故事的小 Repo 也是获得了海外许多研发人员的喜爱,发布不到 48 小时已经获得了超 13k 的安装量…
HelloGitHub
2021/05/14
1.2K0
程序员小抄——GitHub 热点速览 Vol.44
推荐阅读
Github Star 8.4K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!
1.4K0
Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级
1.3K0
免费的OCR识别工具就是香!
6.3K0
它会不会成为OCR领域霸主?经过一个月的分析,我得出了这些结论
3.5K2
开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
3.2K0
王炸:这个GitHub 20000+ Star的OCR项目迎来四大重磅升级
6550
GitHub 大热!也许会成为你心中的OCR开源工具NO1!
1.4K0
吊打一切现有开源OCR项目!PP-OCRv2效果再升7%,速度提升220%!
1K0
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
8570
关于easyocr、paddleocr、cnocr之比较
2.9K0
厉害了!21.5K star,一款功能强大的自动化开源OCR识别工具!
6780
让OCR更简单 | PaddleOCR+OpenCV实现文字识别步骤与代码演示
9.6K2
【AI测试】已落地-python文字图像识别PaddleOCR
2.5K0
用Python写了一个图像文字识别OCR工具
5K0
GitHub Trending第一之后,PaddleOCR再发大招:百度自研顶会SOTA算法正式开源!
1.6K0
本周AI热点回顾:RTX3080被黄牛炒上天;百度资本助力AI 制药,已有十几位博士加入;百度联手打造AI沉浸互动展中国首秀
4990
Github项目推荐 | 超全预训练模型,深度学习开发工具-PaddleHub
1.6K0
OCR产业应用实战,多类别电表读数识别方案详解
8780
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
3.4K0
程序员小抄——GitHub 热点速览 Vol.44
1.2K0
相关推荐
Github Star 8.4K,超级好用的OCR数据合成与半自动标注工具,强烈推荐!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验