首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用模糊文本改进Tesseract OCR结果

用模糊文本改进Tesseract OCR结果
EN

Stack Overflow用户
提问于 2014-12-27 21:56:35
回答 1查看 3.4K关注 0票数 16

我正在致力于印刷文本的OCR识别。特别是,我着重于预处理步骤,以改进特塞尔引擎的结果。通过自适应阈值处理、噪声去除、文本分割等,取得了良好的效果。但是,当其他商业产品获得不错的结果时,Tesseract似乎还是失败了。

我使用了下面的测试映像,下面是与两个商业OCR相比,Tesseract 3.04获得的结果。所有3项服务都提供了相同的二值图像,其中包含了一些稍微模糊的文本。

Tesseract

代码语言:javascript
运行
复制
Careers in Technology Consulting

Networking Lunch
21 m 2014, 11:00 - 14:30

Definingthecorporatellstmtegy, Wammmwdngdeal, creating
uniquebwinessisighnwilgbigdam-doesflismflxemmyouafioy?

Findoutmoreabanhowitfeektomkasatedlflogymbyjoiningour

for further mm please visit mAeloittexom/weers

ABBYY 精品在线阅读器

代码语言:javascript
运行
复制
Careers in Technology Consulting
Networking Lunch
21 November 2014,1140-14:30
Defining the corporate IT strategy, planning a multHnKon <Mar outsourcing deal, creating unique business insights using big data-doesthis sound Ifce something you enjoy?
Find out more about hour it feels to work as a technology consultant by joining our exclusive networking lunch,
For further information please visit wrwMuleloittexom/carcert

在线OCR

代码语言:javascript
运行
复制
Careers in Technology Consulting Networking Lunch 21 November 2014, 11;00 —14:30 
Defining the corporate IT strategy, planning a muiti-indlimi dollar outsourcing deal, creating unique business insights using big data—does this sound like something you enjoy? 
Find out more about how it feels to work as a tedmology consultant by joining our exclusive networking lunch, 
For further information' please visit wwwdeloitte,com/careers 

现在,我想知道Tesseract和其他两种产品之间的巨大差距是由于不同的引擎(当然,ABBYY使用自己的引擎,不确定OCR )还是在运行Tesseract之前可以执行其他一些预处理步骤。你有什么意见建议?

EN

回答 1

Stack Overflow用户

发布于 2017-03-29 10:21:23

这里有一个关于“魔术”OCR预处理的建议。为了解释提议的预处理思想的原理,让我们考虑从所提供的文本图像中摘录一段,所有测试的OCR都失败了:

并运用了一些“预处理-智慧”。首先是通常的阈值:

然后一些“魔法”,通过文字元素拍摄垂直线,检测最大。2像素高的“条形图”,并将它们切在边缘,同时将单词元素切割到其底线:

现在,通过图片中的文字元素从拍摄线切换到水平元素,以便检测到非常宽的“条形图”,并在其宽度的中间垂直切割它们:

这将有助于任何OCR引擎提供更好的结果,这一特定的图像.我可以想象,一些商用OCR引擎已经能够提供比这个测试更好的识别能力。

在这种情况下,让我提到另一个在Ubuntu存储库中可用的免费OCR引擎(类似于tesseract)。通过相互测试,你会更想知道它们是如何提供不同的结果的,然后查看它们的源代码来了解:),并从这些经验中推断出一些关于商业结果的东西。

代码语言:javascript
运行
复制
sudo apt-get install cuneiform gocr ocrad
票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27671811

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档