最好用的ocr_好用的ocr_好用的ocr软件 - 腾讯云开发者社区

、、、

我希望在我制作的一款软件中使用手写识别和OCR。我想知道是否有人知道任何(最新的)支持OCR或手写识别的软件包。我正在寻找更多的免费套餐，但我也会对商业套餐感兴趣。我看过其他一些文章，比如09年的，但我找不到任何看起来合理的文章。我最好用C#编写代码，并使用Windows7内置的笔迹分析器？

浏览 2提问于2012-08-09得票数 1

回答已采纳

1回答

Nuget nuspec不使用通配符

、、、

我正在构建一个nuget包，一切正常，直到我尝试使用通配符导入文件夹中的所有dll。这个很好用 <file src="KL.Ocr.Tesseract/x86/liblept172.dll" target="content\x86"/> 但是，这不会做任何事情 <file src="KL.Ocr.Tesseract/x86/*.dll" target="content\x86"/> 感谢任何帮助(我有意将dll放在content中，而不是lib中，因为这是它们需要的位置) <?xml version

浏览 1提问于2016-06-17得票数 2

1回答

Tesseract -将多个单词图像格式化为一个OCR图像的最佳方法

、、、

我有一系列的图像，每个图像都包含一个单词。我不想单独对所有图像运行pytesseract OCR (这很好用)，而是将这些图像编译成一个大图像，然后对其运行pytesseract OCR (以减少运行时间)。设置图像格式以获得最佳效果的最佳方法是什么？(例如:它们应该水平排列、垂直排列、杂乱排列等) 另外，什么是最好的页面分割模式？我尝试了水平连接图像，然后使用PSM 7(将图像视为单行文本)，然而，这没有使用PSM 8对每个单独的单词图像运行pytesseract OCR (将图像视为单个单词)效果好。

浏览 16提问于2019-04-03得票数 2

1回答

在Matlab中对ocr设定最小置信度

、、、、

利用ocr函数进行文本提取的Matlab程序给出了许多可信度较低的假阳性。是否有任何方法将ocrtxt.WordConfidence设置为最小值而忽略所有较低的值？我希望ocrtxt.Words或ocrtxt.Text仅高于信心0.8，用于进一步的处理。 ocrtxt = ocr(regionFilteredTextMask); ocrtxt.Text;

浏览 5提问于2015-02-06得票数 1

回答已采纳

2回答

宽度适中的字体，看起来很舒服，能产生好的OCR

、

我想推荐宽度适中的字体，这些字体很吸引人，容易阅读，但也很容易用OCR处理。我很乐意将我的OCR结果从可接受推向优秀，而不必将每一种像样的、宽度相称的字体都扔到门外。我排除的字体包括OCR-A (等宽且可怕)，OCR-B (相当好，但等宽)和任何基于MICR的字体。我不是谷歌的怪物，但我花了最后一个小时寻求建议--这就是我最终来到这里的原因。;-)如果你有想法，我很乐意听听。 Θịзηη

浏览 6提问于2010-01-08得票数 2

1回答

什么类型的图像处理，我需要清楚的图像为OpenCV？

、、、

我正在开发android应用程序，用OCR捕捉图像和检测页码，我在图像上使用OpenCv进行了一些处理，现在我仍然停留在上那么下一步要做什么来获得只包含OCR号码的新图像呢？？

浏览 0提问于2015-07-08得票数 2

回答已采纳

1回答

用于ruby/rails的OCR tesseract gem -如何安装？

、、、

已正确安装tesseract-ocr gem (包括依赖项)。但是，当启动rails服务器时，我得到以下编译错误。我在这个阶段从来没有收到过编译错误，所以如果有任何帮助我将不胜感激。 server:brandlove n$ rails s /Users/n/.rvm/gems/ruby-1.9.3-p0/gems/ffi-inline-0.0.4/lib/ffi/inline/compilers/gcc.rb:29:in `compile': compile error: see logs at /var/folders/hm/6n4h3d1s49b_pxt2m51gr39c0000g

浏览 5提问于2012-10-10得票数 2

2回答

将文本和数字字符串更改为数字

、、

我目前正在使用Sikuli API中的OCR工具从以下屏幕中查找交易ID：它会找到文本，并在稍微清理后返回以下内容： My Numbers is...How最好用正确的数字替换从光学字符识别系统生成的字母字符？据我所知，这与它破译字母的方式相当一致。例如，'0‘通常以'1J’结尾，'6‘变成'b'，'7’变成'T‘。对于那些感兴趣的人，我将发布我用来使OCR工作的代码，因为大多数关于这方面的通信都超过2年了。 1)将您的Sikuli库导入到java项目中 2)在类的顶部，将设置设置为TRUE 3)设置您的

浏览 1提问于2015-10-23得票数 2

2回答

如何获得正则表达式的最近匹配

、

我有一个使用正则表达式从文本(format =mm)中提取日期的代码。备注：文本是在票据图像上使用OCR获取的。因此，预期的日期格式是，但是它可以是任何随机文本，因为它是使用OCR获得的。 import re date_reg_exp = re.compile('\d{2}[-/.]\d{2}[-/.]\d{4}') #works for mm-dd-yyyy matches_list=date_reg_exp.findall(test_str) for match in matches_list2: print match 如果我有一个字符串'This is a

浏览 7提问于2015-12-04得票数 2

2回答

用OCR将文本文档扫描到PDF

、、

我需要扫描文本文件到PDF。我发现我的佳能扫描仪的功用和VueScan的OCR很可怕。ABBYY精品阅读器的工作足够好，但我想看看其他的选择。我需要一个替代方案，比较OCR和图片质量和scan+OCR速度，并选择最佳的解决方案。操作系统Windows或Linux。预算-无限。

浏览 0提问于2016-10-03得票数 2

2回答

可靠地从扫描的文件/图像中提取身份字段？

我必须从纸张表单中提取两个预先打印(而不是手写)字段，以便在扫描之后自动路由。字段包含批处理和项标识符，如"GG-9192“或”EPN/245 g“。我试过以下软件： Tesseract-OCR 楔形佳能ImageRunner内置OCR Asprise OCR Java API (演示) 我尝试了以下设置：扫描分辨率为300 and和600 and 尝试了不同的字体，包括OCR和OCR。在所有情况下，输出几乎无处不在。我可以将无法正确提取必要信息的文档退回去，但我认为至少会有一半的信息被提取出来。我考虑了基于数据库中已知值的某种模糊逻辑，

浏览 2提问于2009-11-17得票数 2

2回答

OpenALPR:无法为新的国家/地区车牌运行train.py

、、、

我正在使用Ubuntu16.04来运行OpenALPR。我安装了它，并从我的国家的TTF字体文件中生成了字体磁贴，但在使用时遇到了问题。它应该生成[countrycode].traineddata文件，但是当我从终端窗口执行它时，我得到了以下错误： Processing: ./ae/input/lae.abudhabi.exp0.box ./ae/input/lae.abudhabi.exp0.tif Executing: /home/user123/train-ocr/tesseract-ocr/tesseract -l eng ./ae/input/lae.abudhabi.exp0.ti

浏览 2提问于2017-03-26得票数 1

2回答

关于lang='deu‘上数字的Tesseract OCR问题

、、、

今天我遇到了一个我根本无法解释的OCR问题。使用Terreract 5.0和Python3.9 我有一个非常清楚的数字：当我制作带有标准设置的OCR时，没问题，工作正常。在我的应用程序中，文本表单是99%的德语，所以我使用 text=pytesseract.image_to_string(im,lang='deu') 我从获得了语言集，它似乎在大多数非数字元素上运行得很好。它运行得很好，但是在一些非常清楚的数字上，tesseract得到了一些非常疯狂的结果。在所附图像上，OCR结果为73185879，这是非常奇怪的。我已经尝试使用一个白名单，text = p

浏览 13提问于2022-02-22得票数 0

回答已采纳

1回答

在网页中集成Tesseract OCR以及更多

、、、

如何将tesseract OCR集成到网页中，以便：用户通过由按钮激活的系统对话框(输入类型，文件)来选择文件。上传的图像将受到Tesseract脚本的影响，OCR的输出将显示在网页本身上。

浏览 0提问于2018-09-25得票数 0

2回答

包不能在docker中安装

、

我正在尝试从Dockerfile安装tesseract-ocr到docker。当我构建Dockerfile时，一切看起来都很正常，也没有得到任何错误，但是当我运行容器时，tesseract并没有安装。如果我使用sudo docker exec -t -i <container_id> /bin/bash访问容器，并使用apt-get install -y tesseract-ocr-all手动安装tesseract，它可以很好地安装和工作。当我尝试在构建过程中安装它时，为什么它不起作用？我的Dockerfile看起来像这样： FROM ubuntu:20.04 ARG DE

浏览 13提问于2020-08-13得票数 0

回答已采纳

1回答

Python -呈现一个Slanted字体

、、、、

这个问题与我的中的堆栈溢出中的答案是一致的。我正在创建一个将文本转换为图像的程序。我想用字体OCR A渲染它。但是由于OCR A字体，没有对应的斜体字体文件，我不得不手动做垂直字体的倾斜。直立字体斜字型下面是我的初始代码： from PIL import Image from PIL import ImageDraw from PIL import ImageFont import numpy as np #Returns the text size in terms of width and height. def getSize(txt, font):

浏览 4提问于2020-02-15得票数 1

2回答

图像到文本-移除python 2.7中的非ascii字符

、、、、

我正在使用pytesser对OCR进行OCR，并从中获取一个字符串： image= Image.open(ImagePath) text = image_to_string(image) print text 然而，皮特塞喜欢有时识别和返回非ascii字符。当我现在要打印我刚刚识别的内容时，问题就会发生。在python2.7(这是我正在使用的)中，程序会崩溃。有什么办法使它不返回任何非ascii字符？也许您可以在tesseract OCR中改变什么？或者，有什么方法可以测试字符串中的非ascii字符(而不破坏程序)，然后不打印这一行？有些人建议使用python3.4，但从我的研究来看，p

浏览 5提问于2014-07-24得票数 3

回答已采纳

4回答

在C#中使用MODI进行光学字符识别。需要从内存读取图像，而不是从磁盘

、、、

我正在尝试使用MODI在内存中已有的位图上执行OCR。我似乎找不到解决这个问题的方法，因为我找到的所有示例都使用create方法从磁盘中抓取图像并为OCR做准备。然而，我已经将图像存储在内存中，对磁盘的写入和读取消耗了太多时间。 Bitmap bmp = ... //Instantiate the MODI.Document object MODI.Document md = new MODI.Document(); //The Create method grabs the picture from disk snd prepares for OCR. md.Create

浏览 8提问于2010-11-03得票数 0

回答已采纳

1回答

Tesseract-OCR:需要训练所有类型的样本吗？

、

我想做一个应用程序，可以将打印的名片转换为文本。我了解到tesseract-ocr可以通过训练提高准确性。如果我希望每种类型的名片都有很高的准确率，我需要训练所有类型的名片吗？有数百种类型的名片具有不同的字体或格式。有没有其他方法可以在tesseract-ocr中达到高精度？

浏览 23提问于2016-01-22得票数 0

1回答

如何使用keras image_ocr示例预测OCR的结果？

、、、

Keras OCR示例演示了一个使用堆叠的CNN和RNN开发的非常简单的OCR系统。但是在训练之后如何使用训练好的模型来预测结果呢？

浏览 0提问于2017-09-28得票数 2

2回答

C#可能内存泄漏？

、、

因此，我有一个用C# (vs2010)编写的应用程序，它使用tesseract 3.02DLL和Charles的terreract .net包装器执行OCR。我想我有一个内存泄漏，它似乎在分配Pix对象的代码区域。我正在获取一个PDF，将其转换为灰度PNG，然后将其加载到OCR的Pix对象中。当它起作用的时候，它真的很好用。图像的大小很大(每个昏暗中有5100个像素)，但不是那么大(只有500 K左右)。我的代码：应用程序启动时的Init引擎： private TesseractEngine engine = new TesseractEngine(@"./tessdata/&#

浏览 16提问于2014-03-24得票数 0

回答已采纳

2回答

用最老更新第一行，用第二最老更新第二行，依此类推

、、、

我很难用SQL Server编写一个没有关系的更新。我看遍了整个论坛，但我很难找到答案。我需要更新的OCR从客户，金额是匹配的。问题是这不是唯一的钥匙。因此，如果有更多的记录来自客户，金额组合，我需要采取最古老的匹配在查找表和更新OCR从它。然后，我需要取第二个最老的，用它的OCR更新第二行。我试着把它想象在下面的表格里。欢迎所有建议！要更新的表-更新前的 Customer OCR Amount 740000010417 220.000 740000010417 220.000 740000010421

浏览 4提问于2011-11-18得票数 1

回答已采纳

10回答

OpenCV检测号码

、、

我在iPhone上使用iPhone，需要检测图像中的数字。我将图像分割成较小的图像，因此每个图像只有一个数字(1-9)。所有的数字都是打印出来的，不是手写的。用OpenCV计算数字的最佳方法是什么？更新：我已经成功地找到了数字并提取了它们。它们看起来是这样的：当它们被提取时，它们大小相同，依此类推。我保存了一堆图像，并将它们放在OCR dir中，在那里它们被分类为数字。类似: ocr/1/100.jpg 101.jpg.和ocr/2/200.jpg 201.jpg. 然后，我将使用与基本OCR教程中相同的方法：但是，我正在为iPhone编程，不能使用C++代码(编译错误等等)，也

浏览 10提问于2011-05-03得票数 20

1回答

通过平台通道使用摄像头

我有一个使用OCR库的java代码，可以使用java代码(初始化摄像头，识别，结果)来使用平台通道吗？我不知道如何在java代码中使用activity。

浏览 2提问于2020-07-10得票数 1

1回答

遇到问题培训tesseract

我刚接触tesseract，对github页面中的不同目录感到有点困惑。 tesserac-ocr代码库就是我安装的。在/usr/local/share/ tessdata /中安装了tessdata目录因此，现在在训练tesseract时，我运行以下命令- # tesseract img.tif img box.train 我得到以下错误 Tesseract Open Source OCR Engine v3.03 with Leptonica Error opening data file /usr/local/share/tessdata/eng.traineddata Please

浏览 1提问于2015-08-16得票数 3

2回答

OCR -大多数“不同的”或“可识别的”ASCII字符？

、、、

我正在寻找一种方法来确定最“不同”或“可识别”的N个ASCII字符...例如，如果N= 10，从0x21到0x7E的ASCII集合中最不同的N个字符是什么？显然，字符"X“与"O”(字母)非常不同，但"O“(字母)与"0”(零)非常相似。假设一个受限的OCR字符子集，这样0和字母O将被检测为一个或另一个，并且不必担心它是零还是字母O，那么典型的OCR引擎(例如Tesseract)很容易从质量较差的输入图像中识别出的最不同的N个字符是什么？假设。例如"+“和"t”会被广泛地误认为是另一个。因此，每个输入字符，无论是"+“还是"t”，

浏览 0提问于2009-09-11得票数 1

回答已采纳

2回答

添加或遍历链表时出现问题

、

我在添加或遍历链表时遇到问题。主item类由另一个类使用，但我可以添加正确的数量，但看起来当我向列表中添加更多数据时，应用程序将不再工作。我不确定错误的确切位置。我知道，当我试图遍历列表时，应用程序会崩溃。任何想法或任何改进都将不胜感激。我可以通过将AddOccurence方法更改为不执行while循环来避免崩溃。做 void Item::AddOccurence(int Item,int placeInLine){ ItemOccurence* ocr=myHead; if(ocr) { } 而不是 void Item::AddOccurence(in

浏览 0提问于2010-07-01得票数 1

回答已采纳

1回答

图像操作库

、、、

我需要一个主要用于颜色处理的库，我想让图像变得黑白，并增强对比度，这样Tesseract (Google OCR库)就可以更好地阅读我扔给它的图像。或者如果有人对如何改进Tesseract结果有更好的想法，我完全支持。

浏览 2提问于2011-09-20得票数 1

回答已采纳

2回答

进行基本数字识别的最好方法是什么？

、、、

我想在Android上使用简单的OCR检测从0到9的基本英语数字。我一直在寻找Android的OCR，但对于我的主要目的来说，它太复杂了，有没有更简单的方法来检测Android上的数字？

浏览 3提问于2011-12-25得票数 5

回答已采纳

1回答

复位AVR计时器溢出寄存器

、

我有一个，我正在尝试设置一个计时器中断，这样如果一个进程花费太长时间，它就会关闭。我将计时器设置为： void init_software_interupt(double time) { OCR1A = time; TCCR1A = 0; TCCR1B = 0; TCCR1B |= (1 << WGM12); TCCR1B |= (1<<CS10); TCCR1B |= (1<<CS12); TIMSK |= (1 << OCIE1A); sei(); } 这个很好用。我计算了一个

浏览 2提问于2013-11-10得票数 3

回答已采纳

1回答

取消装箱opencv矩形

、、、、

我正在用光学字符识别一堆pdf文件。这很好用，但pdf的某些部分是黑色的。实际上，它们并不是真正的黑线，而是“矩形内有一些文本”。这篇文章弄乱了我的OCR，即使是在使用单词列表来定位'(10)(2e)‘的各种组合时也是如此。我正在与.jpg的，从包含机器人文本和图像(与文本在它)的pdf格式转换。下面是一个示例： ? 由于'(10)(2e)‘的许多变体弄乱了我的OCR，我的目标是找到所有可能包含'(10)(2e)’的矩形并填充它们。为了找到矩形，我遵循了来自nathancy的一个很棒的答案：How to detect all rectangular boxe

浏览 22提问于2021-06-28得票数 0

回答已采纳

1回答

用枕头Image.open迭代文件夹

、、

我试图迭代一个文件夹的.png文件和OCR它们。迭代可以工作，但是一旦我尝试用PIL打开图片，它就会产生错误。 import pytesseract from PIL import Image import os for filename in os.listdir('C:/Users/Artur/Desktop/Sequenz_1'): if filename.endswith('.png'): print(filename) 这个很好用。它打印文件夹中的每个.png文件名。但当我尝试OCR时： import pytesseract

浏览 0提问于2018-07-04得票数 2

回答已采纳

6回答

关于在黑板图像上使用OCR的建议

、、、、

我正在试着得到一张OCR可读的黑板图像。当然，大多数OCR软件不喜欢肮脏的图像。我应该尝试通过什么图像处理来清理图像？

浏览 3提问于2010-05-18得票数 1

回答已采纳

1回答

文件名中附加字符复制的bash脚本文件

、

我正在编写bash脚本来复制一些配置文件。我使用sudo bash configure.sh运行该文件。 #!/bin/bash cp config/ocr_pattern /usr/share/tesseract-ocr/tessdata/ocr_pattern cp config/ocr_config /usr/share/tesseract-ocr/tessdata/tessconfigs/ocr_config 但是，当我查看所做的更改时，ocr_config被正确地复制，但是ocr_pattern被复制，ocr_pattern?作为文件名而不是ocr_pattern。在?的文件名后面还

浏览 2提问于2016-10-03得票数 0

回答已采纳

1回答

按文件夹从R中指定路径分配的文件

、

我有csv文件，它指示指向它们文件夹中的jpg文件的路径。列指示必须在其中复制jpg的文件夹的名称，在行中，它们的原始文件夹中有指向jpg的路径(必须从这些路径中复制)。通过dput()共享示例 mydata=structure(list(x1 = structure(c(2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 1L, 1L, 1L), .Label = c("", "C:\\Users\\OCR\\Downloads\\OCR pass 2\\input\\17992279.png", "C:\\Users\\

浏览 2提问于2019-10-31得票数 0

回答已采纳

1回答

通用文字识别解码失败？？？

、、、

message:FailedOperation.ImageDecodeFailed-图片解码失败 requestId:****** 就这么一段话,也没有失败原因啊. ocr.tencentcloudapi.com 用的腾讯云自动生成代码, <dependency> <groupId>com.tencentcloudapi</groupId> <artifactId>tencentcloud-sdk-java</artifactId> <ver

浏览 715提问于2020-01-08

2回答

iPhone的Tesseract限制？用于ios的任何其他OCR引擎

、

我想使用Tesseract作为我的iphone应用程序，但是它不能识别低分辨率的图像文本，所以对于iPhone SDK来说，Tesseract OCR的局限性是什么？

浏览 5提问于2013-10-01得票数 0

回答已采纳

2回答

在windows中，tesseract命令不能从命令行执行

、、

我安装了windows的tesseract-OCR，它位于我系统的C:\Program Files\Tesseract-OCR路径中。我通过在PATH变量中添加C:\Program Files\Tesseract-OCR来设置环境变量。我还将系统变量中的TESSDATA_PREFIX设置为上面相同的tesseract位置。尽管如此，当我尝试运行命令"tesseract some path\image.tif somepath\output“时，它给出的消息是"'tesseract‘未被识别为内部或外部命令”。当我从tesseract的安装位置运行相同的命令时，它

浏览 1提问于2017-08-20得票数 1

3回答

Regex:只匹配前面小写字母的字符

我想清理一个字幕文件，因为OCR有很多错误。错误之处在于l被显示为I。当然，有时I实际上是一个I，主要是在以下情况下：句子的开头：- I'm Ieaving....In或IsabeIIe.Maybe名称：IsabeIIe.Maybe几个奇怪的例子。由于名字很难检测，所以我想最好用一个或多个大写字母替换I，然后手动检查剩下的字母。因此，在转换后，我得到了I'm Ieaving和Isabelle。这是我能想到的最“巴累博”自动解决方案，因为大写字母前面没有那么多小写字母。我在Regex怎么能这么做？提前谢谢。

浏览 4提问于2012-05-10得票数 2

回答已采纳

1回答

使用GNU并行组合两个命令用于OCR项目

、、、、

在编写文本文件之后，我想编写一个脚本，它运行一个命令到OCR pdfs，它删除结果图像。我想要组合的两个命令如下。此命令创建文件夹，从每个pgm中提取PDF并将它们添加到每个文件夹中： time find . -name \*.pdf | parallel -j 4 --progress 'mkdir -p {.} && gs -dQUIET -dINTERPOLATE -dSAFER -dBATCH -dNOPAUSE -dPDFSETTINGS=/screen -dNumRenderingThreads=4 -sDEVICE=pgmraw -r300 -dTex

浏览 1提问于2017-07-11得票数 1

1回答

如何在Python OpenCV中从find等值线函数中旋转边框？

、、

我有以下图片：我使用OpenCV在这幅图像中找到轮廓，以便将"122“分为"1”、"2“和"2”。我正在使用OCR对后面的数字进行分类。我使用的代码如下： invert = cv2.bitwise_not(image) gray = cv2.cvtColor(invert, cv2.COLOR_BGR2GRAY) blurred = cv2.GaussianBlur(gray, (5, 5), 0) # perform edge detection, find contours in the edge map, and sort the # resu

浏览 19提问于2022-11-30得票数 0

1回答

在现有Visual C++项目中使用Tesseact OCR

、、、

我想在我已经存在的C++项目中使用Tesseract-OCR库。我遵循了这个中提到的步骤。我从中克隆出了Github 运行build_tesseract.bat 打开“tesseract.sln”并将“tesseract”设置为启动项目，然后将其编译为“release”和“debug”配置成功编译后，在“调试”和“发布”文件夹下，我有一个.lib文件列表现在我不知道怎么从这里继续前进了。我习惯于添加包含目录的库。在这里，除了“调试”和“发布”配置的.lib文件之外，我找不到这样的目录。有人能告诉我如何使用这些文件将'tesseract-OCR‘API添加

浏览 16提问于2021-01-18得票数 1

回答已采纳

1回答

区域性名称: en-US-EN不是受支持的区域性扩展

、、

大家好，我有一个用java编写的代码，在net beans中运行得很好，但是当我想在eclipse中运行时，这个异常出现了。 Exception in thread "main" class com.aspose.ocr.internal.g: Culture Name: en-US-EN is not a supported culture com.aspose.ocr.internal.aP.b(Unknown Source) com.aspose.ocr.internal.aP.<init>(Unknown Source) com.aspose.ocr.in

浏览 0提问于2014-09-02得票数 0

1回答

C++/Qt中未定义的参考错误

、、、、

我正在尝试将Tesseract OCR库包含到我的Qt项目中。我已经按照指示做了每件事，但不起作用。 tesseract::TessBaseAPI *myOCR = new tesseract::TessBaseAPI(); 错误-对`tesseract::TessBaseAPI::TessBaseAPI()'的未定义引用就像我想的，这是连接问题，但我不确定。查看一下.pro文件(只有必要的代码)： unix|win32: LIBS += -L$$PWD/../../Tesseract-OCR/lib/ -llibtesseract302 INCLUDEPA

浏览 0提问于2015-06-25得票数 1

1回答

从图像中提取单词或短语区域的最佳方法是为了进一步的识别？

、、、、

解决方案必须是通用的(使用不同的字体和颜色)和稳定。输入数据以X，Y坐标为点，输出数据为矩形或多个复形，包含单词或短语。现在我使用选项对整个图像进行tesseract识别，然后从输出html中提取所有矩形，最后找到最接近点的反应角。代码如下所示。但这是低效率的，因为整个图像识别。当然，可以识别的不是整个图像，而是部分，但这也不是一个清晰的解决方案，因为不同的字体大小和无用的单词都是一样的。更新 public class WordRecognizerTesseractHocr { const string HelperFileName = "temp";

浏览 0提问于2012-09-17得票数 1

1回答

在你自己的代码中实现Asprise

、、

我已经将Asprise下载到我的系统中，但我无法在自己的代码中实现OCR。在运行之前，我没有收到任何错误。我现在得到的错误是:错误:无法找到或加载主类有没有人尝试过在自己的代码中实现OCR，如果是，是如何实现的？我遵循了Asprise中的开发人员指南，但没有成功测试代码:导入com.asprise.ocr.Ocr；导入java.io.*；公共类OCRTester { public static void main(String[] args) { Ocr.setUp(); // one time setup Ocr ocr = new Ocr(); ocr.

浏览 6提问于2017-02-23得票数 1

1回答

基于Tesseract OCR和python的数字识别

、、

我使用Tesseract和python读取数字(从能量计)。除了数字"1“，一切都运行得很好。Tesseract无法读取"1“数字。这是我发送给tesseract的图片：它读着"0000027“。我如何告诉Tesseract，垂直杆是一个"1“？这是我的初始化： import tesseract TESSERACT_LIBRARY_PATH = "C:\\Program Files (x86)\\Tesseract-OCR" LANGUAGE = "eng" CHARACTERS = "0123456789

浏览 6提问于2015-09-24得票数 5

回答已采纳

1回答

从OpenCV python中读取图像后提供图像时出现类型错误

、、、

我第一次尝试使用YOLO对象检测，在此期间，在向程序证明图像后，我得到了类型错误。我正在使用cv2.imread()函数从opencv读取图像，并在经过一些图像处理后将其提供给yolo，但我收到了"Type Error“。我提供了代码的图像，其中我得到了错误： def ocr_function(image): start = time() try: ocr_threshold = 0.4 ocr_weights = b'data/ocr/ocr-net.weights' ocr_netcfg =

浏览 23提问于2019-11-29得票数 1

1回答

在Xamarin.Android中制作响应响应的可重调整的矩形

、、、

我用相机视图在Xamarin.Android中做了一个矩形。但也有很多问题，比如- 没有真正的反应拖角滞后到目前为止我在CameraLayout.xml的尝试 <ImageView android:id="@+id/Center_Point_photo" android:layout_width="80px" android:layout_height="80px" android:src="@drawable/center_point"

浏览 0提问于2020-01-29得票数 1

回答已采纳

1回答

有没有办法知道低于某个特定值的颜色的RGB值是较浅的颜色

、、、、

我正在尝试使用Tesseract OCR和楔形OCR从图像中获取文本。但是，如果文本的字体较小或字体较细，则生成的文本中会出现错误。我们需要获取文本的大多数图像都以较暗的颜色返回文本，而图像的其余部分则以较浅的颜色返回。因此，我正在考虑将所有较亮的颜色转换为白色，然后增加缓冲图像的大小，这样得到的文本将是正确的。(如果我的方法错误，请纠正我)。

浏览 1提问于2017-06-15得票数 0