如何从包含各种嘈杂文本和数字的图像中提取文本？

文章/答案/技术大牛

发布

1回答

python-3.x、python-tesseract、text-extraction、amazon-textract

我需要从这个图像中提取仪表读数，这是"0005053“在中心。= pytesseract.image_to_string(Image.open("Screen_Shot_2564-08-25_at_11.23.13.png")) print(text) 我得到的输出是我发现的另一个服务是AWS Textract，它非常准确，但我找不到一个用python实现它的变通方法。任何线索都将不胜感激。有什么办法解决这个问题吗？谢谢

浏览 25提问于2021-08-26得票数 0

回答已采纳

1回答

如何用Microsoft.media.ocr制作带有包围框覆盖的实时摄像头，这样用户就可以在UWP中触摸和使用文本到语音？

windows、uwp、ocr

我已经实现了实时摄像头和使用Android文本识别，当我触摸边界框覆盖，文本到语音作品，但在通用窗口，应用程序无法获得任何文档，谁能帮助如何实现在实时相机OCR？

浏览 0提问于2018-04-16得票数 0

回答已采纳

3回答

如何使用OpenCV获取图像中所有文本的位置？

python、opencv、machine-learning、image-processing、deep-learning

我有一个图像，其中包含文字(数字和字母)。我想知道这张图片中所有文本和数字的位置。另外，我也想提取所有的文本。如何获取图像中的坐标以及所有文本(数字和字母)？

浏览 2提问于2020-01-17得票数 9

回答已采纳

1回答

如何提高Tesseract的效果

c++、image、opencv、image-processing、tesseract

我希望在使用OpenCV和tesseract时检测图像中的文本。我的步骤是：然而，tesseract

浏览 3提问于2017-03-02得票数 3

1回答

Azure OCR或其他Azure认知功能从PDF中读取文本

azure、pdf、computer-vision

我有一个项目，我必须从URL或Blobs中读取PDF，并从其中提取文本以供使用Azure认知索引/搜索/我正在学习使用计算机视觉的示例，并且只能解析和提取图像文件中的文本。我环顾了一下，发现有些人提到了这种功能，但是它非常稀少，我找不到Github的例子来做PDF文档。任何关于在哪里寻找的建议或建议。我知道亚马逊有纺织品，但我的</e

浏览 2提问于2021-02-15得票数 2

回答已采纳

1回答

如何区分PHP中的“文本”PDF和“图像”PDF？

php、pdf、tesseract、ghostscript、xpdf

我最近建立了一个Linux服务器，可以使用Xpdf的一部分pdftotext命令将基于文本的Xpdf转换为文本，还可以使用gs (Ghostscript)和tesseract命令的组合将基于图像的Xpdf转换为文本。当我已经知道PDF是基于文本还是基于图像时，这两种解决方案都能很好地工作。但是，为了自动化将许多PDF转换为文本的过程，我需要能够判断PDF是基于<e

浏览 5提问于2016-09-23得票数 1

回答已采纳

3回答

如何提取OCR特定颜色的像素？

image-processing、imagemagick、ocr、tesseract、vips

我想通过OCR (可能是Tesseract)运行一些小图像/精灵，并从中提取一个或多个单词，我知道这些数字/单词将具有特定的颜色(让我们在嘈杂/有色的背景上说是白色的)。在阅读关于OCR图像预处理的文章时，我认为只从图像中删除所有非白色的东西是非常有益的。我同时使用imagemagick和vips

浏览 2提问于2020-08-07得票数 2

回答已采纳

1回答

如何使用pdfbox获得pdf的最大fontsize

object、font-size、pdfbox、pdf-extraction

我使用pdfbox从pdf中提取一些信息，但是如何提取每个对象的信息？如果其中一个包含流，我如何解码该流以显示？我能从一个pdf框中得到最大字体大小的吗？我想如果我能得到每个对象的字体大小并对它们进行排序，那么我就得到了具有最大字体大小的对象？

浏览 8提问于2015-03-23得票数 1

1回答

OCR识别奇怪的字符。为什么？

character、ocr

我正在使用OCR通过tess-two项目开发一个使用Tesseract Libs的安卓应用程序，就像我在这里看到的：在搜索中，我配置了这个：baseApi.setVariable("tessedit

浏览 1提问于2012-11-22得票数 1

1回答

通过html编辑pdf

android、pdf、annotations、itext、ocr

我不确定这里是否适合这个问题，但我找不到任何其他的建议媒介。

浏览 3提问于2013-06-02得票数 0

回答已采纳

3回答

我怎样才能提高Tesseract的结果质量？

ios、swift、tesseract

我正在尝试使用Tesseract的OCR从法国的重要卡中读取NIRPP号码(社会保险号码)(我使用的是TesseractOCRiOS 4.0.0)。所以我要做的是：然后，使用自定义裁剪器，我要求用户对卡号进行具体缩放：然后，我捕捉到这个图像，(1291x202px)，使用Tesseract，我试着读取这个数字： let tesseract = G8Tesseract(langu

浏览 2提问于2018-08-17得票数 0

1回答

如何对中较大句子的一部分块进行分组？

ocr、google-cloud-vision

我正在使用Google Cloud Vision API on Python来检测囤积板中通常在商店/商店上面发现的文本值。到目前为止，我已经能够检测到单个单词及其包围多边形的坐标。是否有方法根据检测到的单词的相对位置和大小对其进行分组？例如，存储的名称通常是相同大小的，并且单词是对齐的。API是否提供了一些函数，将可能是较大句子(商店名称或地址等)的单词分组？如果API没有提供这样<e

浏览 1提问于2018-09-18得票数 0

回答已采纳

1回答

IE6 -打印样式表上的有序列表错误？

css、printing、internet-explorer-6

我已经为一个页面创建了一个打印样式表，其中包含包含各种文本和图像的列表项。内容在“正确的浏览器”中按预期打印，但数字从IE6中的列表项中消失。有什么想法吗？

浏览 0提问于2011-02-03得票数 0

回答已采纳

1回答

截图中的Copy+Paste

thunderbird、ocr、copy-and-paste

我在日常工作中收到了很多截图。是否有一种从图像中获取copy+paste数字的神奇方法？我用雷鸟和火狐看屏幕截图。这个问题是关于简单的奶奶兼容的将OCR集成到桌面上。我不想玩砖头，我想要一个每天都很容易使用的解决方案。我在2001年(18年前)在ms-windows上看

浏览 0提问于2019-01-04得票数 2

3回答

计算机视觉

computer-vision、text-extraction

我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python <3版本兼容。任何关于如何进行和获取相关代码和好文件的想法。注意:我已经实现了pytesseract-OCR，而且没有取得好的效果。

浏览 8提问于2018-05-28得票数 1

回答已采纳

3回答

C# PDFSharp:如何从PDF中剥离文本的示例？

c#、text、pdfsharp

我有一个相当简单的任务:我需要读取一个PDF文件并写出它的图像内容，而忽略它的文本内容。所以基本上我需要做“另存为文本”的补充。理想情况下，我希望避免对图像内容进行任何形式的重新压缩，但如果这不可能，也没问题。谢谢!

浏览 0提问于2012-03-07得票数 6

回答已采纳

2回答

从SAS中的文本字符串中提取6位和8位数字。

sql、sas、proc-sql

长时间读者，第一次海报我想从一个自由文本字段返回一组数字。该字段包含以下内容之一：以上数字和一个6位数，有时被各种标点符号分割成2组。

浏览 5提问于2016-01-20得票数 1

回答已采纳

2回答

苹果视觉框架: LCD/LED数字识别

machine-learning、computer-vision、coreml、apple-vision、createml

我正在开发一个iOS应用程序，一切看起来都很好，直到我尝试捕捉数字时钟、计算器、血压监视器、电子温度计等图像。由于某种原因，和无法识别原始液晶屏幕上的文本，比如：您可以尝试用捕获数字，结果会失败。或者您可以尝试“视觉框架”的任何其他示例项目，但是它将无法将数字识别为文本。

浏览 5提问于2020-03-25得票数 2

回答已采纳

2回答

如何最好地逼近局部阈值opengl函数

opengl、image-processing

我想拍一些文字的照片，使文本更容易阅读。棘手的部分是，最初的照片可能有黑暗区域和光区域，我想要opengl的功能，以增强所有这些区域的文本。编辑后，我添加了一个更好的例子图片正在发生什么。我能够增强文本，但在我没有文本的领域，这种简单的阈值处

浏览 2提问于2011-12-29得票数 4

回答已采纳

1回答

我们可以使用Selenium从图像中获取文本吗？

selenium-webdriver、testng、page-objects、eclipse

这是图像的路径，为了安全起见，我必须将显示在图像上的文本输入到文本中， private WebElement textShown; 这是XPath，我在这里填充图像<

浏览 0提问于2023-03-05得票数 -1

回答已采纳

点击加载更多