ocr文本 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

带有图像的PDF文件的OCR

、、

我让Tika在PDF文件上使用Tesseract，但是如果我给它一个同时具有可搜索文本和图像的PDF文件，文本是OCRed两次。有什么办法可以避免这种情况吗？即使它要经过两次，一次是笔直的文本，另一次是图像。

浏览 4提问于2020-12-31得票数 1

回答已采纳

5回答

如何创建视频OCR？

、

然后对其进行处理并将其保存在文本文档中。请向我推荐任何教程/链接/源代码。

浏览 17提问于2013-10-07得票数 5

1回答

我们可以使用Selenium从图像中获取文本吗？

、、、

这是图像的路径，为了安全起见，我必须将显示在图像上的文本输入到文本中， private WebElement textShown;@FindBy(id = "metric_iframe&

浏览 0提问于2023-03-05得票数 -1

回答已采纳

1回答

使用Tesseract引擎的Tessnet2 --为什么它的输出很差？

、、、

try Bitmap image = new Bitmap(@"C:\Users\hp\Desktop\eurotext.tif"); ocr.Init(@"C:\Program Files (x86)\Tesseract

浏览 1提问于2015-01-03得票数 5

回答已采纳

1回答

我有一个关于Azure Form Recognizer的手写文本OCR的问题。在Azure的示例标签工具中添加标签之前，在手写PDF文件上运行OCR时，OCR通常会错误地检测文本。对于其他表单分析和提取技术，通常提供一个选项来输入应该被检测到的文本，以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer，我看不到一种覆盖OCR文本并输入正确文本的方法。有没有

浏览 37提问于2020-07-15得票数 1

回答已采纳

3回答

将pdf的内容读取为字符串

、、

我想稍后过滤这个字符串并从中获取特定的文本元素。PDF来自一个url，我将它加载到一个web视图中并使用NSURL扩展来缓存它。我怎样才能获得这个网页，并阅读网址的内容。

浏览 14提问于2015-08-02得票数 0

回答已采纳

2回答

如何在android应用中使用OCR (光学字符识别)

、、

我的雇主想让我用OCR访问电话的摄像头，并给车牌拍照。然后，应用程序应该存储车牌号码，并使用web服务来检查车辆是否有汽车保险。我的问题是，我从来没有使用过OCR，我想知道如何实现和使用它。

浏览 3提问于2020-06-22得票数 1

1回答

是否有npm包，或web，用于读取图像的特定部分？

、、、、

我正在向我的节点快速服务器添加一个新功能，它将允许我上传一个驱动程序ELD每日日志，并从该图像/ pdf中获取时间驱动、启动时间、结束时间、午餐等信息。我已经研究过将pdf转换成csv / json / html，但问题是，这是一个没有标签的混乱。因此，我正在计算，试图以某种方式读取和创建一个图表，类似已经在eld日志上的图表。 IF line exists in segment call proceed and log data ELSE check segments "SB" "D" "

浏览 3提问于2019-10-16得票数 0

回答已采纳

4回答

如何使用Java获取png文件中的文本

、、

我想检查图像中是否存在特定的字符串。这有可能吗？能做到吗？

浏览 0提问于2010-12-20得票数 3

回答已采纳

2回答

我怎么得到文字的颜色？

、、、、

我一直在使用Microsoft，我正在从图像中获取文本，但是我想知道文本是在特定的颜色还是有特定的背景色。例如，我有以下图像，我想知道红色中是否有文本 string requestParameters = "language=unk&detectOrientation=true"; 会帮助我建立我想从图像中得到的参数另外:我可以混合来自图像分析的uriBase链接和来自OCR的链接吗？

浏览 4提问于2017-06-22得票数 1

回答已采纳

1回答

我正在构建一个用于后处理OCR文本的神经网络。卷积层是一个好的选择吗？

、、

从收据、发票等典型文档中，利用OCR和模板提取相关信息。稍后，人员必须在视觉上验证信息是否正确识别，或者在需要的地方手动调整。我的任务是构建一个执行验证的模型。我在考虑卷积层和池化层，输入是图像，边界框的坐标是找到提取的文本的位置，提取的文本和正确的文本。我们的目标是训练网络，以便在需要时根据正确的标记训练材料自动进行校正。该项目正处于设计阶段。

浏览 12提问于2021-01-17得票数 0

3回答

一种检测图像中文本存在的算法

、、、、

在我的新任务中，我正在寻找一种检测图像上存在的文本的方法。图像是一张地图--例如，可以是谷歌地图。任务是检测街道/城市标签放置的位置。你知道有什么算法、方法或库可以做到这一点(检测图像上是否存在文本)？谢谢，约翰

浏览 2提问于2011-01-06得票数 36

2回答

OCR将覆盖HTML传输到图像？

、

我要找一个OCR软件，渲染覆盖HTML到一个图像。我目前正在使用一些未命名的产品。它有一个OCR功能，可以对带有图像的PDF文档进行内联OCR。内联OCR非常方便，它允许搜索带有图像的PDF文档中的文本。也可以直接在文档中突出显示文本，OCR文本与底层图像对齐。不幸的是，我无法从未命名的产品中导出或存储内联OCR。有没有其他软件可以执行和导出在线OCR？我特别感兴趣的是导出到HTML中，其中包含与底层图像对齐的定位段

浏览 3提问于2013-05-13得票数 5

1回答

PDFBox:区分透明文本和非透明文本

、、、

我有一个任务，在那里，我必须提取文本，是背后的图像，并已从图像本身OCR编辑。这一案文是透明的。问题是，有一个图像，它的背后有文字，不是OCR编辑的，它只是正常的文本，它是不透明的。如何区分所需(透明)和不需要(不透明)文本？这是一个具有代表性的pdf文件：图像OCR文本应该在第2页、第3页、第12页上提取，而文本也在第4页上提取。在第4页，图像后面没有OCR文本，但是图像下面有规则文本。我需要过

浏览 6提问于2021-07-13得票数 0

回答已采纳

2回答

如何在pdf文件中复制图像中的文本？

、、

我可以使用evince文档查看器使用文本查看pdf图像，但是我不能选择图像中的文本来复制和粘贴。如何在pdf文件中从图像中复制文本？

浏览 0提问于2014-09-19得票数 0

1回答

从用户界面图像中提取OCR文本

、、、、

我目前正在使用Pytesseract从亚马逊、ebay (电子商务)等图像中提取文本，以观察某些模式。我不想使用网络爬虫，因为这是关于从这些网站上的文本中识别某些模式。但如果我将图像裁剪成较小的尺寸，它会正确地显示所有文本。有没有办法获取一张图片，将其裁剪成多个部分，然后提取文本？图像的预处理无济于事。from PIL import Image import Image# import pickle def ocr</em

浏览 35提问于2021-07-08得票数 0

2回答

jQuery iframe关键字

、、、

如何检查iframe是否包含某个文本关键字，然后显示/显示它...？ocr iframe将包含动态生成的文本，我需要获取某些部分 <iframe id="ocr"></iframe> if ($('#ocr</e

浏览 2提问于2013-02-09得票数 1

回答已采纳

2回答

将PDF文本转换成更好的质量

但是文本的质量真的很差(就像扫描图像一样)。我能用什么工具来解决这个问题吗？

浏览 7提问于2010-11-24得票数 1

2回答

使用VB.net将PDF转换为文本文件

、、

我有一个扫描的PDF文件，我需要一个VB.net源代码，将扫描的PDF转换为文本格式。

浏览 0提问于2009-09-29得票数 0

点击加载更多

带有图像的PDF文件的OCR

如何创建视频OCR？

我们可以使用Selenium从图像中获取文本吗？

使用Tesseract引擎的Tessnet2 --为什么它的输出很差？

示例标注工具OCR文本检测问题

将pdf的内容读取为字符串

如何在android应用中使用OCR (光学字符识别)

是否有npm包，或web，用于读取图像的特定部分？

如何使用Java获取png文件中的文本

我怎么得到文字的颜色？

我正在构建一个用于后处理OCR文本的神经网络。卷积层是一个好的选择吗？

一种检测图像中文本存在的算法

OCR将覆盖HTML传输到图像？

PDFBox:区分透明文本和非透明文本

如何在pdf文件中复制图像中的文本？

从用户界面图像中提取OCR文本

jQuery iframe关键字

将PDF文本转换成更好的质量

使用VB.net将PDF转换为文本文件

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐