计算机视觉API批量读取文件，可从多个pdf和图像中提取文本

文章/答案/技术大牛

发布

1回答

javascript、azure、computer-vision

我们正在使用计算机视觉API -v2.0遵循https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/javascript-hand-text (后批量读取文件以发送pdf和图像并获得提取的文本我们能够获得<

浏览 9提问于2019-12-13得票数 0

1回答

Azure OCR或其他Azure认知功能从PDF中读取文本

azure、pdf、computer-vision

我有一个项目，我必须从URL或Blobs中读取PDF，并从其中提取文本以供使用Azure认知索引/搜索/我正在学习使用计算机视觉的示例，并且只能解析和提取图像文件中的文本。我环顾了一下，发现有些人提到了这种功能，但是它非常稀少，我找不到Github的例子来做PDF文档。任何关于在哪里寻找的建议或建议。验证只是一个翘楚类，我试

浏览 2提问于2021-02-15得票数 2

回答已采纳

2回答

如何用谷歌翻译图片上的文字？

google-translate

如果我遇到一个含有未知文本的图片文件，我可以为它拍另一张照片，然后用我的手机使用进行翻译，但我如何在我的电脑上翻译它呢？我试着输入谷歌翻译的图片链接，但显示无法打开文件。

浏览 18提问于2014-08-06得票数 0

回答已采纳

6回答

Azure计算机视觉API - OCR到PDF文件上的文本

pdf、ocr、microsoft-cognitive

我试图利用计算机视觉API对OCR，一个PDF文件，是一个扫描的文件，但被视为图像PDF。我已经测试过它，它告诉我PDF是"InvalidImageFormat"，“输入数据不是有效的图像”。是否有对PDF图像使用API，或者有一个Azure API，我可以结合使用去PDF > PNG ><em

浏览 0提问于2018-09-28得票数 10

回答已采纳

1回答

读取API作为S3事务而不是S2

azure-cognitive-services

我正在使用进行OCR处理，我注意到在我的账单中，它们被作为S3事务而不是S2来收费。我使用的是.NET SDK，我使用的API就是这个。OCR和“描述和识别文本”有什么区别？光学字符识别(，OCR )根据定义必须识别文本。

浏览 8提问于2022-01-10得票数 2

回答已采纳

1回答

如何使用doc取器在PDF文件中搜索文本？

pdf、search、text

我试图在PDF文件中找到一些文本，但结果并不准确！举个例子，我有两个PDF文件，其中有一个词domiciiado。当我搜索这个单词(domiciliado)时，doc取器只显示一个PDF文件和这个单词。我的问题是为什么doc取器没有用这个单词显示另一个PDF文件？PDF文件之间有什么区别吗？在一个PDF中，我只有文本，而其他<e

浏览 0提问于2016-08-16得票数 0

回答已采纳

1回答

利用深度学习从PDF中提取短语

keras、deep-learning

我想教一个人工智能从PDF中提取特定的短语。例如，产品名称在文档中的某个位置，AI必须找到并提取它。我的问题是，是否最好将PDF作为图像或提取的字符串提供，因为文档是粗略构造的。

浏览 2提问于2019-11-25得票数 1

回答已采纳

2回答

从PDF中提取高分辨率图像

pdf、image-processing

我有一个PDF文件，其中有一个图像。那份PDF是由一位同事给我的，他们问我能否提取出那张图片，因为我们需要它来做一个项目，我们找不到创建PDF的自由职业者。有没有一种方法来提取图像，在一个真正的高分辨率使用一个程序？如果是的话，你会建议哪一个？

浏览 0提问于2020-02-12得票数 1

2回答

基于机器学习的文档分类

python、machine-learning、nlp、computer-vision

这些文件可以是文本文件PDF文件，也可以是扫描PDF文件。InvoicePacking listCertificate我认为解决这个问题的最好方法是根据文档文本进行文本分类。首先将PDF文件转换为文本，然后由三个标签之一对文本内容进行标记。(对大型数据集执行此操作)一

浏览 2提问于2020-02-13得票数 0

3回答

‘’utf 8‘编解码器无法解码字节0xe2 :无效的连续字节错误

python、pdf、utf-8、decode

我试图从一个文件夹中读取所有PDF文件，以便使用正则表达式查找数字。在检查时，PDF的字符集是'UTF-8‘。抛出此错误： api</em

浏览 2提问于2019-06-05得票数 16

1回答

手写或计算机打印的文档分类

classification、ocr、document、handwriting-recognition、vision-api

我有很多文件，有些是手写的，有些是电脑打印的(扫描图像/pdf)。我想把它们分成两组，电脑打印的和手写的。你能指导我做这件事的方法吗？我正在使用Google Vision API进行数据提取，但是我只想从手写文档中提取数据。添加更多细节，我通过RPA工具UiPath调用google vision api，我被限制只能使用google vision api从图像中提取数据/

浏览 18提问于2020-06-25得票数 3

回答已采纳

1回答

在UWP应用程序(通用应用程序)中呈现电子书(比如.epub和.pdf)

c#、.net、uwp、rendering、win-universal-app

一段时间以前，PDF渲染很有效，但速度很慢，而且还很初级。.epub渲染可能已经起作用了，我不确定，但是既然它已经从Edge中删除了，有没有可能呢？有没有第三方解决方案？

浏览 5提问于2020-08-27得票数 3

4回答

如何从pdf文件中提取图像和文本？

pdf、xml、json

我需要构建一个工具，从pdf中获取文本和图像，并将其呈现在响应性的HTML文件中。我不需要保持元素的位置，但排序很重要。我面临的问题是从pdf文件中提取文本和图像。我尝试过一些将pdf转换成html的工具，但是这些工具更多的是面向文件的视觉再现(绝对定位，段落分割成行)。我需要一些东西为我提供一个段落

浏览 0提问于2016-12-13得票数 1

4回答

分析pdf文件的格式并提取文本和图像

pdf、text-extraction

我需要从这本杂志中提取“文章”，其中既有文字和图像。图像内容必须单独放置，文本提取(尽可能)并单独放置。(实际的文件应该是普通的pdf文件，而不是加密的文件)

浏览 4提问于2011-05-04得票数 3

2回答

如何使用python向任何给定文件添加数字签名

python-2.7、python-3.x、digital-signature

如何使用python向任何给定的文件添加数字签名并进行验证。即输入一个文件，输出一个数字签名的文件，并给出一个带有密钥的数字签名文件来验证数字签名。如何使用python做到这一点？

浏览 8提问于2017-03-03得票数 4

2回答

Azure Computer Vision API无法从支票图像中正确提取文本

azure、computer-vision、vision-api

我使用Azure Cognitive Vision API从支票图像中提取文本。但是，它不能正确地从支票中提取文本。例如，像“||”这样的字符的MICR代码被错误地读入其他一些数字。我们有什么方法可以提高准确性或设置一些上下文来专门从支票图像中提取文本？Vision API使用的示例图像： Vision API的输出：DateNOT NEG AS PA

浏览 2提问于2021-02-15得票数 1

1回答

如何在C#中使用提取PDF文本

c#、pdf、.net-core、ocr、google-vision

我想使用谷歌视觉，以提取PDF到文本/表格。我的PDF包含一个我想要提取的表(BlockType = table)。}.Build(); Image image = Image.FromUri("

浏览 2提问于2021-10-04得票数 0

1回答

从pdf文件中提取文本和包含文本的图像

java、pdf、ocr

我正在从pdf文件中提取文本，该文件具有行文本和一些具有文本的图像报告。我应该使用哪种OCR技术来提取行文本和图像中的文本。我已经尝试了一些OCR技术，要么是做OCR，要么是从pdf中读取文本。

浏览 14提问于2019-07-19得票数 0

1回答

使用PDFBox读取文本和图像位置(x.y坐标)

java、pdfbox

我正在做一个java程序来读取加密的PDF文件，并逐页提取文件的内容，包括文本，图像和它们在文件中的位置(x，y坐标)。现在，我使用PDFBox实现此目的，并获取文本和图像。但是我不能得到文本位置和图像位置。也有一些问题，读取一些加密的PDF文件。

浏览 5提问于2011-09-28得票数 7

1回答

不放松文本格式的文本提取

file、text、pdftotext

嗨，谢谢。

浏览 4提问于2016-07-15得票数 1

回答已采纳

点击加载更多