腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1163)
视频
沙龙
1
回答
计算机
视觉
API
批量
读取
文件
,
可从
多个
pdf
和
图像
中
提取
文本
javascript
、
azure
、
computer-vision
我们正在使用
计算机
视觉
API
-v2.0遵循https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/javascript-hand-text (后
批量
读取
文件
以发送
pdf
和
图像
并获得
提取
的
文本
我们能够获得<
浏览 9
提问于2019-12-13
得票数 0
1
回答
Azure OCR或其他Azure认知功能从
PDF
中
读取
文本
azure
、
pdf
、
computer-vision
我有一个项目,我必须从URL或Blobs
中
读取
PDF
,并从其中
提取
文本
以供使用Azure认知索引/搜索/我正在学习使用
计算机
视觉
的示例,并且只能解析
和
提取
图像
文件
中
的
文本
。我环顾了一下,发现有些人提到了这种功能,但是它非常稀少,我找不到Github的例子来做
PDF
文档。 任何关于在哪里寻找的建议或建议。验证只是一个翘楚类,我试
浏览 2
提问于2021-02-15
得票数 2
回答已采纳
2
回答
如何用谷歌翻译图片上的文字?
google-translate
如果我遇到一个含有未知
文本
的图片
文件
,我可以为它拍另一张照片,然后用我的手机使用进行翻译,但我如何在我的电脑上翻译它呢?我试着输入谷歌翻译的图片链接,但显示无法打开
文件
。
浏览 18
提问于2014-08-06
得票数 0
回答已采纳
6
回答
Azure
计算机
视觉
API
- OCR到
PDF
文件
上的
文本
pdf
、
ocr
、
microsoft-cognitive
我试图利用
计算机
视觉
API
对OCR,一个
PDF
文件
,是一个扫描的
文件
,但被视为
图像
PDF
。 我已经测试过它,它告诉我
PDF
是"InvalidImageFormat",“输入数据不是有效的
图像
”。是否有对
PDF
图像
使用
API
,或者有一个Azure
API
,我可以结合使用去
PDF
> PNG ><em
浏览 0
提问于2018-09-28
得票数 10
回答已采纳
1
回答
读取
API
作为S3事务而不是S2
azure-cognitive-services
我正在使用进行OCR处理,我注意到在我的账单
中
,它们被作为S3事务而不是S2来收费。 我使用的是.NET SDK,我使用的
API
就是这个。OCR
和
“描述
和
识别
文本
”有什么区别?光学字符识别(,OCR )根据定义必须识别
文本
。
浏览 8
提问于2022-01-10
得票数 2
回答已采纳
1
回答
如何使用doc取器在
PDF
文件
中
搜索
文本
?
pdf
、
search
、
text
我试图在
PDF
文件
中找到一些
文本
,但结果并不准确!举个例子,我有两个
PDF
文件
,其中有一个词domiciiado。当我搜索这个单词(domiciliado)时,doc取器只显示一个
PDF
文件
和
这个单词。我的问题是为什么doc取器没有用这个单词显示另一个
PDF
文件
?
PDF
文件
之间有什么区别吗?在一个
PDF
中
,我只有
文本
,而其他<e
浏览 0
提问于2016-08-16
得票数 0
回答已采纳
1
回答
利用深度学习从
PDF
中
提取
短语
keras
、
deep-learning
我想教一个人工智能从
PDF
中
提取
特定的短语。例如,产品名称在文档
中
的某个位置,AI必须找到并
提取
它。我的问题是,是否最好将
PDF
作为
图像
或
提取
的字符串提供,因为文档是粗略构造的。
浏览 2
提问于2019-11-25
得票数 1
回答已采纳
2
回答
从
PDF
中
提取
高分辨率
图像
pdf
、
image-processing
我有一个
PDF
文件
,其中有一个
图像
。那份
PDF
是由一位同事给我的,他们问我能否
提取
出那张图片,因为我们需要它来做一个项目,我们找不到创建
PDF
的自由职业者。有没有一种方法来
提取
图像
,在一个真正的高分辨率使用一个程序?如果是的话,你会建议哪一个?
浏览 0
提问于2020-02-12
得票数 1
2
回答
基于机器学习的文档分类
python
、
machine-learning
、
nlp
、
computer-vision
这些
文件
可以是
文本
文件
PDF
文件
,也可以是扫描
PDF
文件
。InvoicePacking listCertificate我认为解决这个问题的最好方法是根据文档
文本
进行
文本
分类。首先将
PDF
文件
转换为
文本
,然后由三个标签之一对
文本
内容进行标记。(对大型数据集执行此操作)一
浏览 2
提问于2020-02-13
得票数 0
3
回答
‘’utf 8‘编解码器无法解码字节0xe2 :无效的连续字节错误
python
、
pdf
、
utf-8
、
decode
我试图从一个
文件
夹
中
读取
所有
PDF
文件
,以便使用正则表达式查找数字。在检查时,
PDF
的字符集是'UTF-8‘。抛出此错误:
api</em
浏览 2
提问于2019-06-05
得票数 16
1
回答
手写或
计算机
打印的文档分类
classification
、
ocr
、
document
、
handwriting-recognition
、
vision-api
我有很多
文件
,有些是手写的,有些是电脑打印的(扫描
图像
/
pdf
)。我想把它们分成两组,电脑打印的
和
手写的。你能指导我做这件事的方法吗?我正在使用Google Vision
API
进行数据
提取
,但是我只想从手写文档中
提取
数据。添加更多细节,我通过RPA工具UiPath调用google vision
api
,我被限制只能使用google vision
api
从
图像
中
提取
数据/
浏览 18
提问于2020-06-25
得票数 3
回答已采纳
1
回答
在UWP应用程序(通用应用程序)
中
呈现电子书(比如.epub
和
.
pdf
)
c#
、
.net
、
uwp
、
rendering
、
win-universal-app
一段时间以前,
PDF
渲染很有效,但速度很慢,而且还很初级。.epub渲染可能已经起作用了,我不确定,但是既然它已经从Edge
中
删除了,有没有可能呢? 有没有第三方解决方案?
浏览 5
提问于2020-08-27
得票数 3
4
回答
如何从
pdf
文件
中
提取
图像
和
文本
?
pdf
、
xml
、
json
我需要构建一个工具,从
pdf
中
获取
文本
和
图像
,并将其呈现在响应性的HTML
文件
中
。我不需要保持元素的位置,但排序很重要。 我面临的问题是从
pdf
文件
中
提取
文本
和
图像
。我尝试过一些将
pdf
转换成html的工具,但是这些工具更多的是面向
文件
的
视觉
再现(绝对定位,段落分割成行)。我需要一些东西为我提供一个段落
浏览 0
提问于2016-12-13
得票数 1
4
回答
分析
pdf
文件
的格式并
提取
文本
和
图像
pdf
、
text-extraction
我需要从这本杂志中
提取
“文章”,其中既有文字
和
图像
。
图像
内容必须单独放置,
文本
提取
(尽可能)并单独放置。(实际的
文件
应该是普通的
pdf
文件
,而不是加密的
文件
)
浏览 4
提问于2011-05-04
得票数 3
2
回答
如何使用python向任何给定
文件
添加数字签名
python-2.7
、
python-3.x
、
digital-signature
如何使用python向任何给定的
文件
添加数字签名并进行验证。即输入一个
文件
,输出一个数字签名的
文件
,并给出一个带有密钥的数字签名
文件
来验证数字签名。如何使用python做到这一点?
浏览 8
提问于2017-03-03
得票数 4
2
回答
Azure Computer Vision
API
无法从支票
图像
中正确
提取
文本
azure
、
computer-vision
、
vision-api
我使用Azure Cognitive Vision
API
从支票
图像
中
提取
文本
。但是,它不能正确地从支票中
提取
文本
。例如,像“||”这样的字符的MICR代码被错误地读入其他一些数字。我们有什么方法可以提高准确性或设置一些上下文来专门从支票
图像
中
提取
文本
?Vision
API
使用的示例
图像
: Vision
API
的输出:DateNOT NEG AS PA
浏览 2
提问于2021-02-15
得票数 1
1
回答
如何在C#中使用
提取
PDF
文本
c#
、
pdf
、
.net-core
、
ocr
、
google-vision
我想使用谷歌
视觉
,以
提取
PDF
到
文本
/表格。我的
PDF
包含一个我想要
提取
的表(BlockType = table)。}.Build(); Image image = Image.FromUri("
浏览 2
提问于2021-10-04
得票数 0
1
回答
从
pdf
文件
中
提取
文本
和
包含
文本
的
图像
java
、
pdf
、
ocr
我正在从
pdf
文件
中
提取
文本
,该
文件
具有行
文本
和
一些具有
文本
的
图像
报告。我应该使用哪种OCR技术来
提取
行
文本
和
图像
中
的
文本
。我已经尝试了一些OCR技术,要么是做OCR,要么是从
pdf
中
读取
文本
。
浏览 14
提问于2019-07-19
得票数 0
1
回答
使用PDFBox
读取
文本
和
图像
位置(x.y坐标)
java
、
pdfbox
我正在做一个java程序来
读取
加密的
PDF
文件
,并逐页
提取
文件
的内容,包括
文本
,
图像
和它们在
文件
中
的位置(x,y坐标)。现在,我使用PDFBox实现此目的,并获取
文本
和
图像
。但是我不能得到
文本
位置
和
图像
位置。也有一些问题,
读取
一些加密的
PDF
文件
。
浏览 5
提问于2011-09-28
得票数 7
1
回答
不放松
文本
格式的
文本
提取
file
、
text
、
pdftotext
嗨,谢谢。
浏览 4
提问于2016-07-15
得票数 1
回答已采纳
点击加载更多
相关
资讯
Claude 3.5 Sonnet模型增加PDF 文件处理功能 可分析文档图像、图表和表格
干货!Python基础教程之Python爬虫工具列表详解
Claude 3.5新功能:支持100页PDF的图像、图表和图形可视化分析
要成为一个专业的爬虫大佬,你还需要了解这些
在Python中使用PDF:阅读和拆分
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券