腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(2965)
视频
沙龙
1
回答
从
PDF
上
的
Google
Vision
API
OCR
获取
线条
和
段落
,
而
不是
符号
、
、
我正在尝试使用
Google
Cloud
Vision
API
现在支持
的
PDF
/TIFF文档文本检测。使用他们
的
示例代码,我可以提交
PDF
并接收包含提取文本
的
JSON对象。我
的
问题是,保存到GCS
的
JSON文件只包含“
符号
”
的
边界框和文本,即每个单词中
的
每个字符。这使得JSON对象非常笨拙
和
难以使用。我希望能够获得“线”、“
段落<
浏览 2
提问于2018-08-23
得票数 21
回答已采纳
1
回答
如何限制对
Google
Vision
进行TEXT_DETECTION调用返回
的
文本?
、
、
、
我目前正在尝试使用
Google
Vision
API
for
OCR
。当我上传图像时,我看到返回给我
的
JSON有效负载相当大。我在响应中看到了两个主要
的
存储桶: 1) "textAnnotations“2) "fullTextAnnotation” 我只对"textAnnotations“返回
的
JSON感兴趣,我不关心fullTextAnnotation本质
上
,我只对单个单词和它们对应
的
边界框感兴趣,我不
浏览 9
提问于2017-03-08
得票数 1
4
回答
工具包无法加载
OCR
模块
、
、
、
、
我正在开发一个涉及ML工具包
的
android应用程序。我研究了一下如何设置Android来使用Firebase
的
。然后我开始使用文本识别
API
。令我惊讶
的
是,当我对它进行
API
调用时,成功列表被击中,出现了以下日志: I/DynamiteModule: Considering local module com.
google
.firebase.ml.
vision
.dynamite.barcodeI/native: barcode_detector_cl
浏览 40
提问于2019-10-20
得票数 13
回答已采纳
1
回答
从
Google
Vision
API
OCR
获取
线条
和
相应
的
坐标
、
我目前正在使用
google
OCR
Api
。我可以得到每个区块
的
坐标点。下面的链接描述了如何
从
段落
中提取行。
浏览 17
提问于2019-07-31
得票数 1
1
回答
google
cloud
vision
api
( source path- gcsSource)是否支持图像检测(图像包含文本)?
、
、
、
我正在使用TEXT_DETECTION
和
DOCUMENT_TEXT_DETECTION
的
OCR
来处理
pdf
文件(InputConfig file类型-“应用程序/
pdf
”)。当前图像在处理时被跳过。有没有可能
的
方法来处理
PDF
文件中
的
图像(有文本)?
浏览 3
提问于2021-10-06
得票数 1
2
回答
Firebase ML工具包无法准确识别语言(英语或其他)
、
、
、
、
我正在开发一个使用firebase ML Kit
的
android文本识别器应用程序。当我捕获文本图像时,问题是没有获得图像
的
实际结果,为什么??我认为我
的
应用程序不能很好地识别语言。我使用过
的
依赖项 implementation 'com.
google
.firebase:firebase-ml-
vision
:20.0.0' 识别文本
和
处理文本代码 /**
浏览 23
提问于2020-10-26
得票数 0
回答已采纳
1
回答
限制
的
响应
目前使用
从
文档图像中提取文本。 当前情况-
API
工作得很好,并返回大量数据,包括单词所在位置
的
边框。想要
的
结果--只查询
从
图像中提取
的
单词,
而
不是
所有元数据,询问单词
的
边界框
和
顶点在哪里(这相当于响应
的
99%,结果大约为250 K,这在我只想要单词
的
情况下是巨大
的
浪费)。const
vision
= require('@
goo
浏览 2
提问于2018-10-30
得票数 0
回答已采纳
1
回答
从
PDF
中
获取
树
的
文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个
PDF
()中
的
树。文件
的
名称将是左边对应
的
树号(t0、t1等)。 我试图使用python提取相关信息
和
树,但我遇到了麻烦。具体来说,当我尝试将树提取为图像(使用)时,没有出现任何树(大概是因为树
不是
正确
的
格式)。然而,当我尝试将其全部提取为文本(如)时,树会丢失它们
的
所有格式(以及它们
的
一些信息,我认为)。我怎样才能从这个
PDF
中
获取
我想要
的
文件
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
6
回答
谷歌云视觉
API
"PERMISSION_DENIED“
、
但是“云视觉
API
”是为项目启用
的
。任何帮助都是非常感谢
的
。来自
Google
资源管理器
的
错误详细信息 "error": { "message": "Project hasnot activated the
vision
.googleapis.com
API
.Please enable the
API</
浏览 4
提问于2016-02-21
得票数 6
回答已采纳
2
回答
GCP
OCR
服务-将扫描
的
PDF
或图像转换为可搜索
的
PDF
、
是否可以使用
Google
平台
的
OCR
将扫描
的
PDF
转换为新
的
可搜索
PDF
文件?
浏览 2
提问于2018-01-24
得票数 0
3
回答
google
-cloud-
vision
如何读取
pdf
文件
我正在使用谷歌
OCR
API
,我正在阅读图像
和
PDF
文件,我能够读取
和
处理图像文件,但是,对于
PDF
文件,根据,他们已经提到,我们需要将我们
的
文档存储到谷歌云服务。话虽如此,由于数据
的
保密性,我不能将我
的
数据存储到
Google
Cloud中,我想从我
的
本地系统上传我
的
PDF
,以便
从
PDF
文件中读取文本。是否可以
从</em
浏览 7
提问于2018-08-24
得票数 6
1
回答
使用Firebase ml视觉条码模型获得较少
的
条形码值
、
、
、
我在build.gradle中添加了下面的依赖项 implementation 'com.
google
.firebase:firebase-ml-
vision
implementation 'com.
google
.firebase:firebase-ml-
vision
-barcode-model:16.1.1' <meta-dataandroid:name="
浏览 0
提问于2020-07-16
得票数 1
3
回答
用于检测钞票
的
OCR
、
我正计划创建一个移动应用程序,它可以扫描商店生成
的
账单/发票,并从中提取关键特征,如店铺名称、地址、购买
的
物品、账单价值等。我知道我可以使用
OCR
从
账单中提取文本(扫描
的
账单或账单
的
照片),但我如何提取所有这些详细信息?使用什么方法?
浏览 1
提问于2017-05-22
得票数 3
1
回答
从
Python中
的
Google
中
获取
行
和
边界框坐标
、
W (线
的
边框宽度) 用于
OCR
的
Google
不按行对内容进行分组,只按
段落
进行分组。
API
确实返回
符号
级别的数据,该
符号
级别指示
符号
后面是空格或行间隔。使用来表示断续类型,似乎‘EOL_ seems _SPACE’、‘连字符’、'LINE_BREAK‘
的
值表示换行符,
而
’未知
的
‘、’空格‘、'SURE_SPACE’
的
值应该表示空格。对
浏览 0
提问于2021-11-08
得票数 2
1
回答
使用
Google
Vision
Api
结合信用卡扫描仪提取文本?
、
、
、
我正在尝试了解Android中
的
文本识别是如何工作
的
,所以我决定创建一个可以扫描信用卡并提取信息(卡号
和
到期日期)
的
应用程序。现在,我知道
Google
Vision
Api
可以让我
的
手机识别卡片
上
的
印刷数字,但不能识别浮雕数字。不幸
的</e
浏览 0
提问于2018-09-22
得票数 2
3
回答
使用
Google
应用脚本将
PDF
中
的
文本转换为文本
、
、
、
、
我有一个脚本,
从
某些Gmail邮件中
获取
(可搜索
的
)
PDF
附件。 现在我需要从这些
pdf
中提取一些字符串数据。有没有办法在启用
OCR
转换
的
情况下将其添加到
Google
Drive,并从该文件中提取文本?或者有没有更好
的
方法来解决我
的
问题?
浏览 2
提问于2013-11-28
得票数 2
3
回答
使用firebase_ml_
vision
时出现颤动错误
、
当我在pubspec.yaml文件中使用或添加firebase_ml_
vision
时,我
的
应用程序显示这些错误。我只是遵循了
从
集成firebase到将implementation 'com.
google
.android.gms:play-services-mlkit-text-recognition:16.1.1'添加到app/build.gradle
的
所有过程。Dependency failing: com.
google
.android.gms:play-
浏览 57
提问于2020-11-03
得票数 1
1
回答
使用microsoft认知
的
OCR
如果我只想处理磁盘中
的
图像,以便
从
其中读取文本并将其存储在文本文件中,该怎么办?因为它既适用于json,也适用于数据。我想做
的
工作只与数据。如何做到这一点?/
vision
/v1/analyses'_maxNumRetries = 10 data: Used when pro
浏览 3
提问于2016-07-03
得票数 0
4
回答
用于
从
雪松/护照C#中提取文本
的
OCR
、
、
、
我正在寻找一个Tesseract或谷歌
的
Vision
API
类型
的
OCR
,它可以帮助提取护照/身份证图像中
的
文本信息(这些信息可以
从
移动设备中
获取
,也可以被扫描)。因此,帧大小可能略有变化)。我已经浏览过几篇文章,并发现是首选
的
解决方案。问题 Tesser
浏览 6
提问于2016-08-17
得票数 6
2
回答
Google
vision
API
响应中
的
更新
、
在过去
的
几个月里,我一直在使用
Google
的
vision
API
来检测文本。
API
返回特定图像/文档中出现
的
单词
的
“映射”。"map“(JSON)中
的
每个元素都有一个单词
的
文本及其在文档中
的
坐标 早期
的
映射用于根据空格
和
特殊字符将文本分解为单词.现在看来,这篇文章似乎只是以空格为基础
的
文字。例如,一个文本为"Foo.
浏览 7
提问于2020-05-17
得票数 1
回答已采纳
点击加载更多
相关
资讯
怎么提取图片中的文字?有以下这几个方法就够了
图转word的四种方法
使用Cloud Vision和Python进行强大的图像分析
使用Google Cloud Vision和Python进行强大的图像分析
Cohere发布企业级视觉模型Command A Vision
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券