腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
Google
Vision
API
OCR
获取
线条
和
相应
的
坐标
、
我目前正在使用
google
OCR
Api
。我可以得到每个区块
的
坐标
点。下面的链接描述了如何
从
段落中提取行。
浏览 17
提问于2019-07-31
得票数 1
1
回答
如何在
google
vision
ocr
中
获取
键值对?
、
、
、
我一直使用
google
vision
API
从
图像中检索文本,输出
的
json文件只包含文本和文本
的
坐标
。我们有没有办法
从
google
vision
ocr
中
获取
键值对?
浏览 1
提问于2020-02-06
得票数 1
4
回答
工具包无法加载
OCR
模块
、
、
、
、
我正在开发一个涉及ML工具包
的
android应用程序。我研究了一下如何设置Android来使用Firebase
的
。然后我开始使用文本识别
API
。令我惊讶
的
是,当我对它进行
API
调用时,成功列表被击中,出现了以下日志: I/DynamiteModule: Considering local module com.
google
.firebase.ml.
vision
.dynamite.barcodeI/native: barcode_detector_cl
浏览 40
提问于2019-10-20
得票数 13
回答已采纳
1
回答
google
cloud
vision
api
OCR
边界框
、
、
、
、
我使用了
google
cloud
vision
api
。以及通过
坐标
输入进行
ocr
分析。(如果我在图像中找到
坐标
)有可能吗?
浏览 13
提问于2019-10-24
得票数 1
1
回答
Google
Mobile
Vision
ocrlib.so文件下载错误
、
、
、
我在我
的
应用程序中使用
Google
Mobile
Vision
TextRecogniser
API
从
捕获
的
图像中读取文本。但我每次都会出错。I/
Vision
: Request download for engine
ocr
is a no-op because rate limitingI/
Vision
: libo
浏览 20
提问于2020-01-17
得票数 0
3
回答
是否可以使用
Google
Cloud
Vision
或video intelligence
API
对视频执行
OCR
?
、
、
、
我经常使用谷歌
的
Vision
OCR
,它真的非常准确。我想知道我是否可以对视频文件或视频流进行
OCR
。比方说,我有一些监控视频,我想
获取
整个视频中
的
所有文本。在
Google
的
视频智能
API
中,我只能
获取
标签,我猜这是使用
Google
Vision
的
标签检测
API
。我认为在视频
的
每一帧上
OCR
可能都会有挑战,但仍
浏览 5
提问于2017-12-11
得票数 3
1
回答
如何在使用
google
cloud
vision
OCR
后解析名片中
的
姓名、电话号码
和
电子邮件?安卓
、
、
我最终通过使用
google
cloud
vision
API
(
OCR
)成功地
获取
了名片内容。我
的
问题是,我将所有内容都存储在一个TextView中,如何
从
其中
获取
姓名
和
电话号码以及电子邮件?有没有办法
从
字符串中
获取
我想要
的
最重要
的
细节?提前谢谢。
浏览 42
提问于2020-10-31
得票数 0
回答已采纳
1
回答
Google
Vision
检测文本是否保留格式信息?
、
我正在使用
Google
Vision
API
从
旧报纸中提取数据。我想从每份报纸
的
最后一页提取性能数据。当我使用
Google
Drive
的
OCR
时,格式信息被保留(即粗体
和
斜体),但当我查看
Google
Vision
创建
的
json时,我看不到任何格式信息。async_detect_document(gcs_source_uri,gcs_destination_uri)函数中是否有保留
浏览 14
提问于2020-09-14
得票数 0
2
回答
Google
Vision
API
文本检测异常行为- Javascript
、
、
最近,关于
Google
Vision
API
的
一些事情发生了变化。我正在使用它来识别收据上
的
文本。到现在为止一切都很好。突然,
API
开始以不同
的
方式响应我
的
请求。我今天向
API
发送了相同
的
图片,我得到了不同
的
响应(与过去不同)。我确保代码中没有任何更改,所以这不是罪魁祸首。另一件奇怪
的
事情是,当我在textAnnotations下将图像上传到响应中
的
时,我得到了一
浏览 1
提问于2017-06-25
得票数 4
1
回答
从
PDF上
的
Google
Vision
API
OCR
获取
线条
和
段落,而不是符号
、
、
我正在尝试使用
Google
Cloud
Vision
API
现在支持
的
PDF/TIFF文档文本检测。使用他们
的
示例代码,我可以提交PDF并接收包含提取文本
的
JSON对象。我
的
问题是,保存到GCS
的
JSON文件只包含“符号”
的
边界框和文本,即每个单词中
的
每个字符。这使得JSON对象非常笨拙
和
难以使用。我希望能够获得“线”、“段落”
和
“块”
的
文本
和<
浏览 2
提问于2018-08-23
得票数 21
回答已采纳
2
回答
在
Google
Cloud
Vision
API
OCR
中设置图像检测区域
、
我曾使用
Google
Cloud
Vision
API
进行文档文本检测,但我不能确定它是否允许我们定义要从中提取文本
的
特定图像区域。例如,如果我
的
图像有3列文本,并且我想要提供左上角
坐标
、要在其上执行
OCR
的
特定列
的
宽度
和
高度。有可能吗?另外,当我们在图像中有3列文本时,有没有其他方法可以不让文本变得混乱?
浏览 5
提问于2018-10-04
得票数 3
1
回答
如何限制对
Google
Vision
进行TEXT_DETECTION调用返回
的
文本?
、
、
、
我目前正在尝试使用
Google
Vision
API
for
OCR
。当我上传图像时,我看到返回给我
的
JSON有效负载相当大。我在响应中看到了两个主要
的
存储桶: 1) "textAnnotations“2) "fullTextAnnotation” 我只对"textAnnotations“返回
的
JSON感兴趣,我不关心fullTextAnnotation本质上,我只对单个单词和它们对应
的
边界框感兴趣,我不需要任何更细粒度<
浏览 9
提问于2017-03-08
得票数 1
1
回答
基于Tesseract
的
鸡蛋标记识别图像预处理
、
、
、
目标是开发一个能够识别鸡蛋标记
的
应用程序,例如0-DE-134461。我在下面的图像上尝试了
和
。两个
OCR
引擎
的
结果都是灾难性
的
。 Tesseract → ""3-ES08234 08234-25591
Google
Vision
"
浏览 1
提问于2017-08-31
得票数 8
1
回答
Cloud
Vision
API
有没有办法像AWS Textract一样,将键值对作为响应返回?
、
需要一种以键值格式访问
OCR
数据
的
方法。
Google
Cloud
Vision
API
有没有办法像AWS Textract一样,将键值对作为响应返回?我们目前正在返回边界
坐标
,但这在我们正在处理
的
场景中并没有真正
的
帮助。想知道是否有我们可能忽略
的
OOB或简单配置设置?在官方文档中找不到这方面的任何相关帮助。 提前谢谢。
浏览 23
提问于2021-09-24
得票数 1
1
回答
来自IP地址
的
Google
Vision
API
请求...是被阻塞
的
、
、
我使用
Google
Vision
OCR
从
PHP语言
的
图像中
获取
文本。当我使用了很长一段时间。array(1) { array(2) { string(35) "type.googleapis.com/
google
.rpc.Helparray(1) { array(2)
浏览 2
提问于2017-04-14
得票数 0
3
回答
基于JavaScript
的
<canvas>文本识别与
OCR
、
、
、
我找到了一个能识别手写数学方程
的
web应用程序: 我想知道是否有人知道一个应用程序,一个教程,或一个开源项目,实现这一机制,因为从这个webapp应用程序获得它真的很复杂。注释:,我只需要将画布中绘制
的
等式翻译到输入文本框中,仅此而已。
浏览 1
提问于2013-03-05
得票数 7
6
回答
谷歌云视觉
API
"PERMISSION_DENIED“
、
但是“云视觉
API
”是为项目启用
的
。任何帮助都是非常感谢
的
。来自
Google
资源管理器
的
错误详细信息 "error": { "message": "Project hasnot activated the
vision
.googleapis.com
API
.Please enable the
API</
浏览 4
提问于2016-02-21
得票数 6
回答已采纳
3
回答
文本识别无法识别货币符号
我正在使用移动视觉中
的
文本识别
API
,并尝试使用货币金额。
OCR
目前支持基于拉丁语
的
语言,如法语、德语等,所以我认为这个国家
的
货币(欧元)将是一个公认
的
符号,但据我所知,它不是。有没有人有在移动视觉中使用货币符号
的
经验,或者只是目前不支持? 谢谢!
浏览 31
提问于2017-03-08
得票数 2
2
回答
Firebase ML工具包无法准确识别语言(英语或其他)
、
、
、
、
我正在开发一个使用firebase ML Kit
的
android文本识别器应用程序。当我捕获文本图像时,问题是没有获得图像
的
实际结果,为什么??我认为我
的
应用程序不能很好地识别语言。我使用过
的
依赖项 implementation 'com.
google
.firebase:firebase-ml-
vision
:20.0.0' 识别文本
和
处理文本代码 /**
浏览 23
提问于2020-10-26
得票数 0
回答已采纳
1
回答
Tesseract
OCR
-如何训练这样
的
图像
、
、
、
我有一个包含
的
MVC C#应用程序。我使用的当前版本是v4.1.0-beta1。我正在尝试扫描图像如下所示我
的
目标是在左边提取玩家
的
名字和他们上面的数字。我试着让
OCR
扫描场地/投球区域,但结果太离谱了。因此,我决定将所有玩家
的
名字
和
所有数字分开,如下图所示。收视率区域用蓝色标记,球员姓名用红色标记。正如您所看到
的
,名称
和
评级始终保持相同
的
距离。我当前
的
代码设置如下所示。rating
浏览 1
提问于2020-03-05
得票数 7
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券