从Google Vision API OCR获取线条和相应的坐标

文章/答案/技术大牛

发布

1回答

、

我目前正在使用google OCR Api。我可以得到每个区块的坐标点。下面的链接描述了如何从段落中提取行。

浏览 17提问于2019-07-31得票数 1

1回答

如何在google vision ocr中获取键值对？

、、、

我一直使用google vision API从图像中检索文本，输出的json文件只包含文本和文本的坐标。我们有没有办法从google vision ocr中获取键值对？

浏览 1提问于2020-02-06得票数 1

4回答

我正在开发一个涉及ML工具包的android应用程序。我研究了一下如何设置Android来使用Firebase的。然后我开始使用文本识别API。令我惊讶的是，当我对它进行API调用时，成功列表被击中，出现了以下日志： I/DynamiteModule: Considering local module com.google.firebase.ml.vision.dynamite.barcodeI/native: barcode_detector_cl

浏览 40提问于2019-10-20得票数 13

回答已采纳

1回答

google cloud vision api OCR边界框

、、、、

我使用了google cloud vision api。以及通过坐标输入进行ocr分析。(如果我在图像中找到坐标)有可能吗？

浏览 13提问于2019-10-24得票数 1

1回答

Google Mobile Vision ocrlib.so文件下载错误

、、、

我在我的应用程序中使用Google Mobile Vision TextRecogniser API从捕获的图像中读取文本。但我每次都会出错。I/Vision: Request download for engine ocr is a no-op because rate limitingI/Vision: libo

浏览 20提问于2020-01-17得票数 0

3回答

是否可以使用Google Cloud Vision或video intelligence API对视频执行OCR？

、、、

我经常使用谷歌的Vision OCR，它真的非常准确。我想知道我是否可以对视频文件或视频流进行OCR。比方说，我有一些监控视频，我想获取整个视频中的所有文本。在Google的视频智能API中，我只能获取标签，我猜这是使用Google Vision的标签检测API。我认为在视频的每一帧上OCR可能都会有挑战，但仍

浏览 5提问于2017-12-11得票数 3

1回答

如何在使用google cloud vision OCR后解析名片中的姓名、电话号码和电子邮件？安卓

、、

我最终通过使用google cloud vision API (OCR)成功地获取了名片内容。我的问题是，我将所有内容都存储在一个TextView中，如何从其中获取姓名和电话号码以及电子邮件？有没有办法从字符串中获取我想要的最重要的细节？提前谢谢。

浏览 42提问于2020-10-31得票数 0

回答已采纳

1回答

Google Vision检测文本是否保留格式信息？

、

我正在使用Google Vision API从旧报纸中提取数据。我想从每份报纸的最后一页提取性能数据。当我使用Google Drive的OCR时，格式信息被保留(即粗体和斜体)，但当我查看Google Vision创建的json时，我看不到任何格式信息。async_detect_document(gcs_source_uri，gcs_destination_uri)函数中是否有保留

浏览 14提问于2020-09-14得票数 0

2回答

Google Vision API文本检测异常行为- Javascript

、、

最近，关于Google Vision API的一些事情发生了变化。我正在使用它来识别收据上的文本。到现在为止一切都很好。突然，API开始以不同的方式响应我的请求。我今天向API发送了相同的图片，我得到了不同的响应(与过去不同)。我确保代码中没有任何更改，所以这不是罪魁祸首。另一件奇怪的事情是，当我在textAnnotations下将图像上传到响应中的时，我得到了一

浏览 1提问于2017-06-25得票数 4

1回答

从PDF上的Google Vision API OCR获取线条和段落，而不是符号

、、

我正在尝试使用Google Cloud Vision API现在支持的PDF/TIFF文档文本检测。使用他们的示例代码，我可以提交PDF并接收包含提取文本的JSON对象。我的问题是，保存到GCS的JSON文件只包含“符号”的边界框和文本，即每个单词中的每个字符。这使得JSON对象非常笨拙和难以使用。我希望能够获得“线”、“段落”和“块”的文本和<

浏览 2提问于2018-08-23得票数 21

回答已采纳

2回答

在Google* Cloud Vision API OCR中设置图像检测区域*

、

我曾使用Google Cloud Vision API进行文档文本检测，但我不能确定它是否允许我们定义要从中提取文本的特定图像区域。例如，如果我的图像有3列文本，并且我想要提供左上角坐标、要在其上执行OCR的特定列的宽度和高度。有可能吗？另外，当我们在图像中有3列文本时，有没有其他方法可以不让文本变得混乱？

浏览 5提问于2018-10-04得票数 3

1回答

如何限制对Google* Vision进行TEXT_DETECTION调用返回的文本？*

、、、

我目前正在尝试使用Google Vision API for OCR。当我上传图像时，我看到返回给我的JSON有效负载相当大。我在响应中看到了两个主要的存储桶: 1) "textAnnotations“2) "fullTextAnnotation” 我只对"textAnnotations“返回的JSON感兴趣，我不关心fullTextAnnotation本质上，我只对单个单词和它们对应的边界框感兴趣，我不需要任何更细粒度<

浏览 9提问于2017-03-08得票数 1

1回答

基于Tesseract的鸡蛋标记识别图像预处理

、、、

目标是开发一个能够识别鸡蛋标记的应用程序，例如0-DE-134461。我在下面的图像上尝试了和。两个OCR引擎的结果都是灾难性的。 Tesseract → ""3-ES08234 08234-25591Google Vision"

浏览 1提问于2017-08-31得票数 8

1回答

Cloud Vision* API有没有办法像AWS Textract一样，将键值对作为响应返回？*

、

需要一种以键值格式访问OCR数据的方法。Google Cloud Vision API有没有办法像AWS Textract一样，将键值对作为响应返回？我们目前正在返回边界坐标，但这在我们正在处理的场景中并没有真正的帮助。想知道是否有我们可能忽略的OOB或简单配置设置？在官方文档中找不到这方面的任何相关帮助。提前谢谢。

浏览 23提问于2021-09-24得票数 1

1回答

来自IP地址的Google* Vision *API请求...是被阻塞的

、、

我使用Google Vision OCR从PHP语言的图像中获取文本。当我使用了很长一段时间。array(1) { array(2) { string(35) "type.googleapis.com/google.rpc.Helparray(1) { array(2)

浏览 2提问于2017-04-14得票数 0

3回答

基于JavaScript的<canvas>文本识别与OCR

、、、

我找到了一个能识别手写数学方程的web应用程序：我想知道是否有人知道一个应用程序，一个教程，或一个开源项目，实现这一机制，因为从这个webapp应用程序获得它真的很复杂。注释：，我只需要将画布中绘制的等式翻译到输入文本框中，仅此而已。

浏览 1提问于2013-03-05得票数 7

6回答

谷歌云视觉API* "PERMISSION_DENIED“*

、

但是“云视觉API”是为项目启用的。任何帮助都是非常感谢的。来自Google资源管理器的错误详细信息 "error": { "message": "Project hasnot activated the vision.googleapis.com API.Please enable the API</

浏览 4提问于2016-02-21得票数 6

回答已采纳

3回答

文本识别无法识别货币符号

我正在使用移动视觉中的文本识别API，并尝试使用货币金额。OCR目前支持基于拉丁语的语言，如法语、德语等，所以我认为这个国家的货币(欧元)将是一个公认的符号，但据我所知，它不是。有没有人有在移动视觉中使用货币符号的经验，或者只是目前不支持？谢谢!

浏览 31提问于2017-03-08得票数 2

2回答

Firebase ML工具包无法准确识别语言(英语或其他)

、、、、

我正在开发一个使用firebase ML Kit的android文本识别器应用程序。当我捕获文本图像时，问题是没有获得图像的实际结果，为什么？？我认为我的应用程序不能很好地识别语言。我使用过的依赖项 implementation 'com.google.firebase:firebase-ml-vision:20.0.0' 识别文本和处理文本代码 /**

浏览 23提问于2020-10-26得票数 0

回答已采纳

1回答

Tesseract OCR* -如何训练这样的图像*

、、、

我有一个包含的MVC C#应用程序。我使用的当前版本是v4.1.0-beta1。我正在尝试扫描图像如下所示我的目标是在左边提取玩家的名字和他们上面的数字。我试着让OCR扫描场地/投球区域，但结果太离谱了。因此，我决定将所有玩家的名字和所有数字分开，如下图所示。收视率区域用蓝色标记，球员姓名用红色标记。正如您所看到的，名称和评级始终保持相同的距离。我当前的代码设置如下所示。rating

浏览 1提问于2020-03-05得票数 7

点击加载更多