使用Google的文本识别API来检测图像中的水平线而不是块

文章/答案/技术大牛

发布

1回答

、、、、

有没有办法用检测图像中的全尺寸水平线(最大宽度)而不是文本块？比方说，如果我想从收据图像中检索到期总额，如下所示：..。因为到目前为止，API以任意顺序检测块中的文本，如下所示：..。不，TextBlock的getComponents()只检索每个Te

浏览 12提问于2018-03-01得票数 2

3回答

Google Cloud Vision API是否支持人脸识别或人脸识别？

、

我正在寻找一个谷歌云API，可以做人脸识别和身份识别。我的理解是，Google Cloud Vision API将只支持人脸检测，而不支持识别。有没有可以进行人脸识别的Google Cloud API？

浏览 8提问于2017-01-23得票数 5

1回答

使用OpenCV检测要发送给Tesseract iOS的文本块

、、、

如何使用OpenCV来检测图像中的所有文本，我希望能够单独检测文本的“块”。然后将识别的块传递给tesseract。这里有一个例子，如果我要扫描这个，我想单独扫描段落，而不是从左到右--这就是tesseract所做的。

浏览 0提问于2014-01-29得票数 3

回答已采纳

1回答

如何使用直方图识别文本区域？

、、

我有一个示例图像，如下所示：可以有一条或多条水平线来分隔文本部分。我希望得到4个文本块，看起来像：水平线可以靠近文本，而外部矩形并不总是在那里。我尝试了下面的- Threshold - Erode & Dilate - FindContours 由于水平线离文本很近，因此没有一种干净的方法可以通过侵蚀和膨胀来获得线上和线下的

浏览 19提问于2016-08-22得票数 3

回答已采纳

1回答

使用firebase MLKit运行多个图像处理器

、、

我试着用在安卓的实时摄像头上检测对象和文本。有特定的识别器(，)来处理图像。如果我一个一个地使用这些识别器，它就能很好地工作，我就能得到欲望的反应。但是，我想同时检测对象和文本，使用与Google应用程序相同的摄像头馈送。为了实现这一点，首先，我尝试将两个识别器一起运行，但由于都是按顺序运行，所以延迟时间更长(执行特定帧所需<e

浏览 3提问于2020-05-01得票数 2

2回答

谷歌云视觉演示的行为与实际API不同吗？

、

相同的图像导致google云视觉API演示中的文本检测结果与实际API不同。在演示中，精度要高得多。更重要的是，在演示中，换行符行为更正确；文本块被视为在一起，而在我与免费试用版一起使用的API中，文本的排序被严格视为“自上而下”，

浏览 12提问于2017-06-05得票数 1

回答已采纳

1回答

当以“下载”的形式链接到图像时，获取与该图像相关联的其他文本，用于Google图像搜索。

、、

我有这样的HTML代码： <span title="Cute Kittens">Download</span>以上代码的问题在于Google搜索引擎正在用span元素中可用的

浏览 0提问于2017-05-28得票数 5

回答已采纳

1回答

Google Cloud vision无法检测到一个字符

、、

我在我的小项目中使用了Google Cloud Vision API来检测图像中的文本。API工作得很好，几乎图像中的文本都能被API检测到，但我发现当图像一行中只有一个字符时，API会跳过它。我尝试改变颜色和调整图像大小

浏览 13提问于2018-07-31得票数 0

2回答

如何使用谷歌视觉API(OCR)从图像中的定制块中提取文本？

、、

当我们使用Google的DOCUMENT_TEXT_DETECTION来处理图像时，它决定图像中的块是什么以及每个块中的文本是什么--在这里，我想得到由我定义的块的文本(已经有了识别图像中不同块的模型)只是想要由我定义<e

浏览 9提问于2022-03-24得票数 0

2回答

如何在python中使用pytesseract和opencv-python识别其他较大对象下的变形文本？

、、、、

我使用pytesseract来识别文本，如下所示tn_boxes = len(看看它是如何不识别第一行Sol. (a) Let A={x:x is a natural number..etc的。一切都很好。是否有任何方法配置pytesseract来识别<em

浏览 2提问于2020-06-09得票数 0

回答已采纳

1回答

使用Google* Vision Api结合信用卡扫描仪提取文本？*

、、、

我正在尝试了解Android中的文本识别是如何工作的，所以我决定创建一个可以扫描信用卡并提取信息(卡号和到期日期)的应用程序。现在，我知道Google Vision Api可以让我的手机识别卡片上的印刷数字，但不能识别浮雕数字。不幸的</e

浏览 0提问于2018-09-22得票数 2

1回答

检测和识别图像中的文本的最佳技术和算法是什么？

、、

我是一个文本检测和识别的新手，但我对如何正确地检测和识别图像中的文本感到困惑，我创建了tessarec，但它没有给我一个好的结果，我在一个Gui java的Swing屏幕截图中使用了它，我想做的是实现我自己的程序，但我需要一些建议来做这件事。我想使用OpenCv和Python来实现这一点谢谢

浏览 2提问于2017-04-26得票数 0

1回答

能否通过其API生成西班牙语标签？

假设我有图像，我想用西班牙语为它们生成标签--允许选择哪种语言返回标签吗？

浏览 2提问于2017-07-23得票数 3

1回答

用Tensorflow对象检测API检测地址标签

、

我正在Windows 7机器上试验Tensorflow对象检测API。我试图检测美国地址标签(和类似的文本块)，就像它们出现在一封邮件或信封上一样。我不是试图检测单个单词或行，而是整个矩形块的文本。我使用了预先训练的SSD盗梦空间V2 COCO模型，以及包含LabelImg注解的地址标签的50张信件/信封图像。为了注释

浏览 0提问于2019-03-21得票数 1

2回答

如何针对特定语言改进Google的TEXT_DETECTION

、

在我的例子中，我想在一个非常狭窄的上下文中使用TEXT_DETECTION，例如，在特定语言的广告横幅上检测文本(以越南语表示)。我能在我自己的数据收集上训练这台机器以得到更准确的结果吗？除了Google的TEXT_DETECTION之外，谷歌还使用Tesseract的依赖项开发了谷歌的光学字符识别软件。正如我所知，他们有不同<

浏览 0提问于2016-10-13得票数 3

1回答

OCR中的文本对齐问题

、、

我创建了一个用于从图像中扫描文本并将其写入文本视图的应用程序，它成功地用于单列数据，但在多列情况下，它随机读取列，而不是以与原始图像显示的表视图相同的方式打印。我使用google并将文本解析为SparseArray类型的textblock(SparseArray<Textblock>)。扫描图像的输

浏览 1提问于2020-02-26得票数 0

回答已采纳

1回答

如何使用Google* Cloud Vision API检测手写*

、、

TL;DR:如何检测图像中是否存在笔迹？我正在使用Google的Python Vision API来扫描图像中的文本，效果通常很好。大多数情况下，图像包含打印文本，但有时也包含手写内容。正如文档中所指出的，有时使用document_text_detection而不是标准<e

浏览 24提问于2020-05-07得票数 5

2回答

基于Android或iOS摄像机的文本快速识别

、、、、

当前的文本捕获API(例如Google的文本API)是否足够快，能够从手机的视频提要中捕获文本，并在摄像机移动时在文本上绘制一个保留的框？我不需要足够的速度来完成所有的OCR每帧(虽然这将是惊人的！)我只是在寻找足够快的识别块文本，并保持与实时图像<

浏览 9提问于2017-11-14得票数 1

回答已采纳

1回答

Google Vision API -我们是否可以在检测文档文本时包含自定义预处理逻辑，并将其直接用作Vision API

、、

我正在使用Google Vision API从我的图像中获得所有的文本。但是，我只想通过调整图像的大小来提取图像上特定区域的文本，而不是整个文本。然而，对于所有图像，该区域并不定义为固定坐标；图像是错误的屏幕截图，其中消息可能在任何一侧，有时屏幕截图是通过在

浏览 21提问于2020-04-28得票数 0

1回答

Google Vision API -如何检测戴口罩的人脸识别人员？

、

我尝试使用Google Vision API和一个用例研究来检测戴口罩的人的脸，由于API响应以及web-ui演示https://cloud.google.com/vision/docs/drag-and-drop，我无法获得正确的结果，如何确定戴口罩的人。感谢你的帮助。

浏览 39提问于2021-01-20得票数 0

点击加载更多