腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Google
的
文本
识别
API
来
检测
图像
中
的
水平线
而
不是
块
、
、
、
、
有没有办法用
检测
图像
中
的
全尺寸
水平线
(最大宽度)
而
不是
文本
块
?比方说,如果我想从收据
图像
中
检索到期总额,如下所示:..。因为到目前为止,
API
以任意顺序
检测
块
中
的
文本
,如下所示:..。不,TextBlock
的
getComponents()只检索每个Te
浏览 12
提问于2018-03-01
得票数 2
3
回答
Google
Cloud Vision
API
是否支持人脸
识别
或人脸
识别
?
、
我正在寻找一个谷歌云
API
,可以做人脸
识别
和身份
识别
。我
的
理解是,
Google
Cloud Vision
API
将只支持人脸
检测
,
而
不支持
识别
。有没有可以进行人脸
识别
的
Google
Cloud
API
?
浏览 8
提问于2017-01-23
得票数 5
1
回答
使用
OpenCV
检测
要发送给Tesseract iOS
的
文本
块
、
、
、
如何
使用
OpenCV
来
检测
图像
中
的
所有
文本
,我希望能够单独
检测
文本
的
“
块
”。然后将
识别
的
块
传递给tesseract。这里有一个例子,如果我要扫描这个,我想单独扫描段落,
而
不是
从左到右--这就是tesseract所做
的
。
浏览 0
提问于2014-01-29
得票数 3
回答已采纳
1
回答
如何
使用
直方图
识别
文本
区域?
、
、
我有一个示例
图像
,如下所示:可以有一条或多条
水平线
来
分隔
文本
部分。我希望得到4个
文本
块
,看起来像:
水平线
可以靠近
文本
,而外部矩形并不总是在那里。我尝试了下面的- Threshold - Erode & Dilate - FindContours 由于
水平线
离
文本
很近,因此没有一种干净
的
方法可以通过侵蚀和膨胀
来
获得线上和线下
的
浏览 19
提问于2016-08-22
得票数 3
回答已采纳
1
回答
使用
firebase MLKit运行多个
图像
处理器
、
、
我试着用在安卓
的
实时摄像头上
检测
对象和
文本
。有特定
的
识别
器(,)来处理
图像
。如果我一个一个地
使用
这些
识别
器,它就能很好地工作,我就能得到欲望
的
反应。但是,我想同时
检测
对象和
文本
,
使用
与
Google
应用程序相同
的
摄像头馈送。为了实现这一点,首先,我尝试将两个
识别
器一起运行,但由于都是按顺序运行,所以延迟时间更长(执行特定帧所需<e
浏览 3
提问于2020-05-01
得票数 2
2
回答
谷歌云视觉演示
的
行为与实际
API
不同吗?
、
相同
的
图像
导致
google
云视觉
API
演示
中
的
文本
检测
结果与实际
API
不同。在演示
中
,精度要高得多。更重要
的
是,在演示
中
,换行符行为更正确;
文本
块
被视为在一起,而在我与免费试用版一起
使用
的
API
中
,
文本
的
排序被严格视为“自上而下”,
浏览 12
提问于2017-06-05
得票数 1
回答已采纳
1
回答
当以“下载”
的
形式链接到
图像
时,获取与该
图像
相关联
的
其他
文本
,用于
Google
图像
搜索。
、
、
我有这样
的
HTML代码: <span title="Cute Kittens">Download</span>以上代码
的
问题在于
Google
搜索引擎正在用span元素
中
可用
的
浏览 0
提问于2017-05-28
得票数 5
回答已采纳
1
回答
Google
Cloud vision无法
检测
到一个字符
、
、
我在我
的
小项目中
使用
了
Google
Cloud Vision
API
来
检测
图像
中
的
文本
。
API
工作得很好,几乎
图像
中
的
文本
都能被
API
检测
到,但我发现当
图像
一行
中
只有一个字符时,
API
会跳过它。我尝试改变颜色和调整
图像
大小
浏览 13
提问于2018-07-31
得票数 0
2
回答
如何
使用
谷歌视觉
API
(OCR)从
图像
中
的
定制
块
中提取
文本
?
、
、
当我们
使用
Google
的
DOCUMENT_TEXT_DETECTION来处理
图像
时,它决定
图像
中
的
块
是什么以及每个
块
中
的
文本
是什么--在这里,我想得到由我定义
的
块
的
文本
(已经有了
识别
图像
中
不同
块
的
模型)只是想要由我定义<e
浏览 9
提问于2022-03-24
得票数 0
2
回答
如何在python中
使用
pytesseract和opencv-python
识别
其他较大对象下
的
变形
文本
?
、
、
、
、
我
使用
pytesseract
来
识别
文本
,如下所示tn_boxes = len(看看它是如何不
识别
第一行Sol. (a) Let A={x:x is a natural number..etc
的
。 一切都很好。是否有任何方法配置pytesseract
来
识别
<em
浏览 2
提问于2020-06-09
得票数 0
回答已采纳
1
回答
使用
Google
Vision
Api
结合信用卡扫描仪提取
文本
?
、
、
、
我正在尝试了解Android
中
的
文本
识别
是如何工作
的
,所以我决定创建一个可以扫描信用卡并提取信息(卡号和到期日期)
的
应用程序。现在,我知道
Google
Vision
Api
可以让我
的
手机
识别
卡片上
的
印刷数字,但不能
识别
浮雕数字。不幸
的</e
浏览 0
提问于2018-09-22
得票数 2
1
回答
检测
和
识别
图像
中
的
文本
的
最佳技术和算法是什么?
、
、
我是一个
文本
检测
和
识别
的新手,但我对如何正确地
检测
和
识别
图像
中
的
文本
感到困惑,我创建了tessarec,但它没有给我一个好
的
结果,我在一个Gui java
的
Swing屏幕截图中
使用
了它,我想做
的
是实现我自己
的
程序,但我需要一些建议
来
做这件事。我想
使用
OpenCv和Python
来
实现这一点 谢谢
浏览 2
提问于2017-04-26
得票数 0
1
回答
能否通过其
API
生成西班牙语标签?
假设我有
图像
,我想用西班牙语为它们生成标签--允许选择哪种语言返回标签吗?
浏览 2
提问于2017-07-23
得票数 3
1
回答
用Tensorflow对象
检测
API
检测
地址标签
、
我正在Windows 7机器上试验Tensorflow对象
检测
API
。我试图
检测
美国地址标签(和类似的
文本
块
),就像它们出现在一封邮件或信封上一样。我
不是
试图
检测
单个单词或行,而是整个矩形
块
的
文本
。我
使用
了预先训练
的
SSD盗梦空间V2 COCO模型,以及包含LabelImg注解
的
地址标签
的
50张信件/信封
图像
。为了注释
浏览 0
提问于2019-03-21
得票数 1
2
回答
如何针对特定语言改进
Google
的
TEXT_DETECTION
、
在我
的
例子
中
,我想在一个非常狭窄
的
上下文中
使用
TEXT_DETECTION,例如,在特定语言
的
广告横幅上
检测
文本
(以越南语表示)。我能在我自己
的
数据收集上训练这台机器以得到更准确
的
结果吗?除了
Google
的
TEXT_DETECTION之外,谷歌还
使用
Tesseract
的
依赖项开发了谷歌
的
光学字符
识别
软件。正如我所知,他们有不同<
浏览 0
提问于2016-10-13
得票数 3
1
回答
OCR
中
的
文本
对齐问题
、
、
我创建了一个用于从
图像
中
扫描
文本
并将其写入
文本
视图
的
应用程序,它成功地用于单列数据,但在多列情况下,它随机读取列,
而
不是
以与原始
图像
显示
的
表视图相同
的
方式打印。我
使用
google
并将
文本
解析为SparseArray类型
的
textblock(SparseArray<Textblock>)。扫描
图像
的
输
浏览 1
提问于2020-02-26
得票数 0
回答已采纳
1
回答
如何
使用
Google
Cloud Vision
API
检测
手写
、
、
TL;DR:如何
检测
图像
中
是否存在笔迹? 我正在
使用
Google
的
Python Vision
API
来
扫描
图像
中
的
文本
,效果通常很好。大多数情况下,
图像
包含打印
文本
,但有时也包含手写内容。正如文档中所指出
的
,有时
使用
document_text_detection
而
不是
标准<e
浏览 24
提问于2020-05-07
得票数 5
2
回答
基于Android或iOS摄像机
的
文本
快速
识别
、
、
、
、
当前
的
文本
捕获
API
(例如
Google
的
文本
API
)是否足够快,能够从手机
的
视频提要
中
捕获
文本
,并在摄像机移动时在
文本
上绘制一个保留
的
框?我不需要足够
的
速度
来
完成所有的OCR每帧(虽然这将是惊人
的
!)我只是在寻找足够快
的
识别
块
文本
,并保持与实时
图像<
浏览 9
提问于2017-11-14
得票数 1
回答已采纳
1
回答
Google
Vision
API
-我们是否可以在
检测
文档
文本
时包含自定义预处理逻辑,并将其直接用作Vision
API
、
、
我正在
使用
Google
Vision
API
从我
的
图像
中
获得所有的
文本
。但是,我只想通过调整
图像
的
大小
来
提取
图像
上特定区域
的
文本
,
而
不是
整个
文本
。然而,对于所有
图像
,该区域并不定义为固定坐标;
图像
是错误
的
屏幕截图,其中消息可能在任何一侧,有时屏幕截图是通过在
浏览 21
提问于2020-04-28
得票数 0
1
回答
Google
Vision
API
-如何
检测
戴口罩的人脸
识别
人员?
、
我尝试
使用
Google
Vision
API
和一个用例研究
来
检测
戴口罩的人
的
脸,由于
API
响应以及web-ui演示https://cloud.
google
.com/vision/docs/drag-and-drop,我无法获得正确
的
结果,如何确定戴口罩的人。感谢你
的
帮助。
浏览 39
提问于2021-01-20
得票数 0
点击加载更多
相关
资讯
无损检测——射线检测中缺陷图像识别可以使用的方法
谷歌AR工具Google Lens登陆全球Google Go市场,带来更好的理解能力
使用Cloud Vision和Python进行强大的图像分析
使用Google Cloud Vision和Python进行强大的图像分析
TensorFlow推出新接口,简化 ML移动端开发流程
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券