腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(134)
视频
沙龙
1
回答
几个非英语单词的Microsoft.Speech引擎语音教学
、
、
、
我正在使用Kinect开发一个c#应用程序,它依赖于语音输入来完成任务。我有一个阿拉伯单词列表,用户可以说,以选择不同的菜单项。CMU:第一个问题是它是基于java的。我已经看过KVM和桥一,但我不能用这个东西走得太远。我无法将它设置为在Java中工作。没有关于如何使用已准备好的文件的步骤。我也看过,这个人的问题是相似的,但我不能用同样的方式解决我的问题。 我不能使用像Sakhr这样的商业应用程序,因为我没
浏览 2
提问于2013-09-16
得票数 0
回答已采纳
1
回答
人脸
识别
不能通过摄像头吗?
、
人脸
识别
产品的
API
,我看都是需要传输一个图片去
对比
和
识别
的,没有直接调用设备的摄像头或者通过设备的摄像头,进行实时的
对比
吗?
浏览 369
提问于2020-07-08
1
回答
如何强制Alchemy
API
处理
英文
文本?
、
、
、
当调用Alchemy
API
进行语言处理时,它有时会自动
识别
错误的语言。(文本有许多名称,这有时会使自动
识别
功能中断。)我知道文本都是
英文
的,所以有没有办法强制
api
用
英文
处理?
浏览 3
提问于2013-09-26
得票数 1
1
回答
印地语语音
识别
使用Microsoft Speech
API
,我能够
识别
一个
英文
单词。我在SQL server中创建了一个表,其中存储与英语单词相对应的印地语Unicode单词。当
识别
器将语音
识别
为"main“时,它会获取相应的印地语单词。 我的逻辑是工作的,但它的准确性非常低。我的麦克风质量很好。有没有人知道更好的印地语语音
识别
方法,可以在任何技术上提供更高的准确性?
浏览 0
提问于2013-02-21
得票数 1
3
回答
一句话语音
英文
识别
返回值有问题?
、
, "RequestId": "xxxxxxx"} [附加信息]
浏览 725
提问于2018-09-20
1
回答
如何用opencv编辑图像,用OCR读取文本
、
、
、
、
我正在开发一个android应用程序来
识别
特定板块的文本,如图中所示:我必须
识别
白色的文本(例如,接近“Mod”)。我正在使用Google的文本
识别
API
,但是它失败了。因此,我使用OpenCV编辑图像,但我不知道如何强调(白色)文本,以便OCR
识别
它。我尝试了更多的东西,如
对比
度,亮度,伽马校正,自适应阈值,但情况有很大的不同,因为照片是如何拍摄的。你有什么想法吗?
浏览 0
提问于2018-07-16
得票数 1
回答已采纳
1
回答
图像保留结构中的翻译语言
、
、
为了在Google cloud上做到这一点,我们应该使用哪种
api
,您能给我们指出
api
和实现这一点的文档吗?谢谢
浏览 6
提问于2021-07-21
得票数 0
1
回答
课堂上对学生用图像
识别
技术开展考勤?
能够在课堂上对一个班级50人用图像技术开展考勤工作吗?
浏览 338
提问于2017-12-01
1
回答
有没有类似Shazam的
API
?
、
、
、
我使用苹果的Siri快捷键编写程序,我正在寻找一种
API
或任何可以用来
识别
背景中播放的歌曲的方法。谢谢!
浏览 3
提问于2018-11-17
得票数 5
1
回答
使用IBM语言翻译
API
时遇到困难
、
有人能确认IBM语言翻译
API
从中文到
英文
都是有效的吗?我可以让语言
识别
来工作,但不能让语言翻译。
浏览 1
提问于2016-11-03
得票数 0
1
回答
谷歌视觉十六进制数字
识别
、
Google能够
识别
经常出错的十六进制数字(准确率约为60%)。例如,当我试图
识别
带有“78303D 61”的扫描图像时,Google会
识别
它的文本,比如“78303061”。对于OCR
识别
,我使用了和.NET
Api
客户端,结果也不正确。imageAnnotatorClientBuilder.DetectDocumentTextAsync(image, imageContext); 玩
对比
度此外,我还向提供了一
浏览 3
提问于2020-12-08
得票数 0
2
回答
谷歌云视觉-数字和数字OCR
、
、
、
、
我使用了谷歌的云视觉
API
文本
识别
,但结果是不可靠的。在30幅高
对比
度的1280×1024 bmp图像中,只有少数几个得到了正确的输出,或者至少在结果中包含了正确的输出。是否有一种方法可以帮助程序更好地
识别
数字,例如,将结果限制在特定的格式,或者仅限于数字?
浏览 5
提问于2016-09-16
得票数 17
回答已采纳
1
回答
基于语音ASR的机器学习
、
将语音转换为文本的自动语音
识别
技术已经有了很多的研究。这些工具正在使用深度学习来做到这一点。 我发现它的工作方式是基于英语的。如果是单词" Phonics“的音频,它们将是Foniks,但最接近的
英文
单词是Phonics。 Google
API
可以为我们提供ASR,为我们提供最终结果。
浏览 15
提问于2019-02-21
得票数 0
回答已采纳
1
回答
想使用文本翻译,怎么申请内测,需要审核多久,怎么调用
api
?
、
[附加信息]
浏览 490
提问于2018-07-01
1
回答
文本分析返回404‘资源未找到’
试图缩小邮递员的问题范围。我尝试了SouthCentralUS和BrazilSouth的订阅,但始终是一样的。标题:Ocp-Apim-订阅-键: xxx内容-类型: application/json实际上,如果我将url作为一个没有标题和正文的get,将url放入浏览器中,则会得到相同的结果。但我看不出我做错了什么。我甚至认为这可能是Azure的内部问题..。??
浏览 0
提问于2018-12-13
得票数 1
回答已采纳
1
回答
safari浏览器上web语音
识别
的不良结果
、
、
、
、
格列廷斯 this.garbage.push(recognition);在Chrome上,它工作得很好,但是在Safari上,
识别
结果是非常糟糕的例如,如果我说:“你好助理,更改
对比
”,其结果可能是:“”之类的。 这个问题的一个特点是语音
识别
接口在safari上触发的事件只是start和audiostart。我也接受在我的申请中
浏览 14
提问于2022-03-11
得票数 1
回答已采纳
1
回答
如何在java中设置Google Vision OCR
API
for android的Languauge提示
、
、
文档上说
API
会
识别
语言本身,但当我输入一个带有不同语言的图像时,它会给出随机的字母作为输出,就好像试图只
识别
英文
图像一样。int t = 0; t < finalist.size(); t++) } } 我已经读过文档了,但是这个
API
浏览 22
提问于2019-03-07
得票数 1
1
回答
从NSString中删除所有非英语字符
、
、
我使用Foursquare的
API
检索一些吸引人的名字。问题是,对于某些城市(如开罗、莫斯科、北京),该景点的
英文
名称被附加在该国语言的名称上,因此,例如,开罗的一个景点将如下所示: Wekalet Al艺术中心وكالةالسلطانالغوري对于每个吸引点,我使用Flickr的
API
查找在查询中使用名称的照片。所以我的问题是,有没有一种方法可以
识别
和删除字符串中的非英语字符?(谢谢你事先提供的帮助:)
浏览 2
提问于2015-06-03
得票数 0
回答已采纳
2
回答
构建兼容openears的语言模型
、
、
因此,我决定寻找一个大型英语语言模型来为
API
语音
识别
器引擎提供支持。但是我不能理解OpenEars使用的voxfourge英语数据模型的格式。有没有人知道怎样才能让
英文
版的.languagemodel和.dic文件在OpenEars上工作?
浏览 4
提问于2011-03-07
得票数 17
回答已采纳
3
回答
当背景颜色和文本颜色几乎相似时,OCR无法工作
、
、
、
当我们试图扫描袋子时,我们正面临一个问题。其背后的主要原因是书包上文字的颜色与书包的颜色几乎相同。因此,它不能扫描准确的文本,是写在袋子上。在附图中,我们要扫描包的id (D1 150491)。如果我们需要做额外的努力来扫描这类图像,请告诉我。
浏览 3
提问于2018-02-15
得票数 1
回答已采纳
点击加载更多
相关
资讯
名片扫描识别API
opencv笔记—人脸识别API
通过对比发现中英文期刊存在这样的差异
对比其他识别方式,步态识别具有更高防伪性
各种青花料发色对比识别
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券