英文读音对比识别api - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

几个非英语单词的Microsoft.Speech引擎语音教学

、、、

我正在使用Kinect开发一个c#应用程序，它依赖于语音输入来完成任务。我有一个阿拉伯单词列表，用户可以说，以选择不同的菜单项。CMU：第一个问题是它是基于java的。我已经看过KVM和桥一，但我不能用这个东西走得太远。我无法将它设置为在Java中工作。没有关于如何使用已准备好的文件的步骤。我也看过，这个人的问题是相似的，但我不能用同样的方式解决我的问题。我不能使用像Sakhr这样的商业应用程序，因为我没

浏览 2提问于2013-09-16得票数 0

回答已采纳

1回答

人脸识别不能通过摄像头吗？

、

人脸识别产品的API，我看都是需要传输一个图片去对比和识别的，没有直接调用设备的摄像头或者通过设备的摄像头，进行实时的对比吗？

浏览 374提问于2020-07-08

1回答

如何强制Alchemy API处理英文文本？

、、、

当调用Alchemy API进行语言处理时，它有时会自动识别错误的语言。(文本有许多名称，这有时会使自动识别功能中断。)我知道文本都是英文的，所以有没有办法强制api用英文处理？

浏览 3提问于2013-09-26得票数 1

1回答

印地语语音识别

使用Microsoft Speech API，我能够识别一个英文单词。我在SQL server中创建了一个表，其中存储与英语单词相对应的印地语Unicode单词。当识别器将语音识别为"main“时，它会获取相应的印地语单词。我的逻辑是工作的，但它的准确性非常低。我的麦克风质量很好。有没有人知道更好的印地语语音识别方法，可以在任何技术上提供更高的准确性？

浏览 0提问于2013-02-21得票数 1

3回答

一句话语音英文识别返回值有问题？

、

, "RequestId": "xxxxxxx"} [附加信息]

浏览 735提问于2018-09-20

1回答

如何用opencv编辑图像，用OCR读取文本

、、、、

我正在开发一个android应用程序来识别特定板块的文本，如图中所示：我必须识别白色的文本(例如，接近“Mod”)。我正在使用Google的文本识别API，但是它失败了。因此，我使用OpenCV编辑图像，但我不知道如何强调(白色)文本，以便OCR识别它。我尝试了更多的东西，如对比度，亮度，伽马校正，自适应阈值，但情况有很大的不同，因为照片是如何拍摄的。你有什么想法吗？

浏览 0提问于2018-07-16得票数 1

回答已采纳

1回答

图像保留结构中的翻译语言

、、

为了在Google cloud上做到这一点，我们应该使用哪种api，您能给我们指出api和实现这一点的文档吗？谢谢

浏览 6提问于2021-07-21得票数 0

1回答

课堂上对学生用图像识别技术开展考勤？

能够在课堂上对一个班级50人用图像技术开展考勤工作吗？

浏览 340提问于2017-12-01

1回答

有没有类似Shazam的API？

、、、

我使用苹果的Siri快捷键编写程序，我正在寻找一种API或任何可以用来识别背景中播放的歌曲的方法。谢谢!

浏览 3提问于2018-11-17得票数 5

1回答

使用IBM语言翻译API时遇到困难

、

有人能确认IBM语言翻译API从中文到英文都是有效的吗？我可以让语言识别来工作，但不能让语言翻译。

浏览 1提问于2016-11-03得票数 0

1回答

谷歌视觉十六进制数字识别

、

Google能够识别经常出错的十六进制数字(准确率约为60%)。例如，当我试图识别带有“78303D 61”的扫描图像时，Google会识别它的文本，比如“78303061”。对于OCR识别，我使用了和.NET Api客户端，结果也不正确。imageAnnotatorClientBuilder.DetectDocumentTextAsync(image, imageContext); 玩对比度此外，我还向提供了一

浏览 3提问于2020-12-08得票数 0

2回答

谷歌云视觉-数字和数字OCR

、、、、

我使用了谷歌的云视觉API文本识别，但结果是不可靠的。在30幅高对比度的1280×1024 bmp图像中，只有少数几个得到了正确的输出，或者至少在结果中包含了正确的输出。是否有一种方法可以帮助程序更好地识别数字，例如，将结果限制在特定的格式，或者仅限于数字？

浏览 5提问于2016-09-16得票数 17

回答已采纳

1回答

基于语音ASR的机器学习

、

将语音转换为文本的自动语音识别技术已经有了很多的研究。这些工具正在使用深度学习来做到这一点。我发现它的工作方式是基于英语的。如果是单词" Phonics“的音频，它们将是Foniks，但最接近的英文单词是Phonics。 Google API可以为我们提供ASR，为我们提供最终结果。

浏览 15提问于2019-02-21得票数 0

回答已采纳

1回答

想使用文本翻译，怎么申请内测，需要审核多久，怎么调用api？

、

[附加信息]

浏览 496提问于2018-07-01

1回答

文本分析返回404‘资源未找到’

试图缩小邮递员的问题范围。我尝试了SouthCentralUS和BrazilSouth的订阅，但始终是一样的。标题:Ocp-Apim-订阅-键: xxx内容-类型: application/json实际上，如果我将url作为一个没有标题和正文的get，将url放入浏览器中，则会得到相同的结果。但我看不出我做错了什么。我甚至认为这可能是Azure的内部问题..。?？

浏览 0提问于2018-12-13得票数 1

回答已采纳

1回答

safari浏览器上web语音识别的不良结果

、、、、

格列廷斯 this.garbage.push(recognition);在Chrome上，它工作得很好，但是在Safari上，识别结果是非常糟糕的例如，如果我说：“你好助理，更改对比”，其结果可能是：“”之类的。这个问题的一个特点是语音识别接口在safari上触发的事件只是start和audiostart。我也接受在我的申请中

浏览 14提问于2022-03-11得票数 1

回答已采纳

1回答

如何在java中设置Google Vision OCR API for android的Languauge提示

、、

文档上说API会识别语言本身，但当我输入一个带有不同语言的图像时，它会给出随机的字母作为输出，就好像试图只识别英文图像一样。int t = 0; t < finalist.size(); t++) } } 我已经读过文档了，但是这个API

浏览 22提问于2019-03-07得票数 1

1回答

从NSString中删除所有非英语字符

、、

我使用Foursquare的API检索一些吸引人的名字。问题是，对于某些城市(如开罗、莫斯科、北京)，该景点的英文名称被附加在该国语言的名称上，因此，例如，开罗的一个景点将如下所示： Wekalet Al艺术中心وكالةالسلطانالغوري对于每个吸引点，我使用Flickr的API查找在查询中使用名称的照片。所以我的问题是，有没有一种方法可以识别和删除字符串中的非英语字符？(谢谢你事先提供的帮助:)

浏览 2提问于2015-06-03得票数 0

回答已采纳

2回答