腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
能否向Azure说话人
识别
API
发送实时数据?
、
、
、
、
我正在写一个与
声音
有关的项目。我正在开发一个功能来实时区分人们的
声音
。我使用Microsoft说话人
识别
API
来区分人们的
声音
。因此,我的问题是:如何使用实时音频流来实现说话人
识别
? 我可以使用Azure扬声器
识别
API
获得实时音频,它只需要WAV文件?或者,除了这个
AP
浏览 4
提问于2018-01-14
得票数 1
1
回答
C# SpeechSynthesizer GetInstalledVoices -只列出两个
声音
、
我试图通过以下代码获取已安装的
声音
列表: using(SpeechSynthesizer synth = new System.Speech.Synthesis.SpeechSynthesizer然而,在Windows控制面板中,我可以单独看到德语的3种
声音
。我做错了什么?
浏览 23
提问于2022-01-02
得票数 0
2
回答
语音
识别
接口SDK (Android)
、
、
我需要做一个Android应用程序,可以
识别
我创建的某些
声音
文件,并在
识别
时执行操作。所以类似于Shazam/Soundhound的东西,但有我自己的
声音
文件。有没有什么
API
或者SDK之类的东西?PS:为了清楚,我不想要语音
识别
,或者文本到语音转换。我的
声音
文件可以有音乐,失真的
声音
,效果等
浏览 2
提问于2013-06-20
得票数 11
回答已采纳
1
回答
语音
识别
、
、
、
、
我想在上面实现一个语音
识别
功能。假设我有一些用户称之为“嘿”、“1”、“2”、"tea“的记录,当他/她说”嘿“时,语音
识别
api
应该
识别
这些记录的第一个输入。”我已经找到了一些apis,这些apis支持语音
识别
或有听觉打印算法。但我不想用它们。 让我解释一下为什么我不使用这些apis。首先,语音
识别
apis试图理解单词并转换为文本。但是,这仅限于
api
支持的语言。即使语音
识别
api
支持英语语言。因为
浏览 4
提问于2016-06-20
得票数 4
2
回答
识别
声卡输出中正在播放的音乐的软件
我正在寻找一个软件(用于PC,而不是移动),它能够
识别
计算机声卡输出上正在播放/播放的音乐,而不需要使用麦克风来检测
声音
。示例:
识别
应用程序正在播放的音乐 有谁知道有这样的应用程序吗?
浏览 0
提问于2015-09-18
得票数 6
回答已采纳
1
回答
Google语音
识别
在电影上的应用
、
我用自然对话的获得了很好的效果,但是对于Youtube视频或电影的
声音
识别
很差或者根本不存在。在我的iPhone 4上录制西班牙语和英语的
声音
都可以
识别
,但在看电影时用同一部手机几乎是不可能的,即使是一个人物说话的场景,背景噪音也很小。只有一次成功。我试着用清理
声音
,使用noisered和compand efects,但没有成功。 有什么想法吗?或者仅仅是Google
API
不能
识别
的
声音
,因为你改变了更多?它会在其他语音
识别
软件上取
浏览 0
提问于2013-06-03
得票数 3
1
回答
C++语音
识别
API
、
、
、
、
我正在寻找一个C++语音
识别
/语音
识别
API
。我经历过几次,包括誓言和麻雀花。不过,这是我的要求 我听说微软提供了一个
API
,但我愿意尽可能远离M
浏览 2
提问于2013-04-28
得票数 9
回答已采纳
1
回答
Windows语音访问命令以编程方式
、
、
、
Windows有用于语音
识别
的
API
,它还提供执行语音
识别
和执行
识别
命令的系统应用程序。是否有以编程方式发送命令的方法/
API
?文本和音频文件是可以接受的。但请不要建议使用虚拟麦克风,谢谢!澄清: 把
声音
放出来不是办法
浏览 4
提问于2022-08-11
得票数 1
1
回答
如何在仅
识别
两个命令时使MS speech
API
更准确
、
、
、
、
我正在尝试在c#应用程序的命令和控制模式下使用Speech
API
5.1。我使用的是inProc,在语法中只有两个命令。我面临的问题与检测这些命令的准确性有关。
识别
引擎无法正确
识别
命令。有时(而不是有时),它只是被任何
声音
(不是任何接近命令的
声音
)激活。有没有什么技术可以让它更严格地
识别
我仅有的两个命令?
浏览 7
提问于2013-04-26
得票数 3
回答已采纳
1
回答
ASP.NET MVC 5支持语音
识别
吗?
、
、
我想知道ASP.NET MVC 5是否支持语音
识别
。我想用它来编码一个登录系统。
浏览 2
提问于2015-02-01
得票数 1
回答已采纳
4
回答
谷歌云演讲:区分
声音
?
、
、
我感兴趣的是编写一个语音
识别
应用程序,该应用程序可以
识别
多个发言者。例如,如果Bill、Joe和Jane在说话,那么应用程序不仅可以
识别
声音
为文本,而且还可以按说话人对结果进行分类(例如0、1和2.因为很明显/希望Google没有办法把
声音
和人联系起来)。我正在寻找可能做到这一点的语音
识别
API
,而则是排名最高的
API
。我在
API
文档中查看了这些功能是否可用,但没有找到它。 我的问题是:这个功能是否存在?
浏览 4
提问于2017-02-01
得票数 5
回答已采纳
1
回答
说话人
识别
vs说话人
识别
google cloud vs microsoft azure vs ibm watson vs aws转录
、
、
、
、
我想做一个语音到文本分析的项目,我想要1)说话人
识别
,2)说话人二元化,3)语音到文本。现在我正在测试为微软,谷歌,亚马逊,IBM等公司提供的各种
API
,我发现在微软,你可以选择用户注册和说话人
识别
(),但是,所有其他平台都有说话人二值化,但没有说话人
识别
。在扬声器二元化中,如果我理解正确,它将能够“区分”用户,但它如何
识别
,除非我不注册他们?
浏览 0
提问于2020-01-20
得票数 0
1
回答
使用WebRTC将实时音频流转换为文本
、
、
我正在使用WebRTC和NodeJS实现一个像视频会议这样的系统。但我想增加一些额外的功能,假设有一位主持人和5位观众正在提问,那么1位主持人正忙着与1位主持人交谈,让观众记录他们的问题,这些问题将被转换为文本,并显示在主持人的屏幕上,这样主持人就可以根据他的要求回答问题,并留下不需要的问题。希望你能想象一下这个系统。第一件事是,这可行吗?如果是的话,任何帮助都将不胜感激。
浏览 13
提问于2014-06-07
得票数 2
3
回答
不使用Windows IOT内核的USB麦克风
、
、
场景:我在这项工作中使用了Windows.Media.SpeechRecognition
api
。但是,当我将相同的构建部署到安装了窗口IOT的Raspberry Pi2上时,程序不会检测到任何
声音
。不过,我能听到(耳机)的
声音
。然而,当我的话筒
声音
在RPi2上运行时,它并没有进入我的语音
识别
程序,而是使用了Windows10IOTCore。复制步骤: 使用Windows.Media.SpeechRecognition <
浏览 5
提问于2016-03-11
得票数 3
2
回答
如何在Chrome扩展程序中录制音频?
、
特别是有一个文本到语音的
API
,这样你就可以有效地记录到文本中,然后让计算机把它说出来,但是除非你想要一个标准的
声音
,否则这又有多糟糕、多余和容易出错呢?
浏览 2
提问于2011-11-30
得票数 8
回答已采纳
1
回答
谷歌语音到文本是如何工作的?
、
、
、
我想知道,谷歌如何在他们的语音
识别
API
中将语音转换为文本。它们是否存储了几乎所有的
声音
并在特定的频率水平上进行匹配,或者是否有不同的音频编解码算法来分析"A“、"B”、"V“、"D”、"Hello“等不同
声音
模式的
声音
。音乐有弹吉他,鼓和
声音
的
声音
,我想过滤他们在三个输出分别吉他
声音</
浏览 3
提问于2016-06-12
得票数 3
回答已采纳
2
回答
Java中Swing框架具有人脸
识别
和语音
识别
功能
、
、
、
Java中的Swing框架是否具有人脸
识别
和语音
识别
选项/功能/系统?
浏览 1
提问于2012-11-12
得票数 1
2
回答
在线自由言论
识别
器和
API
、
我想为孩子们开发一些基于网络的互动活动,我想把语音
识别
作为一种输入。我的问题是而不是关于如何在浏览器中记录
声音
,许多其他的问题已经解决了这个问题。我想知道的是,是否有某种免费的在线服务,我可以通过一个专用的
API
访问来做语音
识别
位?我的想法是录制
声音
并将其发送到服务器,这样我就不必为语音
识别
部分设置自己的专用服务器。我想苹果并没有提供免费的语音
识别
引擎(至少我没有发现),但也许其他公司会这样做呢?
浏览 4
提问于2013-02-01
得票数 0
1
回答
如何在Google Speech
API
中提高long_running_recognize的置信度
、
我目前正在使用Google speech
API
(Python)开发一个语音
识别
服务。 在现在用作样本的韩语听力评估mp3文件中,除了配音演员的
声音
之外,没有其他
声音
。我想我使用了最直观的数据作为样本,我想知道文件的长度是否会影响
识别
率,以及是否可以提高性能。
浏览 3
提问于2017-09-23
得票数 0
2
回答
使用附加上下文改进Android语音
识别
、
、
据我所知,Android使用google语音
识别
服务进行语音到文本。或者,是否有任何其他语音
识别
服务可用于此目的? 提前谢谢。
浏览 2
提问于2015-03-19
得票数 4
回答已采纳
点击加载更多
相关
资讯
名片扫描识别API
opencv笔记—人脸识别API
什么是无监督的声音识别技术?
增值税发票识别api开发接口
户口本识别_户口簿文字识别_证件识别api接口_快瞳科技
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券