声音识别api - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

能否向Azure说话人识别API发送实时数据？

、、、、

我正在写一个与声音有关的项目。我正在开发一个功能来实时区分人们的声音。我使用Microsoft说话人识别API来区分人们的声音。因此，我的问题是:如何使用实时音频流来实现说话人识别？我可以使用Azure扬声器识别API获得实时音频，它只需要WAV文件？或者，除了这个AP

浏览 4提问于2018-01-14得票数 1

1回答

C# SpeechSynthesizer GetInstalledVoices -只列出两个声音

、

我试图通过以下代码获取已安装的声音列表： using(SpeechSynthesizer synth = new System.Speech.Synthesis.SpeechSynthesizer然而，在Windows控制面板中，我可以单独看到德语的3种声音。我做错了什么？

浏览 23提问于2022-01-02得票数 0

2回答

语音识别接口SDK (Android)

、、

我需要做一个Android应用程序，可以识别我创建的某些声音文件，并在识别时执行操作。所以类似于Shazam/Soundhound的东西，但有我自己的声音文件。有没有什么API或者SDK之类的东西？PS:为了清楚，我不想要语音识别，或者文本到语音转换。我的声音文件可以有音乐，失真的声音，效果等

浏览 2提问于2013-06-20得票数 11

回答已采纳

1回答

我想在上面实现一个语音识别功能。假设我有一些用户称之为“嘿”、“1”、“2”、"tea“的记录，当他/她说”嘿“时，语音识别api应该识别这些记录的第一个输入。”我已经找到了一些apis，这些apis支持语音识别或有听觉打印算法。但我不想用它们。让我解释一下为什么我不使用这些apis。首先，语音识别apis试图理解单词并转换为文本。但是，这仅限于api支持的语言。即使语音识别api支持英语语言。因为

浏览 4提问于2016-06-20得票数 4

2回答

识别声卡输出中正在播放的音乐的软件

我正在寻找一个软件(用于PC，而不是移动)，它能够识别计算机声卡输出上正在播放/播放的音乐，而不需要使用麦克风来检测声音。示例：识别应用程序正在播放的音乐有谁知道有这样的应用程序吗？

浏览 0提问于2015-09-18得票数 6

回答已采纳

1回答

Google语音识别在电影上的应用

、

我用自然对话的获得了很好的效果，但是对于Youtube视频或电影的声音识别很差或者根本不存在。在我的iPhone 4上录制西班牙语和英语的声音都可以识别，但在看电影时用同一部手机几乎是不可能的，即使是一个人物说话的场景，背景噪音也很小。只有一次成功。我试着用清理声音，使用noisered和compand efects，但没有成功。有什么想法吗？或者仅仅是Google API不能识别的声音，因为你改变了更多？它会在其他语音识别软件上取

浏览 0提问于2013-06-03得票数 3

1回答

C++语音识别API

、、、、

我正在寻找一个C++语音识别/语音识别API。我经历过几次，包括誓言和麻雀花。不过，这是我的要求我听说微软提供了一个API，但我愿意尽可能远离M

浏览 2提问于2013-04-28得票数 9

回答已采纳

1回答

Windows语音访问命令以编程方式

、、、

Windows有用于语音识别的API，它还提供执行语音识别和执行识别命令的系统应用程序。是否有以编程方式发送命令的方法/API？文本和音频文件是可以接受的。但请不要建议使用虚拟麦克风，谢谢！澄清：把声音放出来不是办法

浏览 4提问于2022-08-11得票数 1

1回答

如何在仅识别两个命令时使MS speech API更准确

、、、、

我正在尝试在c#应用程序的命令和控制模式下使用Speech API5.1。我使用的是inProc，在语法中只有两个命令。我面临的问题与检测这些命令的准确性有关。识别引擎无法正确识别命令。有时(而不是有时)，它只是被任何声音(不是任何接近命令的声音)激活。有没有什么技术可以让它更严格地识别我仅有的两个命令？

浏览 7提问于2013-04-26得票数 3

回答已采纳

1回答

ASP.NET MVC 5支持语音识别吗？

、、

我想知道ASP.NET MVC 5是否支持语音识别。我想用它来编码一个登录系统。

浏览 2提问于2015-02-01得票数 1

回答已采纳

4回答

谷歌云演讲:区分声音？

、、

我感兴趣的是编写一个语音识别应用程序，该应用程序可以识别多个发言者。例如，如果Bill、Joe和Jane在说话，那么应用程序不仅可以识别声音为文本，而且还可以按说话人对结果进行分类(例如0、1和2.因为很明显/希望Google没有办法把声音和人联系起来)。我正在寻找可能做到这一点的语音识别API，而则是排名最高的API。我在API文档中查看了这些功能是否可用，但没有找到它。我的问题是:这个功能是否存在？

浏览 4提问于2017-02-01得票数 5

回答已采纳

1回答

说话人识别vs说话人识别google cloud vs microsoft azure vs ibm watson vs aws转录

、、、、

我想做一个语音到文本分析的项目，我想要1)说话人识别，2)说话人二元化，3)语音到文本。现在我正在测试为微软，谷歌，亚马逊，IBM等公司提供的各种API，我发现在微软，你可以选择用户注册和说话人识别()，但是，所有其他平台都有说话人二值化，但没有说话人识别。在扬声器二元化中，如果我理解正确，它将能够“区分”用户，但它如何识别，除非我不注册他们？

浏览 0提问于2020-01-20得票数 0

1回答

使用WebRTC将实时音频流转换为文本

、、

我正在使用WebRTC和NodeJS实现一个像视频会议这样的系统。但我想增加一些额外的功能，假设有一位主持人和5位观众正在提问，那么1位主持人正忙着与1位主持人交谈，让观众记录他们的问题，这些问题将被转换为文本，并显示在主持人的屏幕上，这样主持人就可以根据他的要求回答问题，并留下不需要的问题。希望你能想象一下这个系统。第一件事是，这可行吗？如果是的话，任何帮助都将不胜感激。

浏览 13提问于2014-06-07得票数 2

3回答

不使用Windows IOT内核的USB麦克风

、、

场景：我在这项工作中使用了Windows.Media.SpeechRecognition api。但是，当我将相同的构建部署到安装了窗口IOT的Raspberry Pi2上时，程序不会检测到任何声音。不过，我能听到(耳机)的声音。然而，当我的话筒声音在RPi2上运行时，它并没有进入我的语音识别程序，而是使用了Windows10IOTCore。复制步骤：使用Windows.Media.SpeechRecognition <

浏览 5提问于2016-03-11得票数 3

2回答

如何在Chrome扩展程序中录制音频？

、

特别是有一个文本到语音的API，这样你就可以有效地记录到文本中，然后让计算机把它说出来，但是除非你想要一个标准的声音，否则这又有多糟糕、多余和容易出错呢？

浏览 2提问于2011-11-30得票数 8

回答已采纳

1回答

谷歌语音到文本是如何工作的？

、、、

我想知道，谷歌如何在他们的语音识别API中将语音转换为文本。它们是否存储了几乎所有的声音并在特定的频率水平上进行匹配，或者是否有不同的音频编解码算法来分析"A“、"B”、"V“、"D”、"Hello“等不同声音模式的声音。音乐有弹吉他，鼓和声音的声音，我想过滤他们在三个输出分别吉他声音</

浏览 3提问于2016-06-12得票数 3

回答已采纳

2回答

Java中Swing框架具有人脸识别和语音识别功能

、、、

Java中的Swing框架是否具有人脸识别和语音识别选项/功能/系统？

浏览 1提问于2012-11-12得票数 1

2回答

在线自由言论识别器和API

、

我想为孩子们开发一些基于网络的互动活动，我想把语音识别作为一种输入。我的问题是而不是关于如何在浏览器中记录声音，许多其他的问题已经解决了这个问题。我想知道的是，是否有某种免费的在线服务，我可以通过一个专用的API访问来做语音识别位？我的想法是录制声音并将其发送到服务器，这样我就不必为语音识别部分设置自己的专用服务器。我想苹果并没有提供免费的语音识别引擎(至少我没有发现)，但也许其他公司会这样做呢？

浏览 4提问于2013-02-01得票数 0

1回答

如何在Google Speech API中提高long_running_recognize的置信度

、

我目前正在使用Google speech API (Python)开发一个语音识别服务。在现在用作样本的韩语听力评估mp3文件中，除了配音演员的声音之外，没有其他声音。我想我使用了最直观的数据作为样本，我想知道文件的长度是否会影响识别率，以及是否可以提高性能。

浏览 3提问于2017-09-23得票数 0

2回答

使用附加上下文改进Android语音识别

、、

据我所知，Android使用google语音识别服务进行语音到文本。或者，是否有任何其他语音识别服务可用于此目的？提前谢谢。

浏览 2提问于2015-03-19得票数 4

回答已采纳

点击加载更多

能否向Azure说话人识别API发送实时数据？

C# SpeechSynthesizer GetInstalledVoices -只列出两个声音

语音识别接口SDK (Android)

语音识别

识别声卡输出中正在播放的音乐的软件

Google语音识别在电影上的应用

C++语音识别API

Windows语音访问命令以编程方式

如何在仅识别两个命令时使MS speech API更准确

ASP.NET MVC 5支持语音识别吗？

谷歌云演讲:区分声音？

说话人识别vs说话人识别google cloud vs microsoft azure vs ibm watson vs aws转录

使用WebRTC将实时音频流转换为文本

不使用Windows IOT内核的USB麦克风

如何在Chrome扩展程序中录制音频？

谷歌语音到文本是如何工作的？

Java中Swing框架具有人脸识别和语音识别功能

在线自由言论识别器和API

如何在Google Speech API中提高long_running_recognize的置信度

使用附加上下文改进Android语音识别

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐