我正在尝试音频文件中的"BingSpeech To TextAPI“,其中包含呼叫中心应答客户的人与呼叫中心的客户之间的真实对话,以解决客户的疑惑。因此,这些音频有两个人在说话,有时在客户等待支持人员的应答时会有很长的静默期。这些音频有5到10分钟长。除了BingSpeech to Text之外,我还需要使用哪些API?
在将音频发送到BingSpeech
我在javascript中使用Bingtext to speechapi并生成随机数进行加法。为了提供支持,我想将bing的text- to -speech集成到我的代码中,但我在microsoft页面上找不到说明可以将动态参数传递给api的文档。randomNum1 = getRandom(),total =ran
我正在做IBM Watson Speech-to-text的教程。在"“部分,”打开连接并传递凭据“一节中,我复制了以下代码:console.log(token); // token looks good
var wsURI= 'wss://stream.watsonplatform.net/speech-to-text/api/
我想通过HTTPS发送一个Post请求到微软语音识别API,使用Indy的TIdHTTP在德尔菲。关于Microsofts语音识别API页面:POST https://speech.platform.bing.com/speech/recognition=audio/pcm; samplerate=16000
Ocp-Apim-Subscription-Key: YOU
我在一个需要与客户自动通信的项目中,所以我列出了使用speech- to -text和text- to -speechAPI进行通信的几种可能性,但在查看顶级云平台之一Microsoft Azure的文档时,不清楚speech to text服务是否具有巴西葡萄牙语(pt-br)的功能。我的意图是将音频传递到"speech to text“服务,以便它