我正在评估"BingSpeechAPI“和它的新兄弟"Speech Service”(仍处于预览模式),这是一个基于Xamarin的简单语音识别移动应用程序。我使用API REST获得了很好的效果,但它的持续时间长度限制为15秒,这使得申请连续语音识别和唤醒单词变得困难。由于这个原因,我还探索了基于web socket (也称为客户端库)的BingSpeech and Speech Service SDK。您是否知道在Xama
我正在尝试音频文件中的"BingSpeech To Text API“,其中包含呼叫中心应答客户的人与呼叫中心的客户之间的真实对话,以解决客户的疑惑。除了BingSpeech to Text之外,我还需要使用哪些API?
在将音频发送到BingSpeech to Text之前,我需要对音频进行剪切或转换吗?我之所以这样问,是因为BingSpeech to text API返回的文本
我在javascript中使用Bing text to speechapi并生成随机数进行加法。为了提供支持,我想将bing的text- to -speech集成到我的代码中,但我在microsoft页面上找不到说明可以将动态参数传递给api的文档。bingClientTTS.synthesize(randomNum1.value);有没有