对于那些在语音领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用开源软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论语音识别,它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术,以及通过SIP或电话硬件的呼叫终止。
我一直在使用谷歌语音识别的Python。下面是我的代码:
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say something!")
audio = r.listen(source)
print(r.recognize_google(audio))
虽然识别非常准确,但它需要大约4-5秒才能吐出识别出的文本。因为我正在创建一个语音助手,所以我想修改上面的代码,以使语音识别速度更快。
有没有办法把这个数字降到大约1-2秒?如