对于那些在语音领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用开源软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论语音识别,它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术,以及通过SI
我已经使用Python语音识别工作了大半个月,制作了一个类似JARVIS的助手。我已经通过Google Speech API和Pocketsphinx使用了语音识别模块,并且我直接使用了Pocketsphinx,而没有使用其他模块。虽然识别是准确的,但我很难处理这些软件包处理语音所需的大量时间。它们的工作方式似乎是从一个静默点记录到另一个静默点,然后将记录传递给STT引擎。当查看Google Ass