语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。...我写的是语音识别,默认就已经开通了语音识别和语音合成。
这就够了,所以接口选择,不用再选了。
语音包名,选择不需要。...AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好百度', 'zh', 1, {
'vol': 5,
})
# 识别正确返回语音二进制...接下来,需要进行语音识别,看文档
点击左边的百度语言->语音识别->Python SDK
?
支持的语言格式有3种。分别是pcm,wav,amr
建议使用pcm,因为它比较好实现。...(text, 'zh', 1, {
'spd':5,
'vol': 5,
'pit':5,
'per':0
})
# 识别正确返回语音二进制