我已经使用Python语音识别工作了大半个月,制作了一个类似JARVIS的助手。我已经通过Google Speech API和Pocketsphinx使用了语音识别模块,并且我直接使用了Pocketsphinx,而没有使用其他模块。虽然识别是准确的,但我很难处理这些软件包处理语音所需的大量时间。它们的工作方式似乎是从一个静默点记录到另一个静默点,然后将记录传递给STT引擎。在处理录音的过程中,无法录制其他声音进行识别,如果我试图连续发出多个复杂的命令,这可能是一个问题。
当查看Google Assistant语音识别、Alexa的语音识别或Mac OS High Sierra的离线识别时,我看
我试着用python和python电报- bot包构建一个电报机器人,现在我尝试向用户发送一个语音命令。
我的代码就像
def start(update, context):
engine = pyttsx3.init()
engine.save_to_file('welcome to this bot', 'voice.mp3')
engine.runAndWait()
#return update.message.reply_text('hi i am bot with your friend')
生成mp3文件,然后如何将该语音文件发送给
文本到语音
我一直试图在windows和Linux环境中运行pyttsx .
Linux环境:
import pyttsx
engine = pyttsx.init()
python在执行第一行之后就挂起了。我通过在交互式shell提示符中运行这两行来验证上述语句。
windows环境:
import pyttsx
engine = pyttsx.init()
engine.say('Sally sells seashells by the seashore.')
engine.say('The quick brown fox jumped over the lazy
苹果是否允许像scriptable (javascript)或pythonista (python)这样的第三方应用程序接受通过Siri语音命令提供的参数,如果允许,我们如何在可脚本(javascript)脚本中访问这些参数?如果没有,有没有什么办法可以让人写一个可脚本化的脚本,然后让它(以某种方式)接受一些语音输入?
到目前为止我所知道的
Scriptable提供了一个来自'share sheet‘的args示例,尽管它不完全清楚是否可以通过Siri语音接收一个类似的args变量
// Run from a share sheet to see which
// arguments