我已经使用Python语音识别工作了大半个月,制作了一个类似JARVIS的助手。我已经通过Google Speech API和Pocketsphinx使用了语音识别模块,并且我直接使用了Pocketsphinx,而没有使用其他模块。虽然识别是准确的,但我很难处理这些软件包处理语音所需的大量时间。它们的工作方式似乎是从一个静默点记录到另一个静默点,然后将记录传递给STT引擎。在处理录音的过程中,无法录制其他声音进行识别,如果我试图连续发出多个复杂的命令,这可能是一个问题。
当查看Google Assistant语音识别、Alexa的语音识别或Mac OS High Sierra的离线识别时,我看
我一直在使用谷歌语音识别的Python。下面是我的代码:
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say something!")
audio = r.listen(source)
print(r.recognize_google(audio))
虽然识别非常准确,但它需要大约4-5秒才能吐出识别出的文本。因为我正在创建一个语音助手,所以我想修改上面的代码,以使语音识别速度更快。
有没有办法把这个数字降到大约1-2秒?如
我对Python (和一般编程)比较陌生,正在尝试使用语音识别库。然而,当使用Mac OSX在Python 3.3上运行一个非常简单的程序时。
import speech_recognition as sr
r = sr.Recognizer()
sr.adjust_for_ambient_noise(source, duration = 1)
with sr.Microphone() as source: # use the default microphone as the audio source
audio = r.listen(source)
我尝试了Python中的语音识别模块(版本3.5),并得到了以下错误:
'AttributeError:‘识别器’对象没有属性‘识别’
下面是我使用的代码:
import pyaudio
import speech_recognition as sr
r = sr.Recognizer()
r.energy_threshold=4000
with sr.Microphone() as source:
audio = r.listen(source)
try:
print("Speech was:" + r.recognize(audio))
我正在尝试制作一个使用语音识别(SR)的程序,我知道在语音识别中,这是一个流行的程序库。我用pip install SpeechRecognition下载语音识别。我在编写需要PyAudio的代码时发现了这一点。我试着安装它,但是它给了我以下错误。error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": https://visualstudio.microsoft.com/downloads/。我已经找到了关于如何下载这个的教程,我也下载了它,但是它
我的总体目标是将语音识别软件的输出作为字符串输入Python。语音识别软件将所听到的信息输入到任何实时开放的领域中。不可能以任何其他方式获得输出。句子之间有几秒钟的沉默,在此期间,语音识别软件不会输入任何内容。我希望每个句子都是Python中的一个单独的字符串。
因此,我想要做的是让我的脚本不断地侦听输入,并且每当当前的输入在固定的时间内不改变时,将当前的输入保存在一个字符串中,并侦听新的输入。
类似于:
While true:
start timer
While timer <= t:
Listen for input