我正在试着转录一个德语播客,我的电脑和谷歌存储桶上都有这个播客。我正在使用this tutorial作为参考。
下面是我的代码:
frame_rate, channels = frame_rate_channel('pod.wav')
gcs_uri = 'gs://callsaudiofiles21/pod.wav'
client = speech.SpeechClient()
audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=frame_rate,
language_code='de-DE')
transcript = ''
operation = client.long_running_recognize(config, audio)
response = operation.result(timeout=10000)
for result in response.results:
transcript += result.alternatives[0].transcript但是它在operation行停止,输出TypeError: long_running_recognize() takes from 1 to 2 positional arguments but 3 were given。本教程是一年前的教程,因此自那以后,API中一定发生了一些变化。不过,我不确定要修改什么。
发布于 2020-11-04 17:59:34
看起来您使用的是旧的库版本。
在Google async recognizion example中,这两个选项似乎是等效的:
operation = client.long_running_recognize(
request={"config": config, "audio": audio}
)或
operation = client.long_running_recognize(config=config, audio=audio)顺便说一句,也可以看看官方的Google Codelab for Speech to text -他们总是有最新的例子。
发布于 2020-11-04 17:49:39
你有没有试过这个:
operation = client.long_running_recognize(
request={"config": config, "audio": audio}
)https://stackoverflow.com/questions/64677600
复制相似问题