首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google Cloud Speech-to-Text API的问题

Google Cloud Speech-to-Text API的问题
EN

Stack Overflow用户
提问于 2020-11-04 17:44:58
回答 2查看 212关注 0票数 0

我正在试着转录一个德语播客,我的电脑和谷歌存储桶上都有这个播客。我正在使用this tutorial作为参考。

下面是我的代码:

代码语言:javascript
复制
frame_rate, channels = frame_rate_channel('pod.wav')
gcs_uri = 'gs://callsaudiofiles21/pod.wav'

client = speech.SpeechClient()
audio = types.RecognitionAudio(uri=gcs_uri)

config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=frame_rate,
language_code='de-DE')

transcript = ''

operation = client.long_running_recognize(config, audio)
response = operation.result(timeout=10000)

for result in response.results:
    transcript += result.alternatives[0].transcript

但是它在operation行停止,输出TypeError: long_running_recognize() takes from 1 to 2 positional arguments but 3 were given。本教程是一年前的教程,因此自那以后,API中一定发生了一些变化。不过,我不确定要修改什么。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-11-04 17:59:34

看起来您使用的是旧的库版本。

Google async recognizion example中,这两个选项似乎是等效的:

代码语言:javascript
复制
    operation = client.long_running_recognize(
        request={"config": config, "audio": audio}
    )

代码语言:javascript
复制
    operation = client.long_running_recognize(config=config, audio=audio)

顺便说一句,也可以看看官方的Google Codelab for Speech to text -他们总是有最新的例子。

票数 3
EN

Stack Overflow用户

发布于 2020-11-04 17:49:39

你有没有试过这个:

代码语言:javascript
复制
operation = client.long_running_recognize(
        request={"config": config, "audio": audio}
    )
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64677600

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档