谷歌Speech APi不能转换完整的音频文本

文章/答案/技术大牛

发布

1回答

嗨，我们实现了谷歌语音应用程序接口，在我们的节点js项目.my客户端库是节点js .we正在转换成flex格式的第一个文件，然后存储到谷歌桶.then网址用于转换为文本。我们面临的问题是，完整的音频文件不能转换为文本。只有半个文件正在转换为文本。不会出现错误。

浏览 14提问于2017-12-16得票数 0

1回答

谷歌云语音应用编程接口不是从base64音频转录而来

、、

我正在尝试使用Google cloud speech API，在我的Angular FrontEnd中录制音频，将其转换为base64，然后发送到我的Node后端，后者执行对google speechAPI的查询。到目前为止，我还没有用它成功，谷歌只给我发送空的结果。您将看到，为了识别问题，我遍历了所有可能的sampleRate和音频格式。另一件要注意的

浏览 3提问于2018-02-15得票数 7

回答已采纳

1回答

Speech Api限制为65秒，而不是180分钟

、

根据的说法，异步请求持续180分钟。Transcript.ToString()); } await prinResp; } 65秒后，streamingCall.WriteAsync显示“超过了65秒的最大允许流持续时间

浏览 20提问于2018-03-05得票数 0

回答已采纳

1回答

支持使用Google Speech* API将音频转录为文本的音频长度*

我想使用谷歌语音api将音频转换为文本。Google Speech API适用于小于或等于16秒的音频，但不适用于长度大于16秒的音频。不知道这个API支持多少长音频转换。如果我买了，他们是否支持更长的音频转换？任何指点都是非常感谢的。

浏览 5提问于2016-09-29得票数 0

2回答

如何在python中从音频中检测语言？

、、

我尝试过使用FFMPEG从视频中提取音频。如何将语音转换为文本并检测语言？我已经尝试使用，我的代言语言谷歌云-speech到文本api

浏览 6提问于2020-07-06得票数 2

1回答

匹配Google Cloud Speech* API中所说的短语*

对于Google Cloud Speech API，有没有一种方法可以传递一个单词或完整的句子，并确定该单词或句子是否与音频文件中具有置信度得分的单词或句子相同？例如，我是否可以传递一个音频文件和单词“奶酪”，并得到一个响应，告诉我音频文件是否说“奶酪”，以及API的置信度是什么？(传递句子和音频文件的想法相同。)我知道我可以传递有用的单词或短语，但据我所知，这些

浏览 1提问于2018-03-23得票数 0

1回答

如何使用google convert将语音转换为基于印度口音的文本

、、、、

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US，这段代码，我能够转换完美，文本是基于音频的US，口音或UK。当我试图转换印度口音时，这个文本完全错误，我尝试过en-in，但没有用。我如何转换？：这里我上传(.wav)音频</e

浏览 11提问于2021-07-09得票数 0

5回答

Google语音识别API

、、

我正在尝试使用Google Speech API v2 (地址为https://www.google.com/speech-api/v2/recognize?...)我需要使用我的Api密钥，但是当我使用它时，我得到error 403 Forbidden 当我使用我下载的示例项目中的API密钥时，它工作得很好。我在Google开发者控制台看到，我可以启用很多api选项

浏览 3提问于2014-05-12得票数 20

1回答

有没有办法使用microsoft LUIS和React Native？

、、、、

有没有办法使用Microsoft LUIS和React Native？我想用麦克风录制语音，将其存储在wave文件中，并将该wave文件发送给LUIS，以识别意图？有什么建议，有什么例子吗？

浏览 40提问于2019-11-29得票数 0

1回答

Bing Speech* to Text API返回非常错误的文本*

、

我正在尝试音频文件中的"Bing Speech To Text API“，其中包含呼叫中心应答客户的人与呼叫中心的客户之间的真实对话，以解决客户的疑惑。因此，这些音频有两个人在说话，有时在客户等待支持人员的应答时会有很长的静默期。这些音频有5到10分钟长。我的疑问是：使用Microsoft Cognitive Services将这样的音频</e

浏览 0提问于2017-12-31得票数 0

1回答

如何使Google Speech* to Text API异步*

、、、、

我正在使用Google Speech to Text API转换音频文件。问题是，在谷歌语音到文本，我们必须等待操作完成，即使我们让它异步，因为它的文档说通过使用long_running_recognize()。有没有办法让它完全异步？因此，当我们上传音频文件时，它会给我们一个operation_id，我们可以使用它在任何时候异步下载转录。

浏览 2提问于2020-06-25得票数 0

1回答

Google Speech* to Text不能处理大文件*

、、

我正在尝试使用Google speech api将音频文件转换为文本。如果音频是30秒或更短，它的工作正常，但当音频文件长于30秒，那么它不会将音频文件转换为文本。请帮帮我，我该怎么办？

浏览 17提问于2017-12-27得票数 1

1回答

Python :位置参数跟在关键字参数后面|SyntaxError语音转文本客户端

、、

我正在尝试使用谷歌云API将音频转换为文本。我正在关注他们的官方文档，但这让我一直给出一个错误 ,requests,SyntaxError: positional argumentfollows keyword argumentimport ioclient = <em

浏览 1提问于2019-04-10得票数 2

2回答

为什么Google Speech* Recognition API只返回音频的前2-3秒转换文本*

、、

我在Google Cloud控制台中创建了一个项目，并在此项目中启用了Google Speech API，并创建了凭据。也使用了谷歌推荐的transcribe.py，我可以使用由谷歌控制台生成的API密钥成功地将音频文件(30秒)转换为文本，但不完全，只有2-3秒。来自谷歌的回复是这样的：{"results"：[{"alter

浏览 1提问于2016-10-21得票数 3

1回答

如何将MP3音频文件转换为字节数组？

、、、

如何将MP3音频文件转换为字节数组，以便发送到IBM Watson中的服务器，以便使用speech to text API将音频转换为文本

浏览 220提问于2019-02-15得票数 0

1回答

如何在python中使用google语音识别api？

、、、

我有一个mp3文件，我想使用谷歌的语音识别从该文件中提取文本。任何我可以找到文档或示例的想法都将不胜感激。

浏览 4提问于2016-08-02得票数 16

回答已采纳

2回答

React-将本地语音转换为文本

、、、、

我正在尝试使用Watson Speech to text API在react原生应用程序中录制音频，然后将音频转换为文本。 var SpeechToTextV1 = requ

浏览 56提问于2017-01-28得票数 2

1回答

获取使用AT&T speech* api的OAuth访问令牌*

、、

我正在使用AT&T Speech API将语音转换为文本，在我的iphone app.Where中，我需要将音频转换为文本。我的问题是:如何获取OAuth访问令牌？因为我需要它来进行API调用。

浏览 1提问于2013-01-09得票数 1

1回答

Google-speech-api抛出EOF错误，而不是执行音频转录

、、、、

在我的项目中，我在golang开发了一个websocket服务器，它通过ARI控制asterisk频道，并使用google-speech-api在同一频道上执行实时音频转录。在连接时，我想保存音频从一个星号频道到文件，同时发送音频到谷歌，并获得文字记录。音频是由asterisk audiofork应用程序发送的，这样我就可以使用ARI操纵频道，而音频则在另一个线程上流式传输。问题是，当我发送帧到谷歌

浏览 73提问于2021-10-07得票数 0

回答已采纳

1回答

GoogleCloudSpeechAPILongrunning既只返回名称

我试图使用将一个多小时的音频数据转换为文本，而我使用的是API资源管理器，因为它很容易。{ "uri": &quo

浏览 2提问于2017-05-18得票数 5

点击加载更多