使用Google的Text to Speech API一次处理多个请求时，仅获取最后一个请求的音频

文章/答案/技术大牛

发布

1回答

node.js、google-cloud-platform、text-to-speech、google-text-to-speech、ssml

当使用Promise.all一次处理多个请求时，我似乎只得到了最后一个解析请求的audioContent。我正在合成大文本，需要使用API的字符限制对其进行拆分。我正在用亚马逊的Polly做同样的事情，它就这样工作了。这是完全相同的代码，但具有不同的客户端和不同的请

浏览 20提问于2019-04-30得票数 2

回答已采纳

2回答

如何从Google* Cloud text- to -speech *API获取SSML <mark>时间戳

markers、google-cloud-speech、google-text-to-speech、ssml

我想通过Google Cloud text- to -speech API使用来请求音频流中这些标记的计时。这些时间戳是必需的，以便向用户提供效果、单词/部分突出显示和反馈的提示。我发现是相关的，尽管问题指的是每个单词的时间戳，而不是SSML <mark>标记。下面的API请求返回OK，但显示缺少请求<e

浏览 56提问于2019-08-07得票数 14

1回答

Speech Api限制为65秒，而不是180分钟

c#、google-cloud-speech

根据的说法，异步请求持续180分钟。但是当我使用这段代码时：{ } }); // Read from the microphone and stream to APIstreamingCall.W

浏览 20提问于2018-03-05得票数 0

回答已采纳

1回答

录制的音频/webm作为Google* Speech- to -Text *API的输入

java、speech-to-text、google-speech-api

我目前使用React作为前端，使用Java Spring Boot作为服务器。我使用React-Mic录制音频，将音频传递给FormData，并将包含该FormData的HTTP post请求发送到我的Java服务器。但是，由于录制的音频是webm格式的，因此没有适用于Google Speech-To-Text API的

浏览 2提问于2019-07-10得票数 2

2回答

Google Speech to Text API无法处理超过一分钟的音频文件

python、google-speech-api

我正在尝试使用Google Speech to Text API转换具有以下属性的音频文件我使用以下Python代码来获取文本文件service_request = service.speech().asyncrecognize( 'config'

浏览 24提问于2017-01-15得票数 0

2回答

Google Cloud Speech API命令

google-cloud-platform、google-speech-api

我正在从Qwiklabs学习Google Cloud Speech API。( Qwiklabs Google Cloud Speech API链接：https://google.qwiklabs.com/focuses/588?parent=catalog) 我不知道下面的命令在Google Cloud Shell中做什么。/v1/speech:recognize?key=

浏览 17提问于2019-10-09得票数 0

回答已采纳

1回答

Google语音识别库在Python有非常慢的speech_to_text()时代

python、runtime、speech-recognition、google-speech-api、google-speech-to-text-api

正如标题所述，我正在尝试使用speech_recognition库持续侦听名为蓝宝石的AI。在重新启动代码后大约一分钟，它工作正常，但是，在运行了超过一分钟之后，speech_to_text()将永远运行。任何帮助将不胜感激，我正在寻找某种形式的解决方案，这一问题。也许我对函数的理解不够好，或者可能有一种方法可以在一段时间后停止speech_to_text()函数。除了使用线程的语音版本之外，我还

浏览 17提问于2022-03-24得票数 0

1回答

如何在nodejs上连接/连接音频缓冲区数组(文本到语音结果)？

node.js、google-text-to-speech

我想将多个文本转换成一个音频，但我很困惑如何将多个音频连接到单个音频文件中(由于5k字符/请求限制，无法将长文本转换为音频)。我现在的代码在下面。它生成多个音频字节数组，但无法合并mp3音频，因为它忽略了头/元信息。是否建议在TTS领域使用LINEAR16？我很高兴听到任何建议。谢谢。const client = new textToSpee

浏览 0提问于2021-11-03得票数 0

回答已采纳

2回答

如何检测google* cloud platform机器学习语音api中的语言*

machine-learning、google-cloud-platform、speech-to-text

是否有使用Google Cloud Platform Machine Learning的Speech API自动检测口语的选项？表示支持的语言列表，用户需要手动设置该参数才能进行语音转文本。

浏览 0提问于2017-05-23得票数 8

1回答

Azure Text* to speech因请求太多而被限制websocket错误代码: 1007，仅有3个并发请求*

javascript、azure-speech

我正在使用Azure text to speech服务。我有很多小的ssml文件，我为它们生成音频，然后使用FFMPEG组合它们。我写了一个脚本来生成所有的小音频文件。如果脚本发出3个并发请求，那么在总共20个请求之后，其他一些请求将完成，但文件将为空。如果我从脚本中删除任何并发性，并在最后一个文件的末尾和下一个请求</

浏览 1提问于2021-03-09得票数 2

1回答

使用cURL脚本遍历多个Bash请求正文参数

bash、curl、google-speech-api

我想使用Google Cloud的语音识别API将多个音频文件转换为文本。我成功地转录了一个名为“1.flac”的音频文件...请求： curl -s -H "Content-Type: application/json" \https://speech<

浏览 36提问于2020-04-21得票数 0

回答已采纳

1回答

无法在上找到文件:错误404

python、google-app-engine、google-cloud-platform、google-cloud-storage、google-speech-api

我正在尝试使用将音频剪辑.flac格式转换为文本。我使用python库进行请求，并在GCP上有一个存储音频文件并使异步requests.Below成为用于发出请求的python代码的桶。from google.cloud import storage from g

浏览 0提问于2018-02-20得票数 6

回答已采纳

2回答

我是否可以使用来自谷歌云存储的.json来使用curl进行演讲:recognize (Google* Cloud Speech- to -text)请求？*

google-cloud-platform、google-speech-api

我希望能够在我自己的云托管资源上发表演讲:recognize，这样我就可以简单地登录到Google Cloud Platform控制台，在Cloud Shell中运行命令，并查看结果。很像https://cloud.google.com/speech-to-text/docs/quickstart-protocol，除了不在本地使用任何东西。我的要求是： curl -H "Content-Type: appli

浏览 124提问于2019-03-01得票数 0

1回答

google云语音api:同步识别和异步识别有什么区别？

google-cloud-platform、google-speech-api

我是GCP的新手。当我阅读google的文档时，它说：“异步识别(REST和gRPC)向语音api发送音频数据，并启动一个长时间运行的操作。使用此操作，您可以定期轮询识别结果。”我在网上搜索了一下，并找到了一个关于这个问题的答案：，但我仍然不明白这个想法。有人能更具体地解释一下吗？我将非常感谢你的回答：)

浏览 2提问于2018-01-07得票数 2

回答已采纳

3回答

语音到文本从自己的声音文件

android、file、audio、speech-to-text

正如您可能知道的，使用Android API实现语音到文本转换非常简单。您所要做的就是调用API的意图，它将为您返回文本。我的情况有点不同，我有一个预先录制的3GPP声音文件，这是我从用户那里录制的，并保存在SD卡上。我想知道是否有可能像任何其他语音识别一样将其转录成文本。speech- to -text API允许上传您自己要处理的</

浏览 0提问于2011-08-09得票数 14

回答已采纳

2回答

node.js上的文本到音频文件

javascript、node.js、audio、text-to-speech

我正在寻找一种优化的合法方式来从nodejs上的文本创建音频文件。1)简单的hhtp请求google translate text- to -sppeach api。这个变体不是很好，因为每个请求都需要生成令牌，例如'tk:729008.879154‘，如果没有这个，它可能会失败。除此之外，这个选项是“非法的”。2)从‘控制台浏览器’到谷歌翻译文本到sppeach api<

浏览 3提问于2018-04-16得票数 1

1回答

如何使用Python从出站Twilio调用中检索信息并将其放入google* speech to text？*

python、twilio、google-speech-to-text-api

我是twilio的新手，所以我甚至不知道语音通话流是如何工作的。我只有一个任务:我需要使用twilio呼叫一个号码，并在此人停止说话时将语音输入google speech to text。我试着用django将电话转接到google，但我不知道如何设置一个webhook。我试着将语音直接发送到google speech，但是我不知道怎么做。基本上，我走进了死胡同，

浏览 10提问于2021-11-10得票数 0

回答已采纳

2回答

使用Google* Api: PC版语音转文本*

mfc、speech-recognition

Google Chrome提供了语音转文本( speech to text，STT )，因此许多智能手机应用程序都提供了STT。它有很好的认知度。如果我使用Google Speech来给Api发短信，这个问题就很容易解决了。如果没有关于STT的公共google api，请告诉我除了使用start之外的其他方法。

浏览 6提问于2012-09-19得票数 2

回答已采纳

2回答

IBM Watson基于会话的语音识别失败，并出现“会话不存在”错误

java、speech-recognition、ibm-watson

我在使用基于会话的语音识别界面时遇到问题。具体地说，我试图将较长的音频流拆分成多个块，一次上传一个，并在最后接收完整的解析文本(而不是从单个来源流式传输分块的音频)。更常见的无状态协议接受(分块的)音频流，并在完成时返回解析的内容。基于会话的方法允许客户端建立持久会话，<em

浏览 2提问于2016-06-16得票数 0

4回答

google云语音API中的无效音频源错误

google-cloud-platform、google-cloud-speech

我跟踪了谷歌的，设置了使用云语音API的所有内容。但是，当我试图发送以下请求时：我一直收到以下错误：错误：(gcloud.ml.speech.recogn

浏览 3提问于2018-05-18得票数 1

点击加载更多