Google Speech Api中句子的时间戳

文章/答案/技术大牛

发布

1回答

、、、

有没有办法在从Google Speech API收到的文本文本中获得句子而不是单词的时间戳？我目前正在实现以下代码。transcribe_gcs(gcs_uri):from google.cloudimport

浏览 4提问于2018-02-02得票数 1

回答已采纳

1回答

语音到文本的标点符号时间戳？

、、、

我能得到标点符号时间戳吗？具体地说，我想要断句的时间戳(句点、问号、感叹号)，例如0:33秒、1:01、1:23、1:49、2:05等。我想我可以使用Google或AWS来转录一个带有标点符号的文件，然后将文本分解成句子，然后为每个句子做一个单词时间戳。如果我能为getPunctuationTimestamps设置一个参数，这将会更容易(对于一个有500个句子的文

浏览 12提问于2019-06-21得票数 0

3回答

Google文本到语音字时间戳

、、

我正在通过Google的文本到语音API生成演讲，我想在他们说话的时候突出他们。有没有办法为口语或句子获得时间戳？

浏览 10提问于2019-03-24得票数 21

回答已采纳

1回答

什么算法可以用于单词列表的匹配/配对？

、、、

我正在编写一些C#代码，以便使用用于语言学习工具的Google Speech- to -Text API自动将音频映射为文本。我有一个从人类书写的来源(文字记录)中解析出来的单词列表，也有断句信息。我有一个带有时间戳的单词列表，这些单词来自对Google API的调用，它没有断句信息。我希望按顺序找到匹配的单词，这样我就可以确定句子</e

浏览 10提问于2020-06-24得票数 0

2回答

如何从google* speech *api获得每个话语的结果，并将每个音频话语块分别保存为wav文件？

、、、、

我使用下面的python脚本从google speech API获取来自实时流音频输入的预测。问题是，我需要来自google speech API的每个话语的预测，然后还将每个话语的音频保存到磁盘。我不确定，我如何修改脚本来保存每个话语的实时音频，并打印每个话语的结果，而不是连续预测。 #!/usr/bin/env python import os

浏览 37提问于2020-07-26得票数 6

2回答

如何从Google* Cloud text- to -speech *API获取SSML <mark>时间戳

、、、

我想通过Google Cloud text- to -speech API使用来请求音频流中这些标记的计时。这些时间戳是必需的，以便向用户提供效果、单词/部分突出显示和反馈的提示。我发现是相关的，尽管问题指的是每个单词的时间戳，而不是SSML <mark>标记。下面的API请求返回OK，但显示缺少请求的标

浏览 56提问于2019-08-07得票数 14

1回答

匹配Google* Cloud Speech *API中所说的短语

对于Google Cloud Speech API，有没有一种方法可以传递一个单词或完整的句子，并确定该单词或句子是否与音频文件中具有置信度得分的单词或句子相同？例如，我是否可以传递一个音频文件和单词“奶酪”，并得到一个响应，告诉我音频文件是否说“奶酪”，以及API的置信度是什么？(传递句子和音频文件的想法相同。)我知道我可以传递有用的单词或短语

浏览 1提问于2018-03-23得票数 0

1回答

Google speech to text时间戳是连续的，但口语单词之间存在间隙

、

我使用谷歌的语音转文本来转录音频，其中我已经启用了时间戳，直到那时才是问题。我的问题是时间戳是连续的，根据谷歌给出的时间戳(秒和纳秒)，单词之间没有间隔，但我提供的音频在单词之间有明显的间隔。有没有可能，我们可以让时间戳准确地说明语音中单词的确切时间。我试图计算单词之间的间距，也会计算单词

浏览 19提问于2020-06-16得票数 0

1回答

我跟随社区google云平台连接到twilio来捕获语音呼叫，并将其保存到桶中。但是，由于下面的错误消息，它无法翻译声音。有人知道为什么google.cloud.speech.v1.RecognizeRequest不能识别桶吗？/node_modules/@google-cloud/speech/node_modules/lodash/lodash.js:499:17) at ServiceClient.wrapper at&

浏览 2提问于2017-08-08得票数 1

1回答

如何使用google* speech recognition进行实时语音识别*

、

关于我在项目中遇到的一个问题，我有一个问题。它被认为是通过言语与使用者交流的。我正在使用google speech api向系统发出命令。它需要一些时间来处理命令，然后响应back.The问题是，它需要比预期更长的暂停时间(6-8秒)，然后继续回答。对于我的程序，我需要实时语音识别，以便系统在我完成问题后立即响应。我的问题是，有没有办法在说出每个单词时将其发送到API，而不是在完成后发送整个<em

浏览 36提问于2017-10-20得票数 3

1回答

通过为每个被转录的单词获取时间戳？

、、、、

这个简单的脚本以wav作为输入，并以相当高的精度转录它。") as f:name = sys.argv[1] # wav fileall_text.append(text) with open("~/Documents

浏览 0提问于2018-03-21得票数 2

1回答

Google Cloud Speech API与Web Speech API的单词错误率

、、

我目前正在使用W3C Web Speech API的西班牙语和普通话。总体而言，识别是可以的，但有许多错误(特别是对于单个单词)，有时转录的西班牙语单词会随意添加重音，例如lo siento ==> lo síento。我正在考虑切换到更健壮、更准确的API，并找到了Google Speech API。虽然Web Speech API是免费的，但我更愿意花钱

浏览 7提问于2019-09-11得票数 0

回答已采纳

1回答

获取正在转换为文本的音频文件的持续时间

、

有没有办法获得我们要转换为文本的音频文件的持续时间(秒)？我们可以在响应正文中看到一个"totalBilledTime“。我们可以认为这是音频的持续时间吗？另外，用于转换为文本的音频文件在大小或时间(持续时间)方面是否有限制？

浏览 36提问于2021-10-19得票数 1

1回答

谷歌应用脚本regex 3如何删除括号内的文本？

、

我在google文档中有以下文本。后面跟着作者的数据文本，括在括号内的时间戳。时间戳也在句子的末尾。一些数据文本也可能有括号：时间戳之间的更多文本。对上述文本的描述(C189)

浏览 2提问于2017-04-22得票数 2

回答已采纳

2回答

node webkit text to speech* api不工作？*

、、

我正在尝试建立一个节点webkit的应用程序，这是运行在铬浏览器和一些文本到语音的api是不能正常工作在节点webkit (windows)。

浏览 1提问于2015-02-05得票数 0

1回答

word时间戳总是连续的并且总是从0开始吗？

、

在google cloud speech to text中，我正在使用PHP获取文档here中单词的时间戳。两个问题:第一个单词总是从0开始，即使音频文件在0之后才有任何声音。即使说话者在单词之间停顿，每个单词的时间戳都紧跟着另一个单词。有没有可能用PHP获得更精确的word时间戳？

浏览 18提问于2020-09-14得票数 0

回答已采纳

2回答

Google Speech API -数字表示为字符串？

我使用的是Google Speech API，每当说出一个数字时，API都会将其作为数字字符串返回，而不是字母。假设语句是“他17岁”。- API将返回“他17岁”。现在，这在大多数情况下都很有用，但在我的情况下，我需要返回的字符串是字母而不是数字-‘他17岁。’是否有任何选项可以用字母返回已识别的话语？

浏览 10提问于2019-01-18得票数 1

1回答

如何在Azure speech* to text模型中获取要生成的时间戳？*

、、

我正在尝试使用Azure的speech to text代码生成和收集数据。我想生成时间戳，减少输出中的冗余，并导出到Excel。如何生成时间戳数据？另外，有没有一种方法可以消除输出中的冗余？: Text=the speech translation API RECOGNIZING: Text=the speech translation API

浏览 15提问于2021-04-01得票数 0

回答已采纳

1回答

华生演讲文本中没有时间戳

、、、

我使用的是Watson-Developer-Cloud模块，下面是示例：timestamps: true, profanity_filter: false, word_confidence:true url: "https://stream.watsonplatform.net/speech-to-text/api", username: '

浏览 2提问于2016-07-18得票数 0

1回答

在React-Native上实现Google* Cloud语音转文本*

、、

我正在尝试在react原生应用上实现谷歌的语音到文本转换，但是我找不到关于它的示例或文档，我对react-native还很陌生，所以我有点迷路了，谷歌官方文档上有一个sample using node.js下面是Node.js示例： async function main() { const speech = require('@google-cloud/speec

浏览 31提问于2019-02-05得票数 1

点击加载更多