为Google Speech API创建合适的WAV文件

文章/答案/技术大牛

发布

1回答

、、、

我正在使用pyaudio将我的声音录制为wav文件。Speech API使用了以下代码，它基本上将WAV文件中的语音转换为文本：googleapiclient.errors.HttpError"> 我使用以下的变通方法:我使用ffmpeg

浏览 25提问于2017-01-10得票数 9

回答已采纳

2回答

从目录中获取多个音频文件的函数循环

、、

我目前从一个目录中获取输入，用于一个音频文件，并将输出保存在CSV文件中，文件名和转换后的语音输出为文本输出，但该目录中有100个文件(即001.wav，002.wav，003.wav.100.wav)我想要写一个循环或函数，将演讲保存到CSV中的文本输出，并在不同的行中自动使用相应的文件名。using Google S

浏览 6提问于2016-10-06得票数 0

回答已采纳

1回答

在蟒蛇的特定时间如何获取音频？

、

我正在编写mp3文件，以便用speech_recognization python获得文本形式的演讲。在这里，我需要每10秒从mp3文件中获取文本。我无法得到准确的结果。因此，我的想法是每10秒获得音频的频率，如果频率太低，那么我希望将音频转换为文本(我不想使用numpy、scipy、matplotlib)。请给出你的宝贵建议。

浏览 2提问于2016-02-23得票数 4

回答已采纳

1回答

获取正在转换为文本的音频文件的持续时间

、

有没有办法获得我们要转换为文本的音频文件的持续时间(秒)？我们可以在响应正文中看到一个"totalBilledTime“。我们可以认为这是音频的持续时间吗？另外，用于转换为文本的音频文件在大小或时间(持续时间)方面是否有限制？

浏览 36提问于2021-10-19得票数 1

1回答

google speech api空结果JSON

、、、

我正常地调用了一个带有mp3文件的格式正确的JSON请求的API调用，我期望结果JSON数据包含"results“对象和"alternatives”对象以及"transcript“和"confidence相反，我得到的结果是"{}“(一个空JSON对象)。使用的操作系统是ubuntu15.04。创建包含以下文本的JSON请求文件，并将其另存为sync-request

浏览 9提问于2017-02-10得票数 3

回答已采纳

1回答

使用Google语音从访问音频文件

、、

我已经使用下面的代码成功地解析了一个包含语音的.wav文件，并使用Google进行文本处理。speech_file = 'my/local/system/sample.wav'speech_file = 'htt

浏览 3提问于2017-04-21得票数 3

回答已采纳

1回答

是否可以将numpy数组和采样率发送到microsoft speech- to -text，而不是将其保存到wav文件？

、、

我使用Microsoft Cognitive Services speech-to-text python API进行转录。现在，我正在通过web API获取声音(使用这里的麦克风部分：https://ricardodeazambuja.com/deep_learning/2019/03/09/audio_and_video_google_colabWeb API提供了一个numpy数组以及声音的采样

浏览 36提问于2020-10-12得票数 0

回答已采纳

1回答

Azure语音识别-使用二进制/十六进制数据而不是WAV文件路径

、、、、

我正在寻找一种使用Azure语音识别API的方法，传递二进制/十六进制数据而不是WAV文件路径作为参数。"raw_data“是代表一个小WAV文件的十六进制数据：保存到磁盘中的WAV文件(这不是我要找的文件)： main_dir= os.path.dirname(__f

浏览 0提问于2021-07-29得票数 0

1回答

同时使用pyaudio和语音识别

、、、

我想在使用语音识别时录制音频并获取音频文件。由于某些原因，我的程序总是在片刻之后崩溃。它也没有涉及到创建音频文件。我怀疑使用线程会有问题，因为这两个进程各自都工作得很好。不幸的是，我什么也找不到。import threadingimport pyaudioimport time sample_format = pyaudio.paInt

浏览 6提问于2021-01-12得票数 0

回答已采纳

1回答

将音频文件拆分为多个部分，但我需要在语音识别中使用这些文件

、、、

我在谷歌语音识别中遇到了关于长音频文件的问题。所以我决定在15秒内拆分我的音频文件。每次我发送第一个15秒到语音识别，然后第二个15秒，以此类推… 但是现在当我使用pydub lib时，它分割音频文件，分割后的返回值不是文件扩展名，因为API需要一个文件扩展名作为参数(我标记了错误)，它说“给定的音频文件必须是一个文件名字符串或一个类似文件的对象

浏览 20提问于2021-03-18得票数 0

回答已采纳

1回答

在google* speech *API的google存储桶中找不到音频文件

、

使用Google Speech API (使用python示例代码)，当超过1分钟时，您需要将音频文件放在google云上。根据一些示例代码，您可以使用像gs://python-docs-samples-tests/speech/audio.flac这样的路径。所以我把我的音频文件放在一个bucket中，并使用(我相信)正确的路径(即gs://bucket-

浏览 4提问于2018-12-14得票数 0

1回答

如何将语音转换为文本？

、

将文本转换为语音完成的第一项任务请检查下面的代码片段。") Console.WriteLine("Speech was emulated!")synthesizer.Speak(builder); synthe

浏览 3提问于2018-02-22得票数 0

1回答

Google语音API不能在浏览器中工作

、、、、

浏览到/jet/app/www/default/speech/vendor/google/auth/src/ApplicationDefaultCredentials.php:156堆栈跟踪中的详细信息/gax/src/CredentialsWrapper.php中的第200行 namespace Google

浏览 3提问于2019-03-28得票数 2

1回答

使用selenium将音频从文件传递到Chrome

、、、、

我正在尝试将.wav文件传递给Google Web Speech API演示使用Web SpeechAPI需要选择一种语言并单击麦克风图标。因此，我希望Chrome的语音识别能够识别.wav文件。home/chromedriver&

浏览 3提问于2018-02-16得票数 4

1回答

Google语音API -在Python中证书验证失败

、、

import speech_recognition as sr GOOGLE_CLOUD_SPEECH_CREDENTIALSAUDIO_FILE) as source:prin

浏览 0提问于2018-05-15得票数 0

1回答

如何修复“丢失的google-api-python-client”？使用Python、Jupyter Notebook和SpeechRecognition

、、、

我试图使用Python3.x，jupyter notebook和SpeechRecognition库对一些音频文件执行语音识别，但我得到了：conda list 当使用默认的google sp

浏览 0提问于2019-04-15得票数 0

3回答

Google Cloud Speech API对于超过1分钟的音频不返回任何内容

、、

短于1分钟的音频文件转录没有问题，但当我尝试转录更长的文件时，Google Speech API返回一个空响应。我使用以下SoX命令生成.wav文件：文件将按预期播放。Storage，因为文档

浏览 1提问于2017-01-02得票数 1

1回答

将mp4转换为wav后使用python语音识别获取文件读取错误

、、、

我一直在使用以下脚本将mp4文件批量转换为wav，使用第二个脚本将语音写入文本。我已经成功地运行了一段时间，并转换了大约2000音频文件。所有文件的长度都小于60秒。然后，speech_recognition突然停止工作，并会为每个文件提供以下错误。文件读取错误:音频文件不能作为PCM WAV、AIFF/AIFF-C或本机FLAC读取；请检查文件是否损坏或以其他格式读取任何帮助都将不胜感

浏览 16提问于2022-02-25得票数 -1

回答已采纳

1回答

无法从Google文本到语音api获得结果，同时从web流音频

、、、、

现在，说到问题，我没有得到任何异常或错误，但我没有从google得到任何结果。 from google.cloud import s

浏览 0提问于2019-05-09得票数 34

1回答

从python (Watson文本到语音TTS)中编辑用于Q声音/pyqt5 5的wav文件头

、、、

QSound从pyqt5一直给我带来麻烦，一些wav文件运行良好。另一些则导致Qt应用程序出错而不运行。经过研究，我把罪魁祸首缩小到了wav文件的头上。如果我在Audacity中打开wav文件并将其导出为wav文件.导出的wav文件工作得很好。但是，我需要一个在python脚本中运行的解决方案。我正在从沃森的文本到语音a

浏览 8提问于2020-12-04得票数 1

回答已采纳

点击加载更多