腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
为
Google
Speech
API
创建
合适
的
WAV
文件
、
、
、
我正在使用pyaudio将我
的
声音录制为
wav
文件
。
Speech
API
使用了以下代码,它基本上将
WAV
文件
中
的
语音转换为文本:googleapiclient.errors.HttpError"> 我使用以下
的
变通方法:我使用ffmpeg
浏览 25
提问于2017-01-10
得票数 9
回答已采纳
2
回答
从目录中获取多个音频
文件
的
函数循环
、
、
我目前从一个目录中获取输入,用于一个音频
文件
,并将输出保存在CSV
文件
中,
文件
名和转换后
的
语音输出
为
文本输出,但该目录中有100个
文件
(即001.
wav
,002.
wav
,003.
wav
.100.
wav
)我想要写一个循环或函数,将演讲保存到CSV中
的
文本输出,并在不同
的
行中自动使用相应
的
文件
名。using
Google
S
浏览 6
提问于2016-10-06
得票数 0
回答已采纳
1
回答
在蟒蛇
的
特定时间如何获取音频?
、
我正在编写mp3
文件
,以便用
speech
_recognization python获得文本形式
的
演讲。在这里,我需要每10秒从mp3
文件
中获取文本。我无法得到准确
的
结果。因此,我
的
想法是每10秒获得音频
的
频率,如果频率太低,那么我希望将音频转换为文本(我不想使用numpy、scipy、matplotlib)。 请给出你
的
宝贵建议。
浏览 2
提问于2016-02-23
得票数 4
回答已采纳
1
回答
获取正在转换为文本
的
音频
文件
的
持续时间
、
有没有办法获得我们要转换为文本
的
音频
文件
的
持续时间(秒)?我们可以在响应正文中看到一个"totalBilledTime“。我们可以认为这是音频
的
持续时间吗?另外,用于转换为文本
的
音频
文件
在大小或时间(持续时间)方面是否有限制?
浏览 36
提问于2021-10-19
得票数 1
1
回答
google
speech
api
空结果JSON
、
、
、
我正常地调用了一个带有mp3
文件
的
格式正确
的
JSON请求
的
API
调用,我期望结果JSON数据包含"results“对象和"alternatives”对象以及"transcript“和"confidence相反,我得到
的
结果是"{}“(一个空JSON对象)。 使用
的
操作系统是ubuntu15.04。
创建
包含以下文本
的
JSON请求
文件
,并将其另存为sync-request
浏览 9
提问于2017-02-10
得票数 3
回答已采纳
1
回答
使用
Google
语音从访问音频
文件
、
、
我已经使用下面的代码成功地解析了一个包含语音
的
.
wav
文件
,并使用
Google
进行文本处理。
speech
_file = 'my/local/system/sample.
wav
'
speech
_file = 'htt
浏览 3
提问于2017-04-21
得票数 3
回答已采纳
1
回答
是否可以将numpy数组和采样率发送到microsoft
speech
- to -text,而不是将其保存到
wav
文件
?
、
、
我使用Microsoft Cognitive Services
speech
-to-text python
API
进行转录。现在,我正在通过web
API
获取声音(使用这里
的
麦克风部分:https://ricardodeazambuja.com/deep_learning/2019/03/09/audio_and_video_
google
_colabWeb
API
提供了一个numpy数组以及声音
的
采样
浏览 36
提问于2020-10-12
得票数 0
回答已采纳
1
回答
Azure语音识别-使用二进制/十六进制数据而不是
WAV
文件
路径
、
、
、
、
我正在寻找一种使用Azure语音识别
API
的
方法,传递二进制/十六进制数据而不是
WAV
文件
路径作为参数。"raw_data“是代表一个小
WAV
文件
的
十六进制数据:保存到磁盘中
的
WAV
文件
(这不是我要找
的
文件
): main_dir= os.path.dirname(__f
浏览 0
提问于2021-07-29
得票数 0
1
回答
同时使用pyaudio和语音识别
、
、
、
我想在使用语音识别时录制音频并获取音频
文件
。由于某些原因,我
的
程序总是在片刻之后崩溃。它也没有涉及到
创建
音频
文件
。我怀疑使用线程会有问题,因为这两个进程各自都工作得很好。不幸
的
是,我什么也找不到。import threadingimport pyaudioimport time sample_format = pyaudio.paInt
浏览 6
提问于2021-01-12
得票数 0
回答已采纳
1
回答
将音频
文件
拆分为多个部分,但我需要在语音识别中使用这些
文件
、
、
、
我在谷歌语音识别中遇到了关于长音频
文件
的
问题。所以我决定在15秒内拆分我
的
音频
文件
。每次我发送第一个15秒到语音识别,然后第二个15秒,以此类推… 但是现在当我使用pydub lib时,它分割音频
文件
,分割后
的
返回值不是
文件
扩展名,因为
API
需要一个
文件
扩展名作为参数(我标记了错误),它说“给定
的
音频
文件
必须是一个
文件
名字符串或一个类似
文件
的
对象
浏览 20
提问于2021-03-18
得票数 0
回答已采纳
1
回答
在
google
speech
API
的
google
存储桶中找不到音频
文件
、
使用
Google
Speech
API
(使用python示例代码),当超过1分钟时,您需要将音频
文件
放在
google
云上。根据一些示例代码,您可以使用像gs://python-docs-samples-tests/
speech
/audio.flac这样
的
路径。所以我把我
的
音频
文件
放在一个bucket中,并使用(我相信)正确
的
路径(即gs://bucket-
浏览 4
提问于2018-12-14
得票数 0
1
回答
如何将语音转换为文本?
、
将文本转换为语音完成
的
第一项任务 请检查下面的代码片段。") Console.WriteLine("
Speech
was emulated!")synthesizer.Speak(builder); synthe
浏览 3
提问于2018-02-22
得票数 0
1
回答
Google
语音
API
不能在浏览器中工作
、
、
、
、
浏览到/jet/app/www/default/
speech
/vendor/
google
/auth/src/ApplicationDefaultCredentials.php:156堆栈跟踪中
的
详细信息/gax/src/CredentialsWrapper.php中
的
第200行 namespace
Google
浏览 3
提问于2019-03-28
得票数 2
1
回答
使用selenium将音频从
文件
传递到Chrome
、
、
、
、
我正在尝试将.
wav
文件
传递给
Google
Web
Speech
API
演示使用Web
Speech
API
需要选择一种语言并单击麦克风图标。因此,我希望Chrome
的
语音识别能够识别.
wav
文件
。home/chromedriver&
浏览 3
提问于2018-02-16
得票数 4
1
回答
Google
语音
API
-在Python中证书验证失败
、
、
import
speech
_recognition as sr
GOOGLE
_CLOUD_
SPEECH
_CREDENTIALSAUDIO_FILE) as source:prin
浏览 0
提问于2018-05-15
得票数 0
1
回答
如何修复“丢失
的
google
-
api
-python-client”?使用Python、Jupyter Notebook和SpeechRecognition
、
、
、
我试图使用Python3.x,jupyter notebook和SpeechRecognition库对一些音频
文件
执行语音识别,但我得到了:conda list 当使用默认
的
google
sp
浏览 0
提问于2019-04-15
得票数 0
3
回答
Google
Cloud
Speech
API
对于超过1分钟
的
音频不返回任何内容
、
、
短于1分钟
的
音频
文件
转录没有问题,但当我尝试转录更长
的
文件
时,
Google
Speech
API
返回一个空响应。我使用以下SoX命令生成.
wav
文件
:
文件
将按预期播放。Storage,因为文档
浏览 1
提问于2017-01-02
得票数 1
1
回答
将mp4转换为
wav
后使用python语音识别获取
文件
读取错误
、
、
、
我一直在使用以下脚本将mp4
文件
批量转换为
wav
,使用第二个脚本将语音写入文本。我已经成功地运行了一段时间,并转换了大约2000音频
文件
。所有
文件
的
长度都小于60秒。然后,
speech
_recognition突然停止工作,并会为每个
文件
提供以下错误。
文件
读取错误:音频
文件
不能作为PCM
WAV
、AIFF/AIFF-C或本机FLAC读取;请检查
文件
是否损坏或以其他格式读取 任何帮助都将不胜感
浏览 16
提问于2022-02-25
得票数 -1
回答已采纳
1
回答
无法从
Google
文本到语音
api
获得结果,同时从web流音频
、
、
、
、
现在,说到问题,我没有得到任何异常或错误,但我没有从
google
得到任何结果。 from
google
.cloud import
s
浏览 0
提问于2019-05-09
得票数 34
1
回答
从python (Watson文本到语音TTS)中编辑用于Q声音/pyqt5 5
的
wav
文件
头
、
、
、
QSound从pyqt5一直给我带来麻烦,一些
wav
文件
运行良好。另一些则导致Qt应用程序出错而不运行。经过研究,我把罪魁祸首缩小到了
wav
文件
的
头上。如果我在Audacity中打开
wav
文件
并将其导出
为
wav
文件
.导出
的
wav
文件
工作得很好。但是,我需要一个在python脚本中运行
的
解决方案。我正在从沃森
的
文本到语音
a
浏览 8
提问于2020-12-04
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券