腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Google-speech-api
抛出
EOF
错误
,
而
不是
执行
音频
转录
、
、
、
、
在我的项目中,我在golang开发了一个websocket服务器,它通过ARI控制asterisk频道,并使用
google-speech-api
在同一频道上
执行
实时
音频
转录
。在连接时,我想保存
音频
从一个星号频道到文件,同时发送
音频
到谷歌,并获得文字记录。
音频
是由asterisk audiofork应用程序发送的,这样我就可以使用ARI操纵频道,
而
音频
则在另一个线程上流式传输。问题是,当我发送帧到谷歌,我得到
EOF
<e
浏览 73
提问于2021-10-07
得票数 0
回答已采纳
1
回答
亚马逊
转录
作业文件超过2048.00 Mb的最大大小
、
、
我尝试使用位于上的输入文件创建一个,该文件的大小为4.3GB,当我试图创建作业时,会显示此
错误
。
浏览 2
提问于2020-07-29
得票数 0
回答已采纳
1
回答
IBM语音到文本服务调用返回
错误
、
然后,我使用以下IBM指令
执行
了试用调用: 调用POST /v1/recognize方法,请求没有附加请求参数的FLAC
音频
文件的基本
转录
。首先,下载示例
音频
文件-file.flc。 然后,发出以下命令,调用服务的/v1/recognize方法,用于不带参数的基本
转录
。该示例使用Content标头来指示
音频
、
音频
/flac的类型。该示例使用默认的语言模型en_BroadbandModel进行
浏览 3
提问于2018-12-22
得票数 0
1
回答
单位容器-去除协方差时的ResolutionFailedException
我有一个单位注册,它能很好地处理出协方差,但是一旦我删除它,我就会得到
错误
。
浏览 3
提问于2017-12-21
得票数 0
1
回答
如何为语音识别准备
音频
文本数据
、
、
我收集了一些原始的
音频
,从所有的会议,讲座和随意的谈话,我是其中的一部分。机器
转录
没有提供良好的结果(从Azure,AWS等)。我会把这两个data+label (audio+text)都
转录
成ML训练。 我的问题是是否要小(3-10秒)。
音频
文件(沉默时将其分割),然后
转录
每个小文件?如果我有一个带文本的长时间
音频
文件呢?我听说长文件有更多的
错误
的机会&不准确的训练。如果我添加时间戳(比如字幕文件srt )呢?我需要小
音频
文件吗?我试着用Az
浏览 0
提问于2020-08-03
得票数 1
2
回答
IBM Watson Python
错误
- SpechtoTextV1
、
然而,它适用于短长度的
音频
文件,但不适用于大约5分钟的
音频
文件。它显示以下
错误
"watson {'code_description':'Bad Request','code':400,' error ':‘30秒未检测到语音。’}“ 我在用沃森的试用账号。
浏览 0
提问于2017-04-25
得票数 5
1
回答
AWS SDK for PHP等待
转录
作业,直到状态“完成”
、
、
、
、
因此,我一直在研究承诺和等待,我想知道是否有一种方法启动一个
转录
作业,同时提供一个回调,因此它会勾选(定期检查自己),直到
转录
的结果将是COMPLETED,然后使用回调得到
转录
的json,并将结果写到db因此,我所要做的就是启动作业并提供回调,服务生将定期阻塞线程并检查状态,允许我在中间
抛出
其他请求,
而
不是
使用while循环
执行
所有这些操作。有没有可能与
转录
服务有关?一个小代码的例子,如何做到这将是如此感谢!
浏览 0
提问于2018-07-25
得票数 1
1
回答
如何确定SpeechRecognitionEngine的识别词的位置?
、
我正在探索SpeechRecognitionEngine的功能,我的最终目标是输入WAV文件和WAV文件的
转录
,并输出WAV文件中每个单词开头(理想情况下是结尾)的位置。我可以让引擎成功地识别短语,但我不能理解如何在单词开始时检索
音频
位置,
而
不是
当识别被假设或识别时,等等。耽误您时间,实在对不起。
浏览 0
提问于2011-12-06
得票数 2
回答已采纳
2
回答
python中的语音识别持续时间设置问题
、
、
、
我有一个Wav格式的
音频
文件,我想要
转录
:import speech_recognition as srimport speech_recognition as srw
浏览 3
提问于2019-11-24
得票数 1
回答已采纳
1
回答
如何递归应用命令
、
、
、
我仍然是bash的新手,我正在尝试创建一个bash脚本,以便
转录
我所有的视频和
音频
文件。任何文件扩展名。到目前为止,我可以从运行bash脚本的同一个文件夹中
转录
所有视频文件。dodone 我试图递归地
执行
相同的命令,因此不必每次都对每个文件夹
执行
该命令。它试图递归
浏览 0
提问于2018-07-06
得票数 2
回答已采纳
1
回答
对话流流检测意图不起作用
、
当
音频
质量
不是
很好时,似乎会出现问题。在我的情况下,
音频
质量有时会很差。当发生这种情况时,不会
抛出
gRPC
错误
。我假设这是语音
转录
的问题,因为没有带isFinal的recognitionResult。
浏览 10
提问于2019-02-25
得票数 2
1
回答
Google语音API的异步问题
、
、
、
我正试图从Fleck websocket
音频
流中获得最终的语音
转录
/识别结果。方法OnOpen在首次建立websocket连接时
执行
代码,每当从客户端接收二进制数据时,OnBinary方法
执行
代码。因此,我的代码失败了,
而
不是
服务。我的目标是做以下工作: 将收到的每一条二进制消息
浏览 0
提问于2018-09-09
得票数 0
1
回答
来自websocket的流
音频
、
、
、
、
我正试图从Fleck websocket
音频
流中获得最终的语音
转录
/识别结果。方法OnOpen在首次建立websocket连接时
执行
代码,每当从客户端接收二进制数据时,OnBinary方法
执行
代码。因此,我的代码失败了,
而
不是
服务。我的目标是做以下工作: 将收到的每一条二进制消息
浏览 0
提问于2018-09-09
得票数 1
回答已采纳
1
回答
文本语音RecognitionAudio fromBytes总是返回空白结果
、
我有m3U8格式的视频和
音频
直播。我使用FFMPEG从实时网址中提取
音频
。尝试将提取的
音频
发送到google (
而
不保存在磁盘上)以恢复
转录
。流是用块完成的。API不会返回任何结果,也不会
抛出
任何
错误
。有人能告诉我为什么结果总是空白的吗?注意:使用byte[]将提取的
音频
发送到google。结果: API返回空白结果,没有任何
错误
消息。
浏览 0
提问于2019-06-25
得票数 0
回答已采纳
1
回答
自定义短语/单词被Google语音到文本忽略。
、
、
、
、
我正在使用python3通过提供的python包( Google )
转录
一个带有的
音频
文件。 如果我想用正确的表示法来识别一个特定的名字,我会给出下面的短语来查看效果。我是
不是
用错了短语,或者它是否很有信心,它听到的单词确实是 burrows ,这样它就会忽略我的短语?PS:我也尝试使用speech_v1p1beta1.A
浏览 9
提问于2021-11-20
得票数 1
回答已采纳
1
回答
在AWS
转录
过程完成后调用另一个lambda
、
、
我有一个lambda,它将被触发时,任何人上传一个
音频
文件到桶。我需要使用AWS异步
转录
来处理文件。我编写了这样的代码,但问题是它只检查了一次,
而
不是
在文件处理完成后调用处理程序函数。下面是AWS
转录
的链接,但是我们必须等待这个响应,直到工作完成,lambda函数有一个超时5分钟。在那之后,
执行
将停止。//创建一个异步客户端对象来调用AWS
转录
private AmazonTranscribeAsync asyncClient = AmazonTra
浏览 0
提问于2018-10-30
得票数 0
回答已采纳
1
回答
执行
代码
而
不是
抛出
错误
columns selecteddatf[c('a','b', 'v')]1 1 43 3 4 因此,基本上,如果有定义的列,那么很好,或者它应该排除未定义的列并
执行
代码
浏览 4
提问于2022-05-23
得票数 0
回答已采纳
2
回答
:部分文字记录丢失
、
、
在我们测试微软语音到文字的视频字幕时,我们有时(不经常)经历“辍学”,即一大块
音频
不被
转录
。在这些情况下,我们做的是
而
不是
get ResultReason.NoMatch。我们使用的是OutputFormat.Detailed和speechConfig.RequestWordLevelTimestamps(),我们使用AudioConfig.FromWavFileInput来提供
音频
很抱歉,我没有英语的例子(这是瑞典
音频
),但当我运行这个,时间代码(查看单词级时间戳)之间有一个空白。进
浏览 8
提问于2020-03-27
得票数 0
回答已采纳
1
回答
内部服务器
错误
,代码7,与google语音节点客户端
、
例如:我正在处理成千上万的
音频
剪辑
转录
,正如你所期望的.Error: Internal server error, code=7. Try your request again.更新:我似乎找到了grpc
错误
代码,但代码是由变量名
而
不是
原始数值:指定的。
浏览 2
提问于2017-07-19
得票数 0
3
回答
如何设置语音识别服务器?
、
、
、
该程序将以一个
音频
文件作为输入,并以足够的准确性提供
音频
文件的文本
转录
。我可以选择什么? 我尝试过实现,但是它的准确性太差了(它们可能也是我的配置中的一些问题,我还在努力学习它)。在一篇文章中,我看到当我们使用<input name="speech" id="speech" type="text" x-webkit-speech />时,输入被发送到、一个外部服务器、和那个服务器,
而
不是
识别任何现有的开源服务器如果能够以最小
浏览 6
提问于2012-01-18
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券