腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(981)
视频
沙龙
1
回答
实时语音
识别
音源问题?
、
、
、
使用官方提供的实时语音转
文字
demo,可以通过文件流的方式
识别
出
音频
文件的语音并转成
文字
。当
音频
流来源切换到前端调用麦克风实时发送数据,就无法
识别
出
文字
。request.setEngineModelType("16k_zh"); //模型类型为必传参数,否则异常 request.setVoiceFormat(1); //指定
音频
格式.newSpeechRecogniz
浏览 64
提问于2024-04-08
1
回答
同步文本和
音频
。有没有NLP/语音到文本库来做这件事?
、
、
我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。 我到目前为止发现的是:
浏览 1
提问于2010-11-01
得票数 14
回答已采纳
1
回答
Google语音
识别
时间戳
、
我有一个
音频
文件,而且我有那个
音频
文件的准确记录。我希望能够在这个特定的
文字
记录中得到每个单词的时间戳。有没有人知道谷歌语音
识别
是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
语音
识别
是否支持定位
识别
位置?
浏览 148
提问于2022-06-15
1
回答
如何创建类似voicebase的高亮显示/照明
可以复制在线最终文本,就像这样:,照亮每个单词或短语
浏览 1
提问于2016-05-25
得票数 0
1
回答
语音
识别
支持方言语音转普通话语音吗?
浏览 118
提问于2022-06-15
1
回答
如何在tableView中的特定单元格中(在dequeueReusableCell下)只执行一次代码
我希望更改viewTable中特定单元格中嵌套视图的Y位置。let condition = myarray[indexPath.row] cell.myView.frame.origin.y += 15问题是,因为这是在dequeueReusableCell下,每次滚动它都会执行代码,并将另一个15添加到前面的y位置。
浏览 3
提问于2017-07-30
得票数 0
回答已采纳
1
回答
实施音视频时,本地是否有接口
获取
音频
数据?
场景:当实时音视频时需要
获取
音频
数据来转化
文字
,目前无法
获取
音频
数据,录音mic也只有一个,有没有解决方案?
浏览 275
提问于2019-02-28
4
回答
腾讯语音
识别
和一句话
识别
,是一样的吗?
、
请描述您的问题 [附加信息]
浏览 823
提问于2018-05-29
1
回答
使用SAPI 5.3 Speech API进行声学训练
、
、
更具体地说,如果您有一个文本文件和一个说出该文本的用户的
音频
文件,您会执行什么序列的SAPI调用来使用该文本和
音频
训练用户的配置文件?例如,您必须进行各种调用以使用与您的
音频
匹配的文本设置语法,并进行其他调用以连接
音频
,以及对各种对象进行其他调用以表示“您现在可以开始了”。但是,什么是相互依赖关系--在发生什么之前必须发生什么?如果你使用
音频
文件而不是系统麦克风进行输入,这是否会使相对计时变得不那么宽松,因为
识别
器不会一直坐在那里听,直到扬声器听对了为止?
浏览 0
提问于2008-11-18
得票数 9
3
回答
基于
音频
流Python的Google流语音
识别
、
、
、
我搜索了Google的所有可用文档,但我找不到Python中的
音频
流上的流式语音
识别
示例。有人能指导我如何对
音频
流执行流语音
识别
吗?
浏览 13
提问于2017-05-21
得票数 10
2
回答
MS SpeechRecognitionEngine录制基础
音频
我正在使用微软的System.Speech SpeechRecognitionEngine进行口述,我需要能够记录所有正在处理的
音频
,同时对其执行语音
识别
。现在,我可以很好地进行语音
识别
,并且可以获得所
识别
内容的
音频
。但是,我需要能够同时保存
音频
流,以便以后可以使用语音
识别
中的元数据从整个
音频
流中
获取
附加信息。 这样做的适当方法是什么?
浏览 0
提问于2013-08-02
得票数 3
1
回答
如何训练语音
识别
的lstm
、
、
、
、
我正在尝试训练用于语音
识别
的lstm模型,但不知道要使用什么训练数据和目标数据。我使用的是,它包含
音频
文件和它们的
文字
记录。在这一点上,我知道目标数据将被矢量化文本文本。至于训练数据,我在考虑使用每个
音频
文件(或MFCC特征)中的频率和时间。如果这是解决问题的正确方法,训练数据/
音频
将是多个数组,我如何将这些数组输入到我的lstm模型中?我需要对它们进行矢量化吗?
浏览 1
提问于2016-11-26
得票数 5
回答已采纳
1
回答
使用w4a格式
音频
(Node.js)
、
、
、
我试着用将
音频
转录成
文字
脚本。我使用请求从我在消息中获得的url
获取
音频
文件。但是我只能得到w4a文件,沃森只支持
音频
/wav
音频
/ogg 如何将w4a格式的
音频
转换为wav以适应规范。
浏览 1
提问于2016-05-23
得票数 0
1
回答
android语音输入
识别
器中的
音频
预处理
、
、
我正在做一些基本的命令
识别
,并使用Google Search Input API。然而,我想自己捕获
音频
,预处理
音频
(去噪,提高振幅等),发送这些修改后的
音频
到
识别
器并获得结果。有可能吗?我知道你可以通过onBufferReceived方法同时使用SpeechRecognizer和RecognitionListener来
获取
音频
。然而,我想做的是预处理而不是后处理。有没有什么变通方法/破解方法来将处理后的数据提供给google
识别
器?
浏览 0
提问于2012-05-13
得票数 0
回答已采纳
2
回答
是否有任何方法来改变来电者的声音,使声音
识别
不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法
识别
的语音
识别
技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
在android中
获取
微录音的指纹/声纹
、
、
、
、
我正在尝试this...thanks all am是否可行:)感谢所有人,
浏览 2
提问于2012-08-20
得票数 3
回答已采纳
1
回答
使用Youtube作为语音
识别
数据集
、
DNNs是一种巨大的数据需求算法,尤其是双向LSTM算法.对于语音
识别
模型,对于特定的语言/口音,缺少语音语料库。然而,YouTube也是一个巨大的库。我需要使用一些脚本/软件,它可以自动下载YouTube视频(可能只有
音频
)和相关的字幕,然后将其分割成20秒的片段,这样就可以用作训练语音语料库。 有没有任何方式可以下载来自Youtube的字幕?给出一个
音频
和脚本,我如何将一个
音频
分割成20秒的片段,并在
文字
记录中做同样的剪辑?
浏览 0
提问于2018-12-21
得票数 0
1
回答
如何使用完全用C\C++编程语言编写的库将pcm
音频
转换为文本?
、
、
如何使用完全用C\C++编程语言编写的库将pcm
音频
转换为文本?那我需要什么?
浏览 5
提问于2010-01-07
得票数 1
回答已采纳
0
回答
如何在成绩单中突出显示填充词(嗯,嗯,啊)?
、
目前,谷歌云语音返回的
文字
记录似乎会自动过滤掉这样的词(嗯,嗯,啊,喜欢,等等)。 我尝试在我的
音频
识别
呼叫中使用' phrases‘参数,它侧重于检测
音频
中的特定短语。
浏览 9
提问于2017-11-28
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
如何进行图片文字识别?教你怎么获取图片文字
票证信息如何一键获取?文字识别技巧
语音识别转文字-几分钟告诉你音频转文字的方法
录音转文字免费的软件哪个好用?推荐这些识别音频文字的软件
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券