腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
iOS10
语音
识别
拼写
、
、
、
例如,如果用户想拼写某事,他只需点击一个按钮,“拼写模式”被激活,然后用户可以拼写一个词,例如"
CNN
“或"ABC”。到现在为止,当我说"
CNN
“时,Siri把它转录成”看和“。这是不对的。
浏览 1
提问于2017-03-27
得票数 0
1
回答
CNN
-LSTM结构: post vs pre padding?
、
、
、
、
在这样的结构中:
CNN
-> LSTM -> Dense前填充和后填充之间的选择是否会影响性能?我读了 只要输入层是
CNN
,pre vs post就不会影响性能,这是真的吗?
浏览 10
提问于2020-04-30
得票数 0
1
回答
在Android上使用Tensorflow实现离线连续
语音
识别
器最有效的方法是什么?
、
、
我正在寻找一种方法来实现一个在Android上运行的离线连续
语音
识别
器,最好使用Tensorflow引擎。该应用程序需要能够
识别
连续
语音
流中预定义单词集中的任何单词,并且假设Android设备可能位于不支持互联网连接的区域,因此谷歌服务等是不可能的。 是否有任何RNN或
CNN
模型可以实现这一点?
浏览 1
提问于2019-09-22
得票数 0
2
回答
用
CNN
将固定长度的平面图嵌入张量的方法
、
、
、
、
我使用巴特沃斯带通滤波器过滤音频,这是通常用于
语音
过滤,因为它的稳定行为在持久化部分的信号。所以在Nikolay的提示之后,我转而使用Mel光谱图: 这看起来更有希望,但我的问题几乎是一样的,我是否可以使用经过预处理的
CNN
模型,比如VGG16,将这些光谱图嵌入张量,从而能够比较它们呢
浏览 6
提问于2017-05-11
得票数 3
回答已采纳
1
回答
利用MFCC和Mel谱图与
CNN
、
我想得到一些反馈,为什么在许多研究论文中,研究人员通过卷积神经网络(
CNN
)传递MFCC?从本质上讲,
CNN
本身就是一个特征提取过程。谢谢!
浏览 5
提问于2021-08-27
得票数 0
回答已采纳
1
回答
如何在通用
语音
数据集上训练
CNN
、
、
、
、
我正在尝试用数据集训练
cnn
。我是新的
语音
识别
,无法找到任何链接,如何使用数据集与角化。我遵循这个来构建一个简单的单词分类网络。但是我想用普通的声音数据集来放大它。任何帮助都是非常感谢的。 谢谢
浏览 2
提问于2019-08-01
得票数 3
回答已采纳
2
回答
音频文件中的关键字本地化
、
、
我能不能用经典的对象定位和某种
CNN
,对象是想要的词在谱图?如果可以的话:我需要如何准备培训数据--用“比萨饼”这个词和同样数量的其他词或更多的词来记录? 是否有更好的方法在录音中搜索单词?
浏览 0
提问于2020-01-30
得票数 5
1
回答
(
CNN
+)用于从谱图中学习音素的RNN-HMM混合算法
、
、
、
我目前正在研究一项
语音
识别
任务,将深入学习应用于标准声学模型(gmm-hmm)。 目前,我已经生成了我的话语的谱图,并且使用简单的模式
识别
设法在“是”/“否”数据集中接收到40%的WER。
CNN
被赋予了一个40帧的上下文窗口,在这个窗口中检测到了中心帧,我的问题是,使用RNN是否对这里有好处?因此RNN处理上下文,
CNN
在一个帧谱图上进行“图像分析”。如果是这样的话,它会不会明智地导致一些问题,当我在
CNN
上做的时候,是否通过在谱图的更大部分上进行模式
识别
来解
浏览 0
提问于2017-07-06
得票数 2
回答已采纳
1
回答
基于MFCCs特征的神经网络训练方法
我有一个音频数据库,我使用Librosa和MFCCs算法来进行
语音
识别
。我有20个特征输出从MFCC算法,但现在我不知道如何传递这作为一个算法的输入。= tfk.Sequential(name='
CNN
_model')<em
浏览 3
提问于2019-12-23
得票数 1
回答已采纳
1
回答
如何为
CNN
输入python制作三维数组
、
、
、
、
我正在尝试学习
cnn
网络来
识别
语音
中的情感。为此,我使用了mel倒谱系数( mfcc ),它将每个音频文件表示为二维数组(帧数*mfcc系数数)。我想有一个三维数组作为我的
cnn
卷积层的输入,其中第三维是音频文件的数量。怎样才能得到这样的数组呢?
浏览 33
提问于2019-05-25
得票数 1
8
回答
卷积神经网络和递归神经网络有什么区别?
、
、
我对神经网络这个话题很陌生。我遇到了两个术语--卷积神经网络和递归神经网络。
浏览 6
提问于2014-01-04
得票数 67
2
回答
离线
语音
识别
可以提供个
识别
本地
语音
数据的demo吗?本地
语音
数据的如何填充到boby中呢?
离线
语音
识别
可以提供个
识别
本地
语音
数据的demo吗?本地
语音
数据的如何填充到boby中呢?
浏览 571
提问于2018-04-28
1
回答
基于embeddedTTS的安卓系统离线
语音
识别
、
我有兴趣看看离线
语音
识别
是否可能使用Android上的谷歌TTS,并试图做到这一点,但没有成功。当我连接到网络时,
语音
识别
工作得很好,但我需要让它离线工作。它返回了两个特性:用于谷歌文本
语音
转换引擎的embeddedTts和networkTts,因此embeddedTts特性是可用的。
浏览 4
提问于2013-02-14
得票数 1
2
回答
SFSpeechRecognizer需要互联网连接吗?
、
、
SFSpeechRecognizer是像Siri那样在苹果服务器上进行处理,还是在iPhone上本地完成?
浏览 9
提问于2016-06-20
得票数 3
回答已采纳
1
回答
Android
语音
活动离线检测
、
、
我从这里读到一条的提示,上面说我可以“下载离线
语音
识别
”,但我不知道这是否足以满足我的需要。我对信号处理和分类有一定的了解,我认为我可以使用Android AudioRecord类开发
语音
活动检测,但是我想首先知道SpeechRecognizer是否允许离线检测(以及它是如何做到的),这样我就可以节省时间
浏览 3
提问于2013-06-18
得票数 1
回答已采纳
1
回答
购买了
语音
识别
,怎么使用呢?
浏览 421
提问于2021-01-24
2
回答
高度相关数据对卷积神经网络的影响是什么?
、
、
语音
音频样本可转换为MFCC系数以进行进一步分析。我想知道相关数据对
CNN
的影响。我知道MFCC系数的计算过程,利用离散余弦变换(DCT)对滤波器组系数进行去相关,得到滤波器组的压缩表示。当我们想进一步使用
CNN
来分析时,我想就过滤器组和MFCC的使用进行争论。如果我计划训练
CNN
的
语音
分类模型,我应该选择哪一个?
浏览 0
提问于2018-11-04
得票数 0
1
回答
COS+离线
识别
这个是只要我在对象存储管理上传文件,后台就会自动触发
识别
,并且把结果写到cos上吗?
、
请描述您的问题地址:https://cloud.tencent.com/document/product/441/6199
浏览 160
提问于2018-03-12
2
回答
基于声谱图的深度学习
、
、
其思想是使用深卷积神经网络
识别
光谱图中的片段,并输出一个(或多个)类标签。这不是一个新想法(例如,请参见鲸鱼声音分类或音乐风格
识别
)。 我面临的问题是,我有不同长度的声音文件,因此有不同大小的光谱图。
浏览 0
提问于2016-01-29
得票数 12
回答已采纳
1
回答
语音
输入导航
、
、
我被要求制作一个
语音
输入符号到一个站点页面,通过一个人的声音获得订单,并执行命令,例如,想象有人说登陆页面,然后它探索到登陆页面。 我不知道该怎么做,我需要你的帮助。
浏览 9
提问于2022-12-03
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
CNN进行简单验证码识别小记
如何语音识别翻译?语音识别翻译软件哪个好?
在线语音识别和离线语音识别各有哪些特点
语音识别小车
一文看懂近年火到不行的CNN图像识别:从R-CNN到Mask R-CNN
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券