腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1639)
视频
沙龙
1
回答
如何处理不同音频文件的
MFCC
特性差异
、
librosa.feature.
mfcc
为不同的音频文件返回不同的维度。那么如何处理这个案例来训练或测试模型呢?test.pyimport picklefrom scipy.io.wavfile import readimport warningsdef get_
MFCC
(sr
浏览 0
提问于2019-01-16
得票数 0
回答已采纳
1
回答
高斯混合模型给出负值得分
、
我正在尝试用不同的训练词训练多个
GMM
模型。然后我试图用一个看不见的测试词来测试我的模型,我得到了负值。你知道我做错了什么吗?all_
mfcc
_feat = [] #defaultstestingFeat = df.values for feat in training_
浏览 23
提问于2018-03-01
得票数 0
1
回答
应用于
MFCC
的PCA输入
GMM
分类器(sklearn库)
、
、
、
我到目前为止所做的工作如下:from sklearn import mixture return np.array(X_train) def extract_labels= mixture.
GMM
(n_components=n_classes, covariance_type='ful
浏览 2
提问于2015-11-05
得票数 1
1
回答
基于LIUM的语音活动检测(VAD/SAR)
、
、
、
下面的脚本通过使用Sphinx4从wav音频文件中提取
MFCC
特性,对这些文件进行
GMM
训练,并应用维特比解码进行分段。但是,结果很差,即分割结果是完全错误的。此外,我还尝试了许多不同的参数设置,特别是emCtrl (训练
GMM
)和dPenalty (Viterbi解码进行分段)等参数。对我没什么帮助。# !/%s.
mfcc
"gmmInit="./%s.init.gmms" # ou
浏览 3
提问于2015-12-15
得票数 1
回答已采纳
1
回答
MFCC
特征在说话人识别和语音识别中的区别?
、
、
我知道什么是
MFCC
。但是,我无法找到用于说话人识别和语音识别的
mfcc
特征向量之间的区别,即使用
mfcc
特征的哪一部分作为两者的区分因子?以及如何根据
mfcc
矢量区分两个说话人?
浏览 0
提问于2016-12-07
得票数 1
2
回答
从音频波形数据中检测说话人的性别
、
、
谁能建议我如何提取
MFCC
特征,并使用Open Ears (用于iOS平台的CMU Sphinx )输入到通用模型/支持向量机分类器中?
浏览 0
提问于2015-05-22
得票数 4
1
回答
基于
mfcc
特征的高斯混合模型
、
、
我试图创建一个
GMM
扬声器模型,使用一个扬声器的音频样本的
MFCC
功能。我有18维
MFCC
功能,为一个特定的扬声器。要在Java中创建一个
GMM
模型,我有一个GaussianMixture.java类,它需要: 我无法理解的是如何提供我提取的
MFCC
数据的手段和协方差。
浏览 0
提问于2018-09-21
得票数 1
回答已采纳
1
回答
如何向输入算法提交
MFCC
?
、
我想在
MFCC
的帮助下训练
GMM
。 我有588个音频文件(wav,如果很重要的话)。在提取特征之后,我得到了一组588个二维数组(13x?)。每个文件都有不同的列数。以及如何将
MFCC
提交给输入算法?
浏览 1
提问于2018-05-27
得票数 0
1
回答
每次使用
GMM
分类器都有不同的结果
、
、
、
、
我现在有两个类,我为每个类创建了两个
GMM
分类器,用于标签“高兴”和“悲伤”。我使用两个
GMM
分类器为每个标签。(以前是每个文件的
GMM
):在下面的输出中,请注意,我有10个测试样本,每一行对应有序测试样本的结果。training.iteritems(): #For every class: In our case it is two, happy and s
浏览 3
提问于2016-06-25
得票数 0
回答已采纳
1
回答
在基于web的语音识别中使用mfccs的下一步
、
、
到目前为止,我什么也没做,只是找到了从数据帧中提取
mfcc
的meyda javascript库。一些文件说,对于ASR,需要26个
mfcc
中的前12个或13个。每个帧包括13个
mfcc
。红色长垂直线的值是438,其他值或48,38等等。我的问题是,我是否需要在数据库中将这些帧(
mfcc
)保存为/b/的预定义音素,并对所有其他音素执行相同的操作,然后连接麦克风,meyda将提取每帧的
mfcc
,我将使用动态时间扭曲对javascript进行编程,以使提取的帧
mfcc
与
浏览 2
提问于2016-09-28
得票数 2
1
回答
如何将
MFCC
更改为PointList和
GMM
、
、
、
、
为了制作
gmm
,首先,我从一个愤怒的文件中提取了
mfcc
特征。哪一个是正确的?i)将从一个文件中提取的
mfcc
更改为一个pointList ii)将从多个文件中提取的
mfcc
链接到一个点列表
浏览 1
提问于2012-08-31
得票数 1
回答已采纳
4
回答
鸟鸣音频分析-找到两个剪辑如何匹配
、
、
、
我有~100个wav音频文件,样本率为48000的同类鸟类,我想测量它们之间的相似性。我从wave文件开始,但我对处理图像了解更多(非常稍微),所以我假设我的分析将出现在谱图图像上。我有几个不同日子的一些鸟的样本。我想尝试消除蝉噪声-蝉啁啾的相当一致的频率,并倾向于相位匹配,所以这应该不会太难。 看来一些脱粒可能是有用的。 我被告知,大多数现有的文献使用基于歌曲特征的手工分类,比如
浏览 4
提问于2010-12-21
得票数 19
回答已采纳
1
回答
我从
gmm
得到的可能性值是正确的吗?
、
、
、
使用
mfcc
+ K-mean +
GMM
,我得到了像-15012,-43400,-8000这样的可能性SampleRate = 16000 NumberCoefficients = 13 UseFirstCoefficient = true
浏览 0
提问于2012-09-10
得票数 0
回答已采纳
1
回答
声纹中有没有与文本无关的特征
、
、
我刚接触语音和说话人识别问题,我理解了
mfcc
的工作方式,但就我所理解的(并发现)不同的单词之间的系数不同。我的问题是:有没有其他与文本无关的特征提取方法?如果是这样的话,请再向他们说明。
浏览 3
提问于2015-12-17
得票数 0
2
回答
KMeansClustering初始化
、
我从一个音频文件中提取了
MFCC
系数。在这次手术之后,我不知道如何继续下去。我学到了comirva.audio.util.kmeans.KMeansClustering类必须在
MFCC
之后使用。然后必须使用comirva.audio.util.
gmm
.GaussianComponent类。
浏览 0
提问于2011-04-24
得票数 1
回答已采纳
2
回答
用于训练
MFCC
中的
GMM
的库
、
、
、
、
我正在尝试使用
MFCC
、它们的增量和增量增量从语音中构建一个基本的情感检测器。许多论文都谈到了通过训练
GMM
的这些特性来获得良好的准确性。 我似乎找不到一个现成的软件包来做同样的事情。从训练数据中计算
GMM
的最好的库是什么?
浏览 2
提问于2013-03-16
得票数 4
1
回答
基于
MFCC
的简单字检测器
、
、
由于音频文件,我得到一个矩阵中的
MFCC
12行(
MFCC
)和许多列的语音帧的数目。我给出了行的平均值,所以我得到了一个只有12行的向量(第1行是所有帧的所有ith-
MFCC
的平均值)。我有一个培训集,只有积极的样本,
MFCC
,我从几个音频文件(几个注册相同的词)。
浏览 1
提问于2015-02-17
得票数 0
1
回答
神经网络在变长语音段
MFCC
中的应用
、
、
、
我目前正在尝试创建和训练一个神经网络来使用
MFCC
进行简单的语音分类。 目前,我正在为每个样本使用26个系数,总共有5个不同的类--这是五个不同的单词,有不同的音节数。
浏览 2
提问于2014-02-08
得票数 2
1
回答
如何在从音频中提取特征时修复(返回代码:-9)
、
、
我们已经编制了一个装置(由树莓π3组成),它可以坐在房间里,听录音,并根据现有的
GMM
来描述房间的特性。我们的代码成功运行,直到在第17或第19次迭代时抛出一个错误。from sklearn import preprocessing # Scal
浏览 0
提问于2019-07-31
得票数 1
回答已采纳
1
回答
基于Python的说话人识别系统
、
、
、
我已经提取了训练音频文件和测试音频文件的
mfcc
特性,并为每个音频文件建立了一个
gmm
模型。我不知道如何比较模型,以计算一个相似的分数,根据这个分数,我可以编程系统来验证测试音频。
浏览 1
提问于2018-04-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
高斯混合模型 GMM 的详细解释
采用深度神经网络的说话人特征提取方法
机器学习中的数学(4)-EM算法与高斯混合模型(GMM
语音评测技术在古诗背诵场景中的应用
语音评测技术在古文背诵中的应用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券