腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用荷兰CMUSphinx错误: Decoder_setJsgfFile返回-1 Android
、
、
构建一个带有
语音
识别
组件的Android应用程序。我构建了一个关键字.gram文件,其中包含了我想要
识别
的3.240个单词。我使用构建了相应的字典(
语音
)。这里只有英语..。我需要一个工具来创造一个荷兰语
语音
词典。有什么建议吗? 当我试图指向在下载的荷兰声学模型时,我的应用程序中出现了一个错误(Decoder_setJsgfFile返回-1)。当我使用"en-us-ptm“时,应用程序可以工作,但是
识别
能力很差。请提供指导。关于
识别
3.500个荷兰语单词的框架
浏览 3
提问于2016-03-11
得票数 0
回答已采纳
1
回答
在colab上永久安装
Kaldi
、
我是
语音
识别
的新手,我希望使用
kaldi
-asr构建一个端到端的asr系统。我的笔记本电脑没有Linux,也没有足够的硬件来训练模型。https://colab.research.google.com/drive/1rp2eZRHW9OYnA1WpRGeblG6fDSyyH-my#scrollTo=46b62_fSurBK在colab上安装
Kaldi
(以利用免费图形处理器),但在colab上安装
Kaldi
需要太长时间,一旦会话结束,恐怕我将不得不再次安装它。有没有办
浏览 58
提问于2020-10-17
得票数 0
1
回答
我应该使用什么和CMU Sphinx4之间的视频文件中获取字幕?
、
、
、
我想最终从视频文件中提取字幕。
浏览 6
提问于2016-10-18
得票数 0
1
回答
具有精确时间戳的
语音
识别
?
、
、
有人知道一些精确的
语音
识别
API,或者有一些更好地准备音频文件的提示吗? 我想一个字一个字地确定,包括它们的确切时间戳。 非常感谢!
浏览 71
提问于2019-10-08
得票数 5
1
回答
印度口音
kaldi
ASR声学模型的说话人自适应
、
、
我正在为说印度口音的人进行
语音
识别
。目前,我正在使用
Kaldi
ASR的在线nnet2解码工具。当说话者的英语发音很好时,这个工具工作得很好。那么,有没有人可以建议一些使用
Kaldi
ASR的声学或神经网络模型的说话人自适应程序?
浏览 2
提问于2015-10-24
得票数 0
1
回答
创建特定于项目的Vosk字典
、
、
我正在开发一个使用Vosk进行
语音
识别
的应用程序。我想为应用程序创建一个字典,它只包含应用程序所需的触发词和口头数字。使用这里找到的命令行说明:我能够在我的笔记本电脑上安装
Kaldi
。这些是,git clone https://github.com/
kaldi
-asr/
kaldi
make extras
浏览 15
提问于2021-06-10
得票数 0
1
回答
在不绑定语言的情况下使用
Kaldi
的深度神经网络命令检测
、
、
、
有没有人看到过任何示例,如何设置简单的应用程序来训练dnet,然后使用它来
识别
有限数量的
语音
命令,而不绑定到特定的语言?我相信
Kaldi
API对它来说是相当强大的,但是缺乏文档。
浏览 6
提问于2017-02-16
得票数 0
1
回答
Kaldi
是否返回任何
识别
可信度参数,类似于Google
语音
到文本API?
、
、
、
、
我在处理一项
语音
识别
任务。到目前为止,我一直在使用Google
语音
识别
API (在Python中),取得了很好的效果。API返回一个以及转录的文本的每一个块。如文档中所述,置信度是介于0到1之间的一个数字,但对于Google的API是如何导出这个数字的,我没有找到更深层次的解释,所以我假设它来自于进行
识别
的神经网络。下一步我想要做的是制作我自己的(离线)自动
语音
识别
程序,我发现应该可以胜任这项任务。我还没有开始对它进行编程,但我想事先知道(为了研究目的)--
K
浏览 4
提问于2019-10-15
得票数 3
回答已采纳
2
回答
调节
Kaldi
食谱的链接和路径文件
、
、
我正在使用
Kaldi
工具集进行
语音
识别
,在这台计算机中,我无权修改/var/
kaldi
中安装的内容。该目录包含一个脚本文件夹,这些脚本是作为使用示例提供的,脚本之间也有很大的链接。结构如下,dataset mydataset的主脚本文件夹位于/var/
kaldi
/egs/mydataset/v1/中,其中有run.sh或path.sh等脚本。特别是,用户需要运行run.sh脚本,然后调用path.sh,然后再导出一个
K
浏览 0
提问于2019-01-23
得票数 0
1
回答
Android在印度的
语音
识别
、
谷歌搜索在Android驱动的LG Optimus设备上正确
识别
或显示的单词更具美国口音。除了美国口音之外,还有什么方法可以让它
识别
其他口音吗?是的,虚拟现实引擎在印度能工作吗?
浏览 4
提问于2012-09-28
得票数 2
回答已采纳
1
回答
我有一个单词或句子,有没有办法/开源包来找出用户说过这个词的概率
、
、
、
我有一个单词/sentence,有没有什么方法/开源包可以找到用户说过这个单词/句子的概率
浏览 3
提问于2019-03-21
得票数 0
1
回答
对文本apis中
语音
选择的建议
、
、
、
、
我刚开始学习
语音
识别
,android和我有一个用例,我需要构建一个android应用程序,它接收用户的命令(有限的命令集,少于100个)并执行一些逻辑。我在googled上搜索了一下,发现下面的内容是可以完成的 使用Android内置
语音
来实现文本功能(它与google云
语音
api不同吗?)另外,使用android
语音
的离线模式进行文本处理的利弊是什么?使用像
Kaldi
、CMU Sphinx这样的开源
语音
识
浏览 2
提问于2017-10-03
得票数 0
1
回答
使用buildpack-deps在坞中构建,但依赖项似乎没有安装吗?
、
我试图编写一个Dockerfile来构建基于"buildpack-deps:jessie-scm“映像的
Kaldi
(一个开源
语音
识别
系统)。RUN apt-get updateRUN mkdir /opt/
kaldi
RUN git clone https://github.com/
kaldi
-asr/<e
浏览 2
提问于2017-05-18
得票数 0
回答已采纳
1
回答
基于HMM或MFCC的
语音
识别
、
、
、
请帮助我在
语音
识别
使用HMM (隐马尔可夫模型)或MFCC (梅尔倒谱系数)由longage c#或c++我想
识别
单词“一”,“二”…到"ten")当我说one ===> MessageBox write
浏览 2
提问于2016-04-27
得票数 0
2
回答
有没有人成功使用CMU Sphinx进行
语音
识别
编程
、
、
我想开始用
语音
识别
软件做一些编码工作(可能占我工作的10-20% )。
浏览 2
提问于2013-05-20
得票数 9
1
回答
Windows环境下可训练、高质量、开放源码的
语音
识别
软件包
、
、
对于内部项目,我正在寻找满足以下条件的
语音
识别
解决方案:它需要是可训练的,而不仅仅是用于推理。到目前为止,我尝试过的软件包是
Kaldi
、DeepSpeech、DeepSpeech2和CMU狮身人面像。
Kaldi
和DS(2)以Linux为目标,使用WSL ()将是理想的,除了它不能利用GPU,因此是一个不去培训。
Kaldi
或DS(2)差。如果有人能够在Windows下运行一个像样的系统(
Kaldi
/ DS(2)类型的
浏览 0
提问于2019-08-03
得票数 1
1
回答
Vosk (
Kaldi
)统一离线
语音
识别
、
、
、
、
如何在统一项目中实现和使用Vosk库?请写出步骤1,2,3.这里的Vosk库-
浏览 11
提问于2020-08-14
得票数 2
回答已采纳
1
回答
信心分数在
语音
识别
中意味着什么?
、
、
、
、
在
语音
识别
社区中,“信心分数”是否有公认的含义?我已经看到了对的引用,但即使这是他们所做的,这也不能回答这个问题,因为这取决于辅助损失函数的选择。
浏览 3
提问于2020-04-20
得票数 1
回答已采纳
5
回答
Android:不使用google服务器的
语音
识别
、
、
我想在android中开发一个
语音
识别
器,它应该可以在脱机状态下工作。由于android的内置
语音
识别
器使用的是google服务器,需要互联网,我想要一个在没有互联网的情况下工作的替代方案。
浏览 0
提问于2010-12-09
得票数 57
回答已采纳
1
回答
c++包括安装程序
、
、
、
我见过很多关于这方面的帖子,但我只是不明白所有的事情。我试过:\ProgramFiles\java\jdk1.8.0_101\include \ProgramFiles\java\jdk1.8.0_101\include\win32 \ProgramFiles\java\jdk1.8.0_101\bin \ProgramFiles\java\jdk1.8.0_101\lib\ProgramFiles\java\jdk1.8.0_101\lib \P
浏览 1
提问于2016-10-19
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
纯PyTorch语音工具包开源,Kaldi:我压力有点大
Daniel Povey出任爱数智慧首席科学家顾问
新一代Kaldi技术细节揭秘:K2是核心部分
如何语音识别翻译?语音识别翻译软件哪个好?
在线语音识别和离线语音识别各有哪些特点
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券