腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6056)
视频
沙龙
3
回答
如何将音频数据
输入
深度
学习
算法?
、
、
、
、
我是
深度
学习
的新手,我的目标是使用GAN (生成对抗网络)来
识别
情感
语音
。我只知道图像是大多数
深度
学习
算法的
输入
,比如GAN。但我很好奇,除了使用光谱图的图像作为
输入
之外,音频数据如何成为它的
输入
。
浏览 98
提问于2019-10-10
得票数 2
2
回答
为什么NLP和机器
学习
社区对
深度
学习
感兴趣?
、
、
、
、
我是
深度
学习
领域的新手,虽然我做了一些教程,但我无法将概念联系起来或区分开来。
浏览 0
提问于2014-10-11
得票数 28
1
回答
华为自动
语音
识别
限制-拾取用户界面上服务不可用错误
、
、
、
、
我正在为华为应用程序库开发翻译应用程序,我通过了解到自动
语音
识别
目前支持11种语言 自动
语音
识别
(ASR)可以
识别
不超过60年代的
语音
,并将
输入
的
语音
实时转换为文本。该服务采用行业领先的
深度
学习
技术,
识别
准确率超过95%.目前,汉语普通话(包括中英双语)、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语和菲律宾语可以被认可。
浏览 7
提问于2021-10-08
得票数 2
1
回答
Tensorflow/Deep Learning能否用于梯度增强树、Logistic回归?
、
、
Tensorflow和
深度
学习
主要用于图像处理(分类、
识别
)、NLP、
语音
和文本处理。我以前用过Spark MLLIB和Mahout吗?Tensorflow有
深度
神经网络的例子-- 。
浏览 8
提问于2017-08-04
得票数 0
2
回答
用于音频的卷积神经网络
、
、
、
、
我一直在
学习
关于DeepLearning.net的教程,以
学习
如何实现从图像中提取特征的卷积神经网络。本教程解释得很好,易于理解和遵循。我知道视频
输入
只不过是在一段时间内显示的一系列图像(像素强度)。30 FPS)与音频相关。然而,我并不真正理解什么是音频,它是如何工作的,或者它是如何分解成网络的。我读过几篇关于这个主题的论文(多模特征提取/表示),但是没有人解释过音频是如何
输入
到网络中的。换句话说,我可以简单地使用这些光谱图作为我的卷积神经网络的
输入
图像吗?
浏览 3
提问于2014-03-18
得票数 34
回答已采纳
3
回答
为什么NLP和机器
学习
社区对
深度
学习
感兴趣?
、
、
、
为什么人们对NLP和ML社区对
深度
学习
很感兴趣?为什么他们需要
学习
复杂的非线性关系的方法?
浏览 3
提问于2014-10-10
得票数 3
回答已采纳
1
回答
语音
识别
Javascript API,它通过概率
识别
标准硬编码单词
、
、
、
、
我试图找到一个
语音
识别
Javascript (最好离线),在那里我可以设置一些硬编码的单词,如‘播放’,‘暂停’等,并得到一个概率的哪个词的用户说。
浏览 0
提问于2019-04-11
得票数 2
2
回答
我可以在我的iOS和安卓应用程序中使用Alexa
语音
识别
吗?
、
、
、
、
我正在寻找一个(快速)
语音
到文本
识别
api,但希望留在aws,只要我可以这样做,而不牺牲
语音
识别
质量。 在查看Alexa和教程时,他们似乎关注的是回声。它也能在iOS/Android上工作吗?
浏览 4
提问于2017-03-24
得票数 1
回答已采纳
1
回答
字母
语音
识别
的最佳音频分类算法?
、
、
、
、
里面包含了8个记录字母的声音样本 字母表/A/1,2,3,4,5,6,7,8字母表/B/1,2,3,4,5,6,7,8字母表/C/1,2,3,4,5,6,7,8 ...现在我想对这个数据集进行分类(监督
学习
浏览 0
提问于2016-11-02
得票数 1
1
回答
有更多数据的神经网络在NLP中比传统方法有更好的证明。
、
、
我正在寻找一篇论文,对神经网络(
深度
学习
)和传统方法做一些比较,以证明DL通常在足够的数据下表现得更好。我知道这是众所周知的事实,但我很难找到一篇好的论文,在这方面做一些研究。 谢谢!
浏览 0
提问于2017-12-27
得票数 1
1
回答
用于iOS词汇表外训练集的google Speech API
、
、
我正在从事一个项目,其中使用谷歌
语音
API在iOS项目。该项目涉及
语音
输入
,以
识别
许多术语,这些术语基本上是行话。Google speech API无法很好地
识别
这些行话的
语音
输入
。有没有办法训练谷歌
语音
应用程序接口来
学习
这些术语,并在移动iOS应用程序中提供
语音
输入
时轻松
识别
它们?
浏览 0
提问于2018-06-12
得票数 0
1
回答
基于
语音
ASR的机器
学习
、
将
语音
转换为文本的自动
语音
识别
技术已经有了很多的研究。这些工具正在使用
深度
学习
来做到这一点。 我发现它的工作方式是基于英语的。有没有什么工具或开放源码可以给我们
语音
呢?例如"ˈfəʊnɪks“而不是"Phonics” 谢谢。
浏览 15
提问于2019-02-21
得票数 0
回答已采纳
2
回答
HMM与
深度
学习
的
语音
情感
识别
(SER)
、
、
、
、
对于建立
语音
情感检测与
识别
系统,哪种方法更好?隐马尔可夫模型还是
深度
学习
(RNN)方法?我必须建立一个SER系统,我在两者之间感到困惑。如果有比这两位更好的模特,请告诉我。
浏览 0
提问于2018-03-25
得票数 2
回答已采纳
2
回答
如何使用斯瓦希里语开发
语音
识别
android应用程序?
、
我正在开发一个android应用程序,它有一个使用谷歌离线
语音
识别
的英语
语音
识别
模块,但现在我想添加新的语言(斯瓦希里语),它不在谷歌离线
语音
识别
语言的可用语言列表中。如何添加斯瓦希里语?
浏览 0
提问于2016-05-10
得票数 0
1
回答
如何在python中中断
语音
助手
、
、
、
、
我正在构建一个可以讲故事的
语音
助手。当机器人在讲故事时,我想在中间打断它,要求它停止或倒退或结束故事。
浏览 5
提问于2021-03-01
得票数 0
1
回答
谷歌
语音
识别
是如何工作的?
我知道音频指纹
识别
音频文件,这是很棒的,但我真正想知道的是Google是如何制作
语音
识别
API的,它们是如何获取音频和返回的单词的。用途:我想知道从音频记录到转换成文本的服务器流。
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
神经网络还是其他算法?
、
、
我有一个回归问题,大约有一百万行,大约有10-15个特性.在这种特殊的环境下,什么应该更好地发挥作用?神经网络还是规则回归?
浏览 0
提问于2019-05-21
得票数 0
回答已采纳
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌
语音
设置给AI发短信以下是
语音
到文本AI:的输出文件这是视频链接: 这是提供给Google:的视频的音频文件。
浏览 5
提问于2020-10-12
得票数 4
1
回答
如何在
语音
识别
中生成时间戳?
、
、
我正在做一个
语音
识别
系统项目。我使用
深度
神经网络进行
语音
识别
。但我还需要给定演讲中出现的单词的开始和结束时间。你能向我推荐或指导我的资源来解决
语音
识别
中的时间戳生成问题吗?
浏览 5
提问于2019-12-10
得票数 1
1
回答
语音
输入
导航
、
、
我被要求制作一个
语音
输入
符号到一个站点页面,通过一个人的声音获得订单,并执行命令,例如,想象有人说登陆页面,然后它探索到登陆页面。 我不知道该怎么做,我需要你的帮助。
浏览 9
提问于2022-12-03
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度学习应用 - 语音识别篇
深度学习让语音识别脱胎换骨
Facebook深度学习语音识别系统:wav2letter+简介
深度学习基本原理,及其在语音识别中的应用
林大AI研究院:如何使用深度学习进行语音识别
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券