腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从Peppers平板电脑
麦克风
录制
音频
、
、
、
、
我想用peppers平板电脑的
麦克风
来实现
语音
识别
。我已经用头上的
麦克风
做
语音
识别
了。但我从头部
麦克风
得到的
音频
是嘈杂的,因为风扇
在
头部和胡椒关节运动。有人知道如何从peppers平板电脑上
获取
音频
吗? 我正在使用Pepper 2.5.,我想用
python
解决这个问题。 谢谢!
浏览 9
提问于2019-06-21
得票数 0
2
回答
有没有办法将
音频
文件发送到
语音
到文本
识别
、
、
、
我希望Android
语音
识别
系统
分析
音频
文件,
而
不是
来自
麦克风
的默认传入
语音
。谢谢。
浏览 0
提问于2010-11-16
得票数 15
1
回答
用哪个
麦克风
来
识别
声音有关系吗?
、
、
、
、
如果是,那么
音频
识别
应用程序是如何在不同设备
中
工作的? 例如,谷歌翻译作品
在
iphone-6,三星-S6,htc-m9 .
浏览 10
提问于2015-12-29
得票数 1
回答已采纳
1
回答
使用蔚蓝
语音
文字时保存
麦克风
音频
输入
、
、
、
、
我目前正在使用Azure演讲
在
我的项目中发短信。它是
识别
语音
输入直接从
麦克风
(这是我想要的)和保存文本输出,但我也有兴趣保存
音频
输入,以便我可以听它以后。
在
迁移到Azure之前,我使用了带有recognize_google的
python
语音
识别
库,它允许我使用get_wav_data()将输入保存为.wav文件。我阅读了文档,但只能找到将
音频
文件保存为文本到
语音
的方法。我的临时解决方案是先保存<em
浏览 12
提问于2022-03-16
得票数 0
回答已采纳
1
回答
Python
:
在
语音
识别
中
获取
系统
音频
,
而
不是
麦克风
、
、
、
我正在使用
python
进行
语音
识别
,但它只能从Micropohone获得输入。如何将说话者的
音频
作为
语音
识别
库的输入?
浏览 26
提问于2020-04-04
得票数 0
回答已采纳
1
回答
使用Azure Cognitive Services SDK对
音频
文件进行转录处理|
Python
3.x
、
微软有一个用于转录的库,但在官方示例
中
只有一个
麦克风
输入。我想了解如何转录wav格式的
音频
文件。
浏览 0
提问于2019-01-12
得票数 0
1
回答
我能拿走
语音
数据(f.e。
在
mp3格式)从
语音
识别
?
、
、
、
、
可能重复: 我
在
android上使用
语音
识别
类,我成功地获得了
语音
识别
。但我想要的是真实的
语音
数据,
而
不是
文字,
而
不是
文字。
浏览 1
提问于2012-11-04
得票数 3
1
回答
从
音频
文件
而
不是
麦克风
进行
语音
识别
、
、
、
如何对来自
音频
文件(.mp3、wav)
而
不是
麦克风
的
语音
执行
语音
识别
? 我希望能够
在
C#.NET和Delphi
中
做到这一点。
浏览 0
提问于2009-06-28
得票数 9
回答已采纳
1
回答
Windows
语音
访问命令以编程方式
、
、
、
Windows有用于
语音
识别
的API,它还提供执行
语音
识别
和执行
识别
命令的
系统
应用程序。是否有以编程方式发送命令的方法/API?文本和
音频
文件是可以接受的。但请不要建议使用虚拟
麦克风
,谢谢!澄清: 把声音放出来
不是
办法
浏览 4
提问于2022-08-11
得票数 1
1
回答
我们可以使用Google
中
的Web
语音
API来
识别
来自用户
麦克风
以外的其他来源的
语音
吗?
、
、
、
、
我想使用Google
中
的网络
语音
API来
识别
来自网页上的HTML5 <video>的
语音
。是否有一种方法可以将Web
语音
API与来自用户
麦克风
以外的其他地方的
音频
输入一起使用?
在
MDN ()上,它说:
语音
识别
是通过SpeechRecognition接口访问的,它提供了从
音频
输入
中
识别
语音
上下文的能力(通常通过设备的默认
语音
浏览 6
提问于2017-09-06
得票数 3
回答已采纳
1
回答
MS上
麦克风
连续
语音
识别
、
、
、
我想使用Azure
语音
服务从
麦克风
进行
语音
识别
。我有一个使用recognize_once_async()的
Python
语言运行平稳的程序,但是这只
识别
了15秒
音频
限制的第一个声音。我对这个主题做了一些研究,并仔细研究了MS ()的示例代码,找不到任何能够
在
麦克风
上连续进行
语音
识别
的方法。有小费吗?
浏览 2
提问于2021-05-25
得票数 0
回答已采纳
1
回答
断言错误:设备索引超出范围(0台设备可用;设备索引应介于0到-1之间)
、
、
、
、
我正在做一个
语音
识别
项目。我正在使用谷歌
语音
识别
api。我已经使用dockerfile
在
GCP flex环境中部署了django项目。Dockerfile:RUN apt-get install libasound-dev: 3 接收
语音
输入的代码。int(device_info["defaultSampleRate"
浏览 5
提问于2020-08-24
得票数 1
回答已采纳
1
回答
直接从
音频
/转录转换为文本(
语音
识别
)
、
、
、
、
需要能够转换或转录
音频
(如从.MP3,其他
音频
格式)包含
语音
到文本文本转录使用
语音
(
语音
识别
)算法
在
高精度。有许多方法可以做到这一点,这些方法越来越准确,但都是为对着设备
麦克风
说出的
语音
而设计的(例如,用于web的谷歌翻译/相应的API,用于iOS的Dragon应用程序)。我需要一种直接将
音频
文件输入
语音
识别
引擎/API的方法。不希望通过扬声器播放
音频<
浏览 1
提问于2014-05-26
得票数 10
回答已采纳
2
回答
如果扬声器远离
麦克风
,Google Speech/NAudio会有很大的延迟
、
、
、
、
我正在使用google speech api和NAudio (使用NAudio WaveInEvent类)进行
语音
到文本转换。如下所示: (“对
音频
流执行流式
语音
识别
”的C#示例)对这个问
浏览 3
提问于2019-04-04
得票数 1
1
回答
当默认
音频
输入改变时,.NET
中
是否有一个事件?
、
、
、
、
我正在使用Windows7
中
的System.Speech.Recognition,让用户通过
语音
命令来控制程序。
识别
代码被集成到程序本身
中
。现在,
识别
引擎是
在
程序启动时创建的,如果用户更改了
语音
识别
语言,则会重新创建。这一切都运行得很好。 最近,我们
在
创建
识别
引擎时遇到了一个问题。如果
系统
默认
音频
输入
在
程序运行期间发生更改,我们将无法对其作出响应。具体地说,如果在
浏览 2
提问于2010-08-03
得票数 2
回答已采纳
2
回答
将云
语音
识别
添加到Pepper QiSDK
、
由于我使用的是学术版,所以我不能使用软银提供的基于云的自动
语音
识别
服务,该服务没有包含在内,因此除了QiChat之外,我不能使用通配符或其他聊天机器人引擎。你们谁知道我如何为Pepper实现我自己的
语音
识别
服务?我找不到哪里能听到佩珀的
麦克风
的
音频
流。我已经阅读了来自软银的文档:和 我还试着开发了一款基于安卓
系统
的SpeechRecognizer,不过用的是平板电脑的
麦克风
,
而
不是
Pepper。
浏览 32
提问于2019-07-10
得票数 1
1
回答
使用不带
麦克风
部件的OSX
语音
识别
、
、
有没有一种方法可以
在
OSX上使用
语音
命令,
而
不需要屏幕上的
麦克风
小部件,无论是
在
应用程序特定的基础上,还是
在
系统
范围内?我目前正试图
在
OSX上用
Python
构建一个
语音
识别
应用程序,我可以
在
播放Elite时使用它来控制游戏中的功能和音乐播放器。我已经找到了这个,我将以它为基础,并且我找到了一个来防止它干扰游戏
音频
。我遇到的问题是,当使用
语音
<em
浏览 1
提问于2015-07-25
得票数 3
回答已采纳
3
回答
Google Cloud Speech API实时
识别
、
我正在开发一个实时翻译的
Python
应用程序。我需要实时
识别
语音
:当用户说什么时,它会自动将这段
音频
发送到Google speech API并返回文本。因此,我希望在说话时立即显示
识别
出的文本。我已经找到了流式
语音
识别
,但似乎我仍然需要先录制完整的
语音
,然后再将其发送到服务器。此外,也没有如何在
Python
中使用它的示例 有没有可能用Google Speech API做到这一点?
浏览 7
提问于2017-05-19
得票数 0
1
回答
如何在Qt中使用来自
麦克风
的流
音频
数据进行ASR
、
、
我正在做一个
语音
识别
项目,我的程序可以
识别
音频
文件
中
的单词。现在我需要处理来自
麦克风
的
音频
流。我使用QAudio从
麦克风
中
获取
声音数据,
而
QAudio有一个函数来启动这个过程。当我不处理连续流时,我可以随时停止从
麦克风
录制,并将整个数据从QBuffer复制到QByteArray
中
,然后我可以对这些数据做任何我想做的事情。但在连续流
中
,QBuffer的大小随着时间的
浏览 1
提问于2013-09-09
得票数 0
1
回答
在
iOS上访问
麦克风
、
、
、
我只需要知道用户什么时候开始对着
麦克风
说话。我不会做任何
语音
处理或任何花哨的事情,只要检测到什么时候
麦克风
已经收到任何东西。我已经找了一个小时了,找不到这么简单的东西。谁能给我指明正确的方向吗?
浏览 1
提问于2015-03-06
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
揭开语音识别系统在托福口语中的神秘面纱
腾讯AI同传亮相博鳌,你该开始python语音识别啦!
傻瓜式教学,某大学教师给学生的一份Python语音识别详细教材!
Python 语音识别与合成:构建智能语音交互应用
壹鸽AI技术星球:多维语音信息识别技术在智能语音客服机器人系统中的应用
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券