腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
TTS和ASR是否有行业接口标准?
、
我被要求在我们的产品中开发一个文本到语音的模块,它应该支持各种文本到语音的引擎。 是否有标准描述如何与第三方TTS(文本到语音)服务或ASR(自动语音识别)服务接口?
浏览 9
提问于2012-06-27
得票数 2
回答已采纳
1
回答
是否有可能用OpenSIP服务器制作一个好的语音呼叫应用程序?
、
我正在Android上构建一个免费的语音呼叫应用程序。我使用OpenSIP开源来制作SIP服务器,并在WIFI网络中成功地打了一个电话给另一个电话。然而,当手机使用3G/4G等蜂窝网络时,我无法打电话。我发现我应该让一个眩晕和转服务器,以找到确切的SIP地址。 有人告诉我,如果用户使用3G或4G网络,很难找到SIP地址。因此,他说,我应该使用SBC重定向语音数据,如果我想要建立良好的连接。他说,我应该使重定向服务器有良好的服务质量。 是否有可能使用OpenSIP服务器提供良好的语音呼叫服务?如果是真的,是否有使用OpenSIP开源的语音呼叫服务?我搜索了所有的文件,但都找不到答案。 谢谢。
浏览 5
提问于2014-01-02
得票数 1
回答已采纳
3
回答
语音识别API
Ubuntu/Linux有语音识别API吗?我有一个学校项目,我需要把语言转换成文字。编程语言不是问题。我试过cmu-狮身人面像,但运气不佳,这意味着它并没有真正认识到我定义的语法,或者它只是混淆了单词。如能在此问题上提供任何帮助,将不胜感激。我也搜索过谷歌,但找不到多少信息。
浏览 0
提问于2010-10-10
得票数 7
4
回答
Linux中语音到文本的转换
、
、
、
我计划在Linux中启动一个将语音转换为文本的应用程序。是否有任何现有的接口,以便我可以扩展它们?或者在Linux中有这样的现有应用程序吗?对此有什么建议吗? 编辑:我计划编写的应用程序应该能够将我们说的每个单词转换为文本,而不仅仅是Yes/No。
浏览 11
提问于2009-01-18
得票数 5
回答已采纳
12
回答
需要用于Linux的文本到语音转换和语音识别工具
、
、
我计划为Linux编写一个使用文本到语音和语音识别的程序。最好的工具/库是什么?为了能够使用更好的工具,我应该使用Windows吗?这些工具需要易于从控制台或C程序调用。
浏览 6
提问于2009-05-18
得票数 11
回答已采纳
1
回答
是否有可能利用Windows 10的用于Python的Cortana?
、
、
、
、
我目前正在从事一个家庭自动化项目。当Windows 10发布时,我的语音识别API变得不兼容了。是否有公开可用的API来使用Cortana,如果没有,是否可以使用语音识别API? Python2.7 Windows 10的蜻蜓语音API不再工作,它使用的是windows语音识别。 我的最终目标是不使用一个启动短语,我希望我的人工智能听我说的一切。如果我随便问一个问题,我想要一个答案。我有人工智能部分涵盖,但语音输入它是我最大的问题。 谢谢你的帮助,我期待着答案! (注:由于Windows 10的复杂性,这不是一个重复的问题。)
浏览 2
提问于2015-08-16
得票数 3
回答已采纳
1
回答
将NIST球面格式(SPH)转换为WAV
、
我正在寻找一个程序,可以将音频文件从NIST球面格式(SPH)转换为WAV。 任何许可、操作系统和价格都可以。 我尝试了SoX (声音eXchange) (免费的,CLI,Linux): sudo apt-get install -y sox sox file.sph file.wav 但是对于一些文件(例如,WSJ语音识别语料库),我做了这样的信息: sph:不支持的编码‘`pcm,嵌入式-缩短-v1.1’
浏览 0
提问于2018-03-10
得票数 0
5
回答
Java语音识别
、
、
有没有人对任何开源或相对便宜的java语音识别API有经验?我很想找一些能把口语变成文字的东西。 从sun上的java语音识别页面来看,似乎有些东西已经死了。我的需求至少在linux上运行。 有人能推荐点什么吗?纯java将是一个额外的好处,否则可以考虑一个基于linux的解决方案。既然这是个家庭项目..。越便宜越好。 编辑 正如Amit所指出的,CMU狮身人面像,我的问题是一个巨大的错误率。训练本身就像是一个项目,我希望这个周末能有一些力量去尝试。 IBM ViaVoice 2004年有很多关于的新闻发布。新闻发布似乎为时过早,而且从未发生过。在某种程度上,通过语音是,但他们似乎
浏览 4
提问于2009-03-04
得票数 11
回答已采纳
2
回答
我需要一个提供在线语音记录的api
、
、
、
在我的网站上提供在线语音记录的最佳方式是让用户直接从浏览器记录他们的语音并将其上传到服务器?
浏览 1
提问于2011-06-12
得票数 1
回答已采纳
2
回答
如何实现语音视频聊天
、
、
、
我正在开发一个android应用程序,在这个应用程序中,我必须实现点对点语音聊天。我发现在安卓系统中,这在API 12或更高级别上是可能的,因为谷歌在API 12中添加了android.net.rtp包。通过使用这个包,我们可以实现点对点语音聊天和视频聊天。但我需要在API级别8中实现这一点。 如何实现API级别8的对等语音聊天。是Jmf (java媒体框架)与android兼容。是android可以实现的任何其他API。
浏览 4
提问于2011-11-29
得票数 9
1
回答
如何从移动合作伙伴Modem软件中获取AT终端命令日志(Linux)?
、
、
、
、
我正在尝试计算由华威移动合作伙伴软件发布的AT命令集,用于进行语音和视频通话。移动合作伙伴是为几乎所有的豪威3G调制解调器捆绑的软件,并具有发出和接收语音呼叫的能力。我需要知道AT命令它为我的E1732调制解调器发出的声音,视频通话和其他东西,我需要日志。我有(Ubuntu),Windows.It在这两个平台上都在工作。因此,任何一个平台上的任何帮助都是非常感谢的。 我的目标是制造一个基于Linux的IVR系统,所以我需要它们。谢谢你的帮忙
浏览 4
提问于2011-11-12
得票数 0
1
回答
Microsoft语音识别默认值与API
、
、
、
因此,我一直在Windows10中使用微软语音识别,做训练练习,将文本口述到写字板中并进行更正,向字典中添加单词等等。我想用这个软件来转录.wav文件。似乎可以使用Windows语音识别API来做到这一点,但这似乎涉及到创建和加载自己的语法文件,这向我表明,这基本上将创建一个新的语音识别器,它使用相同的构建块,但与我在开始菜单中单击“开始语音识别”时运行的程序不同。特别是,由于训练或配置的不同,它的性能会有所不同。 这一点我说错了吗?如果不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地再现它的行为?如果我需要创建一个单独的语音识别器,它有自己的语法文件和单独的训练历
浏览 5
提问于2016-03-18
得票数 1
1
回答
说话人识别在iPhone应用中的应用
、
、
、
、
出于安全考虑,我想使用iPhone应用程序中的语音识别功能来跟踪语音。 每个用户都可以记录他/她的语音,并通过识别他/她的语音打开应用程序,该语音被记录并存储在数据库中。 有没有人对此功能有想法或示例应用程序,以及如何在iPhone应用程序中实现它?
浏览 0
提问于2012-08-28
得票数 2
3
回答
语音识别有linux SDK吗?
、
语音识别有linux SDK吗?多谢!
浏览 590
提问于2018-01-15
3
回答
有没有简单的VAD实现?
、
、
、
、
我正在寻找一些用于VAD (语音活动检测)的C/C++代码。 基本上,我的应用程序是从设备读取PCM帧。我想知道用户什么时候在说话。我不是在寻找任何语音识别算法,而只是为了语音检测。 我想知道用户什么时候说话,什么时候说完: bool计数( size_t *isVAD,bool count);
浏览 3
提问于2011-03-20
得票数 15
回答已采纳
1
回答
codeigniter中自动生成的语音呼叫
、
、
、
我有与姓名,手机号和个人信息的数据库价值。我需要向所有条目发送一次语音呼叫。 我使用SmartIVR进行语音通话,但我需要知道如何向SmartIVR传递语音信息,因为它们只支持语音文件,而不支持文本到语音的转换。
浏览 1
提问于2017-09-19
得票数 1
1
回答
在windows 10中使用python 2.7进行语音识别
、
、
、
、
我在我的64位Windows10系统中使用python2.7。我在SimpleCV框架上工作,我想实现语音识别来控制我的vlc媒体播放器。在SimpleCv或python2.7中有没有什么模块可以让我很容易地实现语音recognition.If,所以,请指导我完成整个过程。提前感谢!!
浏览 9
提问于2015-09-01
得票数 0
1
回答
如何在c#中将语音转换为文本?(不使用任何sdk或System.speech.*)
、
我知道这不是关于这个话题的第一条帖子,但是我已经搜索了所有关于这个话题的帖子,没有找到我想要的东西。我正在做毕业设计,语音识别也是其中的一部分。我已经搜索了很多关于它,并发现了不同的SDK是可用的,甚至语音识别器引擎在c#。我不能包括这些代码,我得从头开始在我的密码上试一试。 现在,我已经能够从麦克风中获取语音输入,并将其存储到一个wave文件中。我希望将相同的文件或字节流传递给语音识别,以便将语音转换为文本。 如果有人已经这样做了,并且能给我一个论文的链接或者一个代码,我会真的很感激。 ,提前谢谢!
浏览 3
提问于2012-03-04
得票数 0
回答已采纳
4
回答
基于iPhone的语音识别
、
我需要开发一个识别语音的iPhone应用程序,并根据结果执行进一步的任务。 我知道iPhone 3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理它。 是指我需要购买哪些软件并在服务器端实现它,以及如何使用该服务??
浏览 2
提问于2009-07-13
得票数 6
1
回答
在iOS中将语音转换为文本
、
我正在寻找一个示例示例,它实现了open或任何其他语音识别器来将语音转换为文本。有什么教程可以帮我把课文转换成语音吗?
浏览 2
提问于2013-05-03
得票数 0
2
回答
一种有效的录音质量检测方法
、
、
我们有来自我们的服务器端进程之一的实时、不加控制的记录的各种波形文件,而且它们中的大多数在整个过程中都有很好的清晰的语音。然而,有时他们是混乱的,他们有静态,或说话音量不够大。是否有一个有效的方法来确定一个记录是否被认为是“良好”质量使用C#? 我曾想过要把已知的好唱片的平面图和不好的录音进行比较,但是每次录音都会有不同的语言,所以这可能行不通。我研究过像Bass.Net和NAudio这样的库,但是音频处理不是我的专业领域。 我可以尝试比较,但我不完全确定它是如何工作的。我看到有人试图用他们的音频指纹哈希和Levenshtein距离算法来比较两个音频文件,以找到两个音频文件之间的相似度。除非音
浏览 6
提问于2013-08-14
得票数 0
回答已采纳
1
回答
开始使用您的语言进行文本到语音转换
有没有开放源码库,我可以用来输入字母和声音,并产生一个文本到语音系统。 我必须做什么才能从头开始?Python将是我选择的语言,所以我必须在哪里用我的语言开发自己的文本到语音转换。
浏览 0
提问于2011-05-26
得票数 3
回答已采纳
2
回答
创建语音聊天应用程序需要指导
、
、
、
、
我想创建一个语音聊天应用程序作为一个项目的一部分。然而,对于要使用的编程语言和所涉及的技术,我完全缺乏方向。 有人能指点我该怎么做吗? 以下是我需要的功能: 用户对用户语音聊天 会议聊天能力(超过2个用户) 如何将一个用户连接到另一个用户?如何处理语音传输?如何在会议中有效地路由数据包? 我认为最有可能开发这个的语言是Flash。欢迎任何建议。
浏览 3
提问于2010-05-17
得票数 0
5
回答
MP3/WAV到文本(语音识别)
、
我正在寻找一个软件( Windows或Linux),可以将MP3/WAV文件转换为文本。 可以通过语音识别自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
浏览 0
提问于2015-06-28
得票数 13
1
回答
PHP中的语音转文本
、
可以使用PHP将语音邮件转换为文本吗?有没有第三方语音到文本转换软件可以很好地与PHP一起工作?
浏览 1
提问于2010-01-29
得票数 2
回答已采纳
4
回答
基于语音识别的游戏
、
、
由于重复的压力伤害,我想限制我的使用键盘和鼠标。是否有完全(或几乎完全)基于语音识别的游戏? 我更喜欢策略或角色扮演游戏。我对基于Windows或Linux的产品都没意见。
浏览 0
提问于2014-08-11
得票数 4
2
回答
有人有Sphinx语音识别的经验吗?
、
、
是否有人使用语音识别堆栈来构建IVR应用程序?我正在寻找开源的替代品,而不是昂贵的和有一定限制的MSFT和其他选择。我还没有找到一个将开源语音/voip应用程序捆绑在一起的综合软件包。
浏览 1
提问于2008-08-30
得票数 3
回答已采纳
1
回答
语音识别和语调检测
、
、
我想做一个iOS应用程序来计算疑问句。我将寻找WH问题,也会问“我会吗?”设置问题格式。 我不太了解语音或音频技术领域,但我在Google上发现语音识别SDK很少。但我仍然不知道如何检测和绘制语调。有没有支持语调或情感语音识别的SDK?
浏览 3
提问于2013-03-20
得票数 2
2
回答
支持语音- Android中的键盘
、
、
我想看看android的语音键盘功能的源代码。 有人能告诉我在哪里可以找到代码吗?
浏览 1
提问于2010-01-08
得票数 0
1
回答
通过wifi - android流传输语音
我在研究入门电话。入口电话通过rtsp协议向我发送语音和视频,因此我可以简单地从设备上的摄像头获取语音和视频。但我不知道如何向那个设备发送声音。有没有什么方法可以帮助我同时发送和接收音频(比如呼叫)?
浏览 2
提问于2012-06-11
得票数 0
回答已采纳
2
回答
用于iPhone的AMR编码器
、
、
、
、
我正在尝试寻找一个用于iPhone的AMR Encoder,它可以集成到我的语音记录应用程序中。
浏览 0
提问于2009-07-10
得票数 1
2
回答
如何根据不同的扬声器分离音频文件
、
、
、
、
我有一堆关于电话交谈的音频文件。我想试着将一个音频文件一分为二,每个文件只包含一个演讲者的演讲。也许我需要使用语音二值化。但是我该怎么做呢?有人能给我一些线索吗?谢谢。ps: Linux OS.C/C++
浏览 2
提问于2012-10-19
得票数 7
回答已采纳
2
回答
静默安装ttsEngine扩展的语音
、
、
我正在为我的网页创建一个语音扩展,以便盲人可以访问它。到目前为止,这个方法运行良好,现在我想自动安装我选择的两个语音引擎。事实证明,这真的很困难:我已经阅读了大量关于如何处理这一问题的信息。最简单的方法就是在Chrome应用商店里打开语音(TtsEngine)的网页--但这样盲人就不得不经历所有这些麻烦了。大多数其他方法都需要我没有的计算机权限,比如修改用户的文件系统或注册表。 我的问题是:是否真的没有简单的方法来要求、包含或预安装另一个扩展,以便它在后台(静默地)安装? 谢谢你听我说完并提供了一些帮助!温馨的问候,罗曼
浏览 0
提问于2012-07-24
得票数 0
回答已采纳
1
回答
牙线项目是否利用人工输入进行语音合成?
、
、
是否有任何开源的开放内容项目使用录制的语音数据来生成合成的语音?(以合成/模拟某个人的讲话为目标)。顺便提一句,这个过程、目标或提取的数据有名字吗?“语音签名”?) 我想工作流应该是这样的: 记录标准文本中的演讲(“泰迪坐在垫子上”)。 挑出音素(猫的“a”),说明口音 获取数据,使爱丽丝的“呃”听起来不同于贝蒂的“呃” 使用重音-适当的音素加上语音签名将文本呈现为语音 回答这个问题是向 (,)请愿的关键一步,为了人类的利益,他向公共领域捐赠了他的安抚性的声音签名。
浏览 4
提问于2012-01-17
得票数 0
回答已采纳
2
回答
Alexa Raspberry Pi
、
我有一个树莓派模型B+,我正在考虑将它集成到Alexa语音服务中。所以我能够管理我的Raspberry PI和Alexa语音服务,直到Alexa打招呼的部分。为了实现这一点,我还使用了PC108媒体USB外接声卡。因此,我从我的插入式麦克风或迷你插孔音频输出到扬声器的输入和输出。问题是,为了工作.What缺少了一些东西,我必须做什么才能让Alexa听吗? 提前谢谢你。
浏览 0
提问于2017-02-10
得票数 1
1
回答
Google语音识别时间戳
、
我有一个音频文件,而且我有那个音频文件的准确记录。我希望能够在这个特定的文字记录中得到每个单词的时间戳。 我不想要不准确的演讲的时间戳。我已经可以这样做了,这是有用的,但由于语音识别中的错误,它还不够好。 有没有人知道谷歌语音识别是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
网络音频API:我如何检测语音和记录,直到沉默,有或没有按下通话按钮。
、
、
、
、
我使用MediaRecorder API成功地运行了一个充当语音消息发送者的客户端网页: 当用户按任意键时,启动录音, 当密钥被释放时,音频记录通过soketio发送到服务器进行进一步处理。 这是一种PTT (Push To Talk)用户体验,用户只需按一个键(push)就可以激活语音记录。然后,他必须释放密钥来停止录音,触发发送到服务器的消息。 在这里,我使用了一个javascript代码块: navigator.mediaDevices .getUserMedia({ audio: true }) .then(stream =>
浏览 2
提问于2020-05-31
得票数 1
3
回答
使用as3在Flex中保存录制的语音
、
我正在尝试使用flex和as3将录制的语音保存在本地文件系统中。我成功地录制了语音并再次回放。我正在使用Flex中的web应用程序prospective。 这里我注意到,如果我使用窗口应用程序,我成功地将语音记录保存在我的系统中(使用adobe air文件系统)。请让我知道保存录制文件的过程。
浏览 0
提问于2011-04-26
得票数 0
1
回答
Android上的语音到文本,具有自定义不寻常的单词匹配
、
、
、
、
我希望能够使用Android的语音转文本引擎来识别句子中各种不常见的单词。 举个例子,单词“脑电图仪”来自STT作为“电子供应图”。当我使用Soundex或Metaphone将所说的内容与硬编码的值进行比较时,这些值似乎永远不会匹配或随机匹配。如果我使用一个阈值(例如Math.abs(str1.compareTo(Str2)) <= 1 ),那么匹配就会变得非常松散,几乎所有内容都会匹配。 从本质上讲,我想做的事情类似于通过背诵报价来从报价数据库中查找报价。问题似乎更多地出在谷歌语音转文本引擎所使用的有限词集上。 有什么想法吗?
浏览 4
提问于2013-01-28
得票数 5
2
回答
C#语音识别
、
、
我正在做一个智能家居控制系统,我有一个小问题。我正在考虑将Cosmos用于基本系统,并向其添加所需的命名空间库,但由于通常的System.Speech.Recognition名称空间过于依赖Windows,所以我不得不忘记使用它。 因此,我的问题是,是否有(如果可能的话免费)用于C#的语音识别和/或语音合成器库,有以下内容: 支持多语种口语 从语音样本中提取文本内容 用可选择的(或用户写的)语音模式(语音)合成语音 一个通用的、不依赖于windows的库将是最好的,当然,如果它也是免费的。
浏览 21
提问于2010-05-25
得票数 7
回答已采纳
2
回答
扩展Sphinx以支持本地语言
、
、
、
最初,我想从头开始编写一个语音识别引擎(支持50-100个单词)来支持我的母语。 然而,经过一些研究后,很明显,即使在1.5年内支持非常有限的语音识别引擎也是不可能的。 现在我正在考虑扩展sphinx引擎来支持我的语言。是否有可能在一年半内完成,或者甚至对于最后一年的项目来说,这是太多的工作。 我正在焦急地等待你关于这件事的经验。
浏览 1
提问于2012-12-13
得票数 3
1
回答
如何在cocoa中确定一个录制文件中的语音数量?
、
、
、
我想要提取信息,比如在一个录制的文件中每个人有多少声音。 我知道NSSpeechRecognizer类可以识别语音,但无法知道一个录制文件中的语音数量。 请提供一些建议。 谢谢,Yogesh Arora
浏览 0
提问于2014-11-20
得票数 0
3
回答
使用Java控制其他应用程序?
、
、
如何使用Java控制其他应用程序? 我正在使用Mary语音合成器(开放源码,Java)。它可以很好地合成语音,但它要求文本位于应用程序窗口本身的文本框中,然后单击按钮。为了我的这个项目 需要实现的文本将来自另一个java应用程序。我需要知道如何将文本放在文本框中,然后单击应用程序中的一个按钮。 我希望稍后能想出一种从缓冲区合成语音的方法,但在那之前,这似乎是一种让事情运转起来的方法。另外,我很确定以后我还能找到其他的应用程序,这似乎是一个非常有趣的问题。
浏览 4
提问于2012-07-17
得票数 0
1
回答
依赖于Google语音搜索的Android应用程序
、
我目前正在为中国的一个城市创建一个应用程序。它需要语音输入,他们喜欢谷歌语音搜索,因为它非常准确。问题出在中国的手机上,你找不到谷歌语音搜索。可以把它和我的包裹一起寄给我吗?在中国,连接游戏商店是不可能的。因为我目前在中国,谷歌工作得不是很好,我找不到关于这个话题的东西。 我希望有人能帮帮我。
浏览 0
提问于2013-05-19
得票数 0
回答已采纳
1
回答
Ubuntu中有用于电话的语音识别吗?
、
Ubuntu能够识别语音命令吗? 什么类型的语音识别是内置的,它在Ubuntu桌面上是可用的吗?
浏览 0
提问于2013-03-02
得票数 3
2
回答
Solaris音频API
、
、
、
如何编写在Solaris上录制和播放语音的c函数。它通常用来在Solaris中播放和录制语音,就像我们在Windows中使用的WaveIn/WaveOut api一样。
浏览 3
提问于2013-03-13
得票数 2
2
回答
浏览器中的Google语音API
、
在文档页中,有一个通过浏览器收听语音并在后台使用API的演示示例。这个演示的源代码可用吗? 如果没有,则语音API使用flac文件。是否有任何开源项目可以从浏览器中记录flacfiles (这与这个API兼容--有许多github项目存在,但不知道是否有正式的项目)?
浏览 4
提问于2017-05-09
得票数 5
回答已采纳
1
回答
voip项目中最流行的压缩算法是什么?
、
、
在voip项目中最流行的压缩算法是什么,或者在互联网传输中最流行的语音压缩算法是什么?
浏览 1
提问于2012-05-18
得票数 0
回答已采纳
1
回答
使用objective iphone发送语音信息
、
、
、
是否有任何方式以编程方式使用objective和iPhone在消息中发送录制的语音? 我使用messageUI框架发送短信,但现在我也想发送语音信息。
浏览 4
提问于2013-08-17
得票数 2
回答已采纳
1
回答
有没有开源的android语音识别应用程序?
、
有没有开源的android语音识别应用程序?如果可用,请提供参考资料。
浏览 1
提问于2012-03-05
得票数 0
回答已采纳
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux下的7个开源安全工具,再也不怕黑客啦
Linux下MySQL安装
Linux下安装Java
Linux下高效指令
Linux下php安装
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券