使用多个语音转文本API提高准确率

文章/答案/技术大牛

发布

2回答

、、、、

有没有人尝试过使用两个或更多的speech to text API转录音频？您可以使用时间戳匹配单词，并以最高的置信度选择单词。如果有人这样做了，它是否显著提高了转录的准确性？值得吗？

浏览 20提问于2017-07-07得票数 3

1回答

使用TensorFlow将语音转换为文本

、、

我是TensorFlow的新手，我正在寻找一个语音到文本识别项目的帮助。有没有示例展示如何使用TensorFlow将语音转换为文本？我听说它在谷歌内部被用来提高25%的准确率

浏览 4提问于2015-11-14得票数 11

1回答

同步视频中的字幕

、、

我有一个文本文件，所有的话都在视频中说在正确的顺序，但没有时间参考。有没有办法使用这个文本文件在视频中放置字幕？我能想到的一种方法是使用语音识别，但大多数算法都不太准确，无法完成这项任务。

浏览 3提问于2016-01-20得票数 2

2回答

IBM Watson语音识别的准确率较低

、、、

我开发了一个应用程序，它使用语音到文本的方式将音频转录成文本。准确率很低。有些句子没有意义。有没有一种方法可以提高语音转文本的准确性？

浏览 0提问于2016-08-16得票数 1

1回答

C#语音识别引擎加速

、、

下面是我的语音识别代码。我注意到它并不擅长挑选句子。我能做些什么来解决这个问题吗？

浏览 2提问于2017-03-28得票数 1

1回答

Google语音API中口语的语码检测

、、、、

是否有使用机器学习的语音API自动检测口语的选项？表示支持的语言列表。但是，用户需要手动设置此参数以执行语音到文本的操作.我想自动做这件事。

浏览 6提问于2017-07-04得票数 5

回答已采纳

1回答

什么样的谷歌云设置可能会导致语音到文本的差异

Production使用相同的dialogflow代理zip进行部署。然而，我们在行为上有所不同。一开始，我以为是声音或某个人的口音，但当多个人调用dialogflow并得到相同的结果时(得到“嘿jen")。由于对话流代理本质上是相同的，是什么导致了dev和prod之间在语音到文本的解释上的差异？

浏览 22提问于2021-10-25得票数 1

4回答

基于说话者的语音识别引擎

我想做一个小应用，有没有人知道一个好的依赖于说话人的语音识别引擎与sdk。(不是语音到文本引擎)Efrat

浏览 0提问于2010-01-19得票数 0

2回答

免费(最好是开源)语音到文本库的选项

、、、

寻找一个库(具有Java或Python API)，可以将语音转换为文本。100%的准确率并不是绝对的要求，因为我只需要为原型运行一些实验。理想情况下，它应该接受输入文件(例如，.wav)并以文本形式返回输出。谢谢。

浏览 2提问于2012-04-12得票数 11

回答已采纳

1回答

我们可以在MATLAB中使用Microsoft Speech API的语音转文本功能吗？

、、

我们可以在MATLAB中使用Microsoft Speech API的语音转文本功能吗？这是文本转speech.How的代码，我们可以使用它的功能是语音转文本吗？

浏览 1提问于2013-02-26得票数 1

1回答

准确性:玻璃语音命令与给定列表最接近匹配

、、、

我跟踪是为了使用GlassVoice.apk脱机实现语音识别器。MyVoiceListener(mVoiceConfig),但我的问题是，当我只说“猫”或“下一步”时，语音识别器会找到最近的单词，即“猫”或“下一步”，因为准确率可能在0.5左右。我希望语音识别器找不到最接近的单词，而是全部的工作。是否有可能提高精度(大约0.85/0.9将是完美的)？

浏览 2提问于2014-06-23得票数 1

2回答

使用附加上下文改进Android语音识别

、、

据我所知，Android使用google语音识别服务进行语音到文本。或者，是否有任何其他语音识别服务可用于此目的？提前谢谢。

浏览 2提问于2015-03-19得票数 4

回答已采纳

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：这是提供给Google：的视频的音频文件。

浏览 5提问于2020-10-12得票数 4

1回答

android语音分类接口

我想开发一个android应用程序，使用语音与用户互动。我在上看了谷歌的speech to text API他们的API是否针对语音分类(2-3)类(单词/短语

浏览 1提问于2013-05-29得票数 2

3回答

Unity游戏引擎上的语音识别

、、、

我已经成功地实现了在android上开发一个使用Google API语音识别的应用程序的目标。所以..。在web上搜索...我发现我不能在Unity游戏引擎上使用Google语音识别API，因为它属于Google…这是真的吗？你能给我一个关于如何实现这一点的建议吗？第

浏览 7提问于2013-04-10得票数 4

1回答

当使用张开的耳朵进行语音识别时，准确率非常低

、、

我在我的应用程序中使用开放的耳朵进行语音识别。主要的关注点是准确性。在安静的环境中，准确率约为50%，但在嘈杂的环境中，情况会变得更糟。几乎没有任何东西是正确识别的。我目前使用的是一个大约300个单词的字典文件。我应该寻找哪些方面来提高准确性？到目前为止，我还没有对此做过任何调整。

浏览 1提问于2011-09-15得票数 10

回答已采纳

1回答

我正在使用XNA构建一个桌面应用程序。它有一个文本到语音的应用程序，我正在使用微软Translator V2 api来完成这项工作。更具体地说，我使用的是Speak方法()，并使用SoundEffect和SoundEffectInstance类播放音频。服务运行正常，但我的音频有一些问题。音质不是很好，音量也不够大。我需要一种编程的方法来提高音量(我已经尝试了CodeProject中的一些基本解决方案，但算法不是很好，生成的音频质量非常低)，或者<e

浏览 1提问于2011-04-12得票数 1

回答已采纳

3回答