腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
使用
多个
语音
转
文本
API
提高
准确率
、
、
、
、
有没有人尝试过
使用
两个或更多的speech to text
API
转录音频?您可以
使用
时间戳匹配单词,并以最高的置信度选择单词。如果有人这样做了,它是否显著
提高
了转录的准确性?值得吗?
浏览 20
提问于2017-07-07
得票数 3
1
回答
使用
TensorFlow将
语音
转换为
文本
、
、
我是TensorFlow的新手,我正在寻找一个
语音
到
文本
识别项目的帮助。有没有示例展示如何
使用
TensorFlow将
语音
转换为
文本
?我听说它在谷歌内部被用来
提高
25%的
准确率
浏览 4
提问于2015-11-14
得票数 11
1
回答
同步视频中的字幕
、
、
我有一个
文本
文件,所有的话都在视频中说在正确的顺序,但没有时间参考。有没有办法
使用
这个
文本
文件在视频中放置字幕? 我能想到的一种方法是
使用
语音
识别,但大多数算法都不太准确,无法完成这项任务。
浏览 3
提问于2016-01-20
得票数 2
2
回答
IBM Watson
语音
识别的
准确率
较低
、
、
、
我开发了一个应用程序,它
使用
语音
到
文本
的方式将音频转录成
文本
。
准确率
很低。有些句子没有意义。有没有一种方法可以
提高
语音
转
文本
的准确性?
浏览 0
提问于2016-08-16
得票数 1
1
回答
C#
语音
识别引擎加速
、
、
下面是我的
语音
识别代码。我注意到它并不擅长挑选句子。我能做些什么来解决这个问题吗?
浏览 2
提问于2017-03-28
得票数 1
1
回答
语音
识别自学习模型和热词的区别?
浏览 236
提问于2022-06-15
3
回答
Google
语音
API
中口语的语码检测
、
、
、
、
是否有
使用
机器学习的
语音
API
自动检测口语的选项? 表示支持的语言列表。但是,用户需要手动设置此参数以执行
语音
到
文本
的操作.我想自动做这件事。
浏览 6
提问于2017-07-04
得票数 5
回答已采纳
1
回答
什么样的谷歌云设置可能会导致
语音
到
文本
的差异
Production
使用
相同的dialogflow代理zip进行部署。然而,我们在行为上有所不同。一开始,我以为是声音或某个人的口音,但当
多个
人调用dialogflow并得到相同的结果时(得到“嘿jen")。由于对话流代理本质上是相同的,是什么导致了dev和prod之间在
语音
到
文本
的解释上的差异?
浏览 22
提问于2021-10-25
得票数 1
4
回答
基于说话者的
语音
识别引擎
我想做一个小应用,有没有人知道一个好的依赖于说话人的
语音
识别引擎与sdk。(不是
语音
到
文本
引擎)Efrat
浏览 0
提问于2010-01-19
得票数 0
2
回答
免费(最好是开源)
语音
到
文本
库的选项
、
、
、
寻找一个库(具有Java或Python
API
),可以将
语音
转换为
文本
。100%的
准确率
并不是绝对的要求,因为我只需要为原型运行一些实验。理想情况下,它应该接受输入文件(例如,.wav)并以
文本
形式返回输出。 谢谢。
浏览 2
提问于2012-04-12
得票数 11
回答已采纳
1
回答
我们可以在MATLAB中
使用
Microsoft Speech
API
的
语音
转
文本
功能吗?
、
、
我们可以在MATLAB中
使用
Microsoft Speech
API
的
语音
转
文本
功能吗?这是
文本
转
speech.How的代码,我们可以
使用
它的功能是
语音
转
文本
吗?
浏览 1
提问于2013-02-26
得票数 1
1
回答
准确性:玻璃
语音
命令与给定列表最接近匹配
、
、
、
我跟踪是为了
使用
GlassVoice.apk脱机实现
语音
识别器。MyVoiceListener(mVoiceConfig),但我的问题是,当我只说“猫”或“下一步”时,
语音
识别器会找到最近的单词,即“猫”或“下一步”,因为
准确率
可能在0.5左右。我希望
语音
识别器找不到最接近的单词,而是全部的工作。 是否有可能
提高
精度(大约0.85/0.9将是完美的)?
浏览 2
提问于2014-06-23
得票数 1
2
回答
使用
附加上下文改进Android
语音
识别
、
、
据我所知,Android
使用
google
语音
识别服务进行
语音
到
文本
。或者,是否有任何其他
语音
识别服务可用于此目的? 提前谢谢。
浏览 2
提问于2015-03-19
得票数 4
回答已采纳
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌
语音
设置给AI发短信以下是
语音
到
文本
AI:的输出文件这是视频链接: 这是提供给Google:的视频的音频文件。
浏览 5
提问于2020-10-12
得票数 4
1
回答
android
语音
分类接口
我想开发一个android应用程序,
使用
语音
与用户互动。我在上看了谷歌的speech to text
API
他们的
API
是否针对
语音
分类(2-3)类(单词/短语
浏览 1
提问于2013-05-29
得票数 2
3
回答
Unity游戏引擎上的
语音
识别
、
、
、
我已经成功地实现了在android上开发一个
使用
Google
API
语音
识别的应用程序的目标。所以..。在web上搜索...我发现我不能在Unity游戏引擎上
使用
Google
语音
识别
API
,因为它属于Google…这是真的吗? 你能给我一个关于如何实现这一点的建议吗?第
浏览 7
提问于2013-04-10
得票数 4
1
回答
当
使用
张开的耳朵进行
语音
识别时,
准确率
非常低
、
、
我在我的应用程序中
使用
开放的耳朵进行
语音
识别。主要的关注点是准确性。在安静的环境中,
准确率
约为50%,但在嘈杂的环境中,情况会变得更糟。几乎没有任何东西是正确识别的。我目前
使用
的是一个大约300个单词的字典文件。我应该寻找哪些方面来
提高
准确性?到目前为止,我还没有对此做过任何调整。
浏览 1
提问于2011-09-15
得票数 10
回答已采纳
1
回答
Microsoft Translator的音频质量较低
、
、
、
我正在
使用
XNA构建一个桌面应用程序。它有一个
文本
到
语音
的应用程序,我正在
使用
微软Translator V2
api
来完成这项工作。更具体地说,我
使用
的是Speak方法(),并
使用
SoundEffect和SoundEffectInstance类播放音频。 服务运行正常,但我的音频有一些问题。音质不是很好,音量也不够大。我需要一种编程的方法来
提高
音量(我已经尝试了CodeProject中的一些基本解决方案,但算法不是很好,生成的音频质量非常低),或者<e
浏览 1
提问于2011-04-12
得票数 1
回答已采纳
3
回答
System.Speech.Recognition是否
使用
“
语音
训练”?
、
、
、
sender, SpeechRecognizedEventArgs e) textBox1.Text = "Recognized text: " + e.Result.Text;当我
使用
这些
语音
“配置文件”可以(轻松)移动吗?
浏览 5
提问于2013-03-07
得票数 5
回答已采纳
1
回答
从音频文件中检测
语音
、角色甚至可能是
语音
中的韵律和不流畅
、
、
、
Google/YouTube自动
语音
识别生成字幕,而不需要标记他们的声音。你知道他们为什么不这么做吗?或者,如何做到这一点?或者,他们
使用
的STT软件,如果它可以通过某种方式进行配置来做到这一点?
浏览 28
提问于2021-11-25
得票数 0
点击加载更多
相关
资讯
OpenAI推出ChatGPT API供第三方使用,公布语音转文本模型
录音怎么转换成文字,8款准确率超高的软件分享
谷歌通过定制的深度学习模型升级了其语音转文字的服务
OpenAI 新推出的语音 AI 模型 gpt-4o-transcribe 让你几秒钟内为现有文本应用添加语音功能
免费图片转excel方案大全
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
云直播
活动推荐
运营活动
广告
关闭
领券