首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >获取音频文件,自动转录,获取输出,并将其与记录进行匹配。

获取音频文件,自动转录,获取输出,并将其与记录进行匹配。
EN

Software Engineering用户
提问于 2013-02-03 13:29:10
回答 2查看 517关注 0票数 2

我们有大约8000段视频的记录。然而,这些转录本没有任何计时文本(即:它们不是时间编码到视频中)。

我们正试图确定是否存在软件,或采取何种方法自动对文字记录进行编码,以便与其相关视频进行编码。

是否存在软件来做到这一点?

如果没有,您会使用什么软件方法来完成这一壮举?

EN

回答 2

Software Engineering用户

发布于 2013-02-03 13:55:16

我不知道任何完全自动的软件解决方案,但是本篇论文 (SyncTS:语音和文本文档的自动同步)提供了一种可能的方法。

本文提出了一种语音信号与相应文本文档自动对齐的方法。为此,我们建议首先使用文本到语音合成(TTS)从文本表示中获取语音信号。随后,将两个语音信号转换为音频特征序列,然后利用贪婪的动态时间扭曲(DTW)的变量对时对齐。所提出的方法既有效(具有线性运行时间),计算简单,又不依赖于先前的训练阶段,因为在使用基于HMM的方法时是必要的。它得益于以下因素的结合: a)一种新的语音特征,与语音进展相关;b) DTW从左到右的贪婪变体;c)基于TTS的从输入文本文档创建特征表示的方法。通过多个实验验证了该方法的可行性。

票数 3
EN

Software Engineering用户

发布于 2013-02-04 04:08:06

将允许您将成绩单附加到视频剪辑并尝试对齐它们。它用成绩单作为培训材料,在视频上做文字到讲话。总比没有强..。不幸的是,你做这个手动和8k剪辑,这将不是很愉快。

票数 0
EN
页面原文内容由Software Engineering提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwareengineering.stackexchange.com/questions/185723

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档