我们有大约8000段视频的记录。然而,这些转录本没有任何计时文本(即:它们不是时间编码到视频中)。
我们正试图确定是否存在软件,或采取何种方法自动对文字记录进行编码,以便与其相关视频进行编码。
是否存在软件来做到这一点?
如果没有,您会使用什么软件方法来完成这一壮举?
发布于 2013-02-03 13:55:16
我不知道任何完全自动的软件解决方案,但是本篇论文 (SyncTS:语音和文本文档的自动同步)提供了一种可能的方法。
本文提出了一种语音信号与相应文本文档自动对齐的方法。为此,我们建议首先使用文本到语音合成(TTS)从文本表示中获取语音信号。随后,将两个语音信号转换为音频特征序列,然后利用贪婪的动态时间扭曲(DTW)的变量对时对齐。所提出的方法既有效(具有线性运行时间),计算简单,又不依赖于先前的训练阶段,因为在使用基于HMM的方法时是必要的。它得益于以下因素的结合: a)一种新的语音特征,与语音进展相关;b) DTW从左到右的贪婪变体;c)基于TTS的从输入文本文档创建特征表示的方法。通过多个实验验证了该方法的可行性。
发布于 2013-02-04 04:08:06
将允许您将成绩单附加到视频剪辑并尝试对齐它们。它用成绩单作为培训材料,在视频上做文字到讲话。总比没有强..。不幸的是,你做这个手动和8k剪辑,这将不是很愉快。
https://softwareengineering.stackexchange.com/questions/185723
复制相似问题