首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

业界 | 谷歌为YouTube添加新功能:利用机器学习自动生成音效字幕

在这个最初发布的功能中,我们选择了「鼓掌」、「音乐」和「笑声」,这主要是基于我们对人类创造的字幕的分析,分析表明这些背景声音是人工添加最多的字幕。...因为多个音效可以共同出现,因此我们的模型可以在每个时间步骤(time step)对每段音效进行预测。...将音效信息添加到自动字幕 一旦系统能准确检测和分类视频中背景声音,我们就开始寻找将这一信息传达给观众的有效办法。...,将它们交叉呈现 仅在句子结束时或者语音出现停顿的时候(即使停顿出现在语音过程中),显示音效字幕 如果观看时禁音,用户对字幕的感受如何 几乎所有的用户赞许了被添加的精确音效信息,对此我们并不吃惊。...我们还特别关注了该声音检测系统的错误反馈(当确定了一个声音其实却没有声音的假正例或没能检测到一个音效)。这个结果让人吃惊:当音效信息错误时,在大约一半的情况下它没使用户的体验降低。

1.4K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    业界 | 谷歌新进展:用DNN模型为YouTube视频添加环境音效字幕

    如今,这一功能又有了升级版——AI科技评论了解到,谷歌于昨日(3月23日)宣布,将为YouTube视频中的自动字幕增加音效信息,使人们拥有更丰富的视听体验。...据AI科技评论了解,这也是YouTube第一个用机器学习为视频自动添加音效字幕的技术,由Accessibility、Sound Understanding和YouTube团队共同完成。...研究人员最后选择检测的三种环境音是“鼓掌”、“音乐”和“笑声”,因为在人们添加的字幕中,这三种被添加的次数最多,并且传达的语义信息也比较明确。...每个音效的预测断对应ON。 但是,这样的分类系统可能会导致模型无法区分同一时段内发生的不同事件。这就需要模型在信息误报(false positives )和信息丢失这两点中寻找平衡。...条件设定如: 分开显示语音字幕和音效字幕; 兼有语音字幕和音效字幕时,让它们交叉呈现; 仅在句子结束或语音出现停顿时,显示音效字幕; 消音看视频,评价对字幕的感受如何。

    1.5K90

    java完善程序题_JAVA 程序

    参考链接: 用于计算商数和余数的Java程序 摘抄自:http://www.cnblogs.com/forlina/archive/2011/08/03/2126292.html1.完成数组int[]...9.输入一个整数,求这个整数中每位数字相加的和  10.编写一个java应用程序,要求如下:  (1)声明一个String类的变量并初始化值“Hello World”。  ...11.程序功能:求s=1+3+5+7+...直到s>2000为止。  12.程序功能:计算s=2!+4!+8!。...程序中有两行有错误。  29.程序功能:求[3,500]内所有素数之和。(首先如何找出素数)  30.程序功能:把一张一元钞票,换成一分、二分和五分硬币,每种至少8枚,求方案数。  ...45.程序功能:计算两个数的最小公倍数  46.程序功能:求1900年~2003年所有闰年年号之和。

    1.7K20

    学界 | 为代码自动添加注释,让 Java 程序的阅读和开发更高效

    通过帮助开发者快速理解代码和减少他们的阅读代码量,可以减少开发者理解程序的时间。当程序员书写注释时,这些注释的目的是描述该方法(method)。不幸的是,程序员常常不写注释,而且有时候注释是过期的。...为了解决程序员写注释的问题,以帮助提升对程序的理解,之前 Sridhara(特拉华大学软件分析实验室)通过人工的方式为少量已知的多语句动作编写了一套模板,比如用于「计算最大值」的循环结构。...对于第 11-14 行的动作单元,这篇关于与对象相关的动作单元的论文会生成「将新创建的映射行添加到数据库中」。对于第 9 行单行的与对象相关的动作单元,我们会生成「将指定比特流添加到比特流」。...另一个潜在的应用是帮助没有头绪的程序员快速理解代码段,否则这件事做起来就会很繁琐和困难。...我们的系统可以轻松地集成到 IDE 中,从而可在软件开发者开始开发 Java 方法时提供最新的描述。

    82370
    领券