开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

什么是Translatotron？

文章来源：企鹅号 - 聊大翻译之家

目前的神经机器翻译如火如荼，可以帮助我们翻译很多资料，但是机器翻译的缺陷也很多。2019年5月15日，谷歌AI在博客平台介绍了一款能保留说话者声音特征的“同声传译”模型translatotron。

目前常用的语音翻译包含三个步骤：首先将语音转换为文字（speech recognition），再由机器将文字转换为目标语言文字(machine translation)，第三步是将目标语言文字转化为语音（文字转语音全称Text-To-Speech，也叫TTS）。

与常用的模型不同，Translatotron模型通过某种手段实现了语音到语音的直接转译。除此之外，它还有一些其它的优势，比如推理速度更快、更容易识别不需要翻译的名称及专业名词、可以保留原说话人的声音特征等。

智能化的语音聊天

发表于: 2020-03-102020-03-10 08:20:00
原文链接：https://kuaibao.qq.com/s/20200308A0EQOT00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯