前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >讯飞翻译超英语六级挑战专业八级,胡郁:做翻译承载文化交流使命

讯飞翻译超英语六级挑战专业八级,胡郁:做翻译承载文化交流使命

作者头像
新智元
发布于 2018-05-29 07:29:49
发布于 2018-05-29 07:29:49
9770
举报
文章被收录于专栏:新智元新智元

新智元报道

作者:张乾

【新智元导读】今天,科大讯飞翻译机2.0版本全网开售。新版本增加了摄像头和屏幕,能够对中文与33种国外语言进行即时互译,目前支持国内四川话、广东话、东北话、河南话4种方言,功能强大。胡郁说,讯飞做翻译不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。

下一步,超越专八。

4月20日,科大讯飞执行总裁胡郁在“科大讯飞翻译战略暨新品上市发布会”上宣布,讯飞翻译已经超越中国大学英语6级(CET6)水平。

CET六级翻译题满分15分,科大讯飞机器得分12分,超过大多数人类考生。胡郁说,下一步是超越英语专八。

集讯飞翻译技术大成的翻译机也在当天推出第二代产品,新品于今天正式全网开售。第二代产品的一个重大更新是增加了摄像头和屏幕,不仅可以实现拍照翻译,还能够让AI助理在更多的场景中发挥作用。

视频为翻译机2.0版本巧妙回答人类问题↓

规则翻译是傻子,统计翻译是疯子,只有运用人工神经网络才是突破口

胡郁首先回顾了机器翻译技术的演进历史:

  • 80年代前后基于规则机器翻译占据主流;
  • 90年代统计机器翻译技术;
  • 2011年开始神经网络技术快速发展。

规则翻译是个傻子,而统计机器翻译是个疯子,为什么这么说?因为规则性的机器翻译,如果你不告诉它规则,它就什么都翻不出来,所以有时候显得很傻。

统计机器翻译,因为它是采用统计的方法,所以对于任意的机器翻译的句子输入以后,它都能把它翻译成另外一种语言,但是因为统计的语料覆盖,很多情况可能机器没看过,他就会经常的自言自语,说疯话,所以很多翻译出来的东西让你啼笑皆非。

得益于神经网络的崛起,让翻译在“傻子”“疯子”之外,开辟了一条新路。

胡郁说,科大讯飞与谷歌是最早将深度神经网络用在语音识别语音合成上,创新性地在先期的统计模式识别的语音翻译中间用上了基于深度神经网络的语言模型,最早做出了当时中英文翻译最好的系统。

全双工语音翻译系统加持,超越英语六级挑战专八

在翻译中最难解决的几个难题,除了语音识别、合成等相关的部分外,还面临词汇的复杂性和句式的复杂性

讯飞把attention based neural network(基于注意力的神经网络)模型用在翻译上,取得了非常好的效果,它能自动地获取字的匹配和词的匹配,以及句子中顺序的匹配。对于字,采用CLASS语言解耦合方案解决实体词稀疏性难题;对于句,采用重构的训练目标准则缓解复杂句式漏翻问题。

2017年,科大讯飞在业界首次推出全双工语音翻译系统,全双工是通过语义和场景的理解,来进行无间隔持续翻译工作。这个系统被纳入到讯飞翻译的AIUI中,让讯飞翻译整体技能增强,包括全双工、交互、多轮对话、自动语种识别多语言的语种合成等各个方面。

目前,讯飞翻译已经超越中国大学英语6级(CET6)水平。CET六级翻译题满分15分,科大讯飞机器得分12分,超过大多数人类考生。胡郁说,下一步,讯飞翻译的目标是超越专八。

此外,讯飞已还凭借这些技术获得了了多个国际比赛大奖。

  • 第四届国际多通道语音分离和识别大赛(CHiME-4)全部三个项目第一;
  • 国际语音合成大赛12年连续国际第一;
  • 2016国际知识图谱构建大赛(NIST TAC Knowledge Base Population)核心任务冠亚军;
  • SQuAD机器阅读理解大赛三次刷新国际记录。

定义旗舰翻译4大标准,加量不加价

在发布会上胡郁还公布了讯飞翻译机一代2017年的成绩单:20万台销量,覆盖137个国家,服务2000万次数人群,用户好评98%。而作为开拓者,一代翻译机还定义了A.I.旗舰翻译四大标准:听得清、听得懂、译得准,发音美。

在翻译机这样一个高度垂直的市场里,能卖出20万台设备实属不易。胡郁说,未来,讯飞翻译将根据场景细分,打造翻译全场景产品体系,面向行业的是“听见”,“听见”的使用场景为会议记录、视频直播、大会上屏。面向消费者的就是翻译机。

讯飞翻译机产品经理翟吉博说,翻译机二代产品的更新,也体现了这一理念。

首先是增加屏幕和摄像头

现在,仅靠语音互译已经满足不了人们的需求,翻译机二代产品增加拍照翻译功能,能够对菜单、路牌、说明书等内容进行拍照翻译。并对各种印刷体、英文手写体也能很好识别,支持11种语言。

其次是方言翻译,目前能够支持的方言包括粤语、四川话、河南话、东北话4种主流方言,后续还将继续升级;其对带口音的普通话整体识别率达到95%。

第三是离线翻译。首创多语种NMT离线翻译引擎,离线在线无缝切换;目前支持中英离线翻译,目标是在2018年世界杯之前,中俄互译在线离线功能上线。

第四是中文与全球33种语言即时互译。讯飞认为,这33种语言能够解决95%的中国出境游用户场景需求。

第五是提供移动流量解决方案。支持WIFI、4G、免SIM卡上网、一键开启热点等功能。

此外,AI助手也能在翻译机中体现,针对景区、交通站点等特定场景提供服务,并支持设备系统在线升级。

更新后的翻译机2.0版本有星辰黑、香槟金、樱花粉三色可选,售价与一代一样,都是2999元人民币。

做翻译机的大逻辑:不是做产品、技术或服务,是承载文化交流的使命

运算智能、感知智能、运动智能、认知智能是科大讯飞认为的人工智能发展的几个阶段,胡郁说,语言和语言之间的翻译是促进人类融合成一个大的智能体的必要过程,是认知智能的一个重大突破。

“科大讯飞做翻译,不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。”胡郁说。

讯飞目前正在实施人类语言大互通计划,语言翻译将成为中国国际化、全球化中间一个非常重要的支撑。讯飞还与国际电信联盟、上海外国语大学、东北大学等合作,共同推动翻译事业的发展。

而讯飞当初翻译机出于何种目的?

胡郁说,最开始是援疆援藏过程中产生的语言互译需求,2016年11月发布翻译机1.0产品,此后便一发不可收拾,成为人们出国旅行、交流的利器。在今年的博鳌亚洲论坛上,讯飞翻译机成为官方指定翻译机,被作为“国礼”赠送给荷兰首相。

另一方面,跟手机上的翻译软件相比,翻译机的优势有:抗噪拾音,还原真实场景;随时随地一键开启翻译;独立硬件,拉近彼此距离。因此在一定程度上是用户刚需。

最后,谈到AI翻译能否取代人类的问题,胡郁认为,翻译目前还难以突破文化、生活、知识等限制,无法取代人类,而最终也将成为人类的助手。

去年10月,讯飞与上海外国语大学建立联合实验室,高翻人员使用讯飞听见,对翻译活动有很大帮助。上海外国语大学高翻学院副院长吴刚也来到了发布会现场,吴刚说,面对新技术的时候不要恐惧或反对,做一个实验者,在AI新时代,翻译者要调整心态,找到新的定位,探索人机耦合,把翻译事业推向高峰。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
测试思想-测试设计 测试用例设计之等价类划分方法
把所有可能的输入数据,即程序的输入域划分成若干部分(子集),然后从每一个子集中选取少数具有代表性的数据作为测试用例。该方法是一种重要的,常用的黑盒测试用例设计方法。
授客
2019/09/11
1.4K0
测试思想-测试设计 测试用例设计之等价类划分方法
黑盒 测试用例设计方法「建议收藏」
黑盒测试用例设计方法包括等价类划分法、边界值分析法、错误推测法、因果图法、判定表驱动法、正交试验设计法、功能图法等。
全栈程序员站长
2022/07/01
1.5K0
黑盒 测试用例设计方法「建议收藏」
软件测试实战演习
1.某程序设有一个档案管理系统,要求用户输入以年月表示的日期。假设日期限定在1990年1月~2049年12月,并规定日期由6位数字字符组成,前4位表示年,后2位表示月。现用等价类划分法设计测试用例,来测试程序的"日期检查功能"。 1)划分等价类并编号,下表等价类划分的结果 输入等价类 有效等价类 无效等价类 日期的类型及长度 ①6位数字字符 ②有非数字字符 ③少于6位数字字符 ④多于6位数字字符 年份范围 ⑤在1990~2049之间 ⑥小于1990 ⑦大于2049 月份范围 ⑧在01~12之间 ⑨等于00 ⑩大于12 2)设计测试用例,以便覆盖所有的有效等价类在表中列出了3个有效等价类,编号分别为①、⑤、⑧,设计的测试用例如下: 测试数据 期望结果 覆盖的有效等价类 200211 输入有效 ①、⑤、⑧ 3)为每一个无效等价类设计一个测试用例,设计结果如下: 测试数据 期望结果 覆盖的无效等价类 95June 无效输入 ② 20036 无效输入 ③ 2001006 无效输入 ④ 198912 无效输入 ⑥ 200401 无效输入 ⑦ 200100 无效输入 ⑨ 200113 无效输入 ⑩
葆宁
2019/04/18
9950
软件测试实战演习
【测试】黑盒测试用例设计方法
等价类划分法是把程序的输入域划分成若干部分(子集),然后从每个部分中选取少数代表性数据作为测试用例。每一类的代表性数据在测试中的作用等价于这一类中的其他值。
全栈程序员站长
2022/08/10
2.2K0
【测试】黑盒测试用例设计方法
黑盒测试用例设计 一[通俗易懂]
把所有可能的输入数据,即程序的输入域划分成若干部分(子集),然后从每一个子集中选取少数具有代表性的数据作为测试用例
全栈程序员站长
2022/07/01
7370
黑盒测试用例设计 一[通俗易懂]
黑盒测试之测试用例的设计方法(全)
之前分享过一篇《黑盒测试以及测试用例设计》,感觉比较粗略,所以今天又再一次分享一下。
软测小生
2019/07/05
4.8K0
黑盒测试之测试用例的设计方法(全)
自动化测试之-测试用例设计方法总结
黑盒测试用例设计方法包括等价类划分法、边界值分析法、错误推测法、因果图法、判定表驱动法、正交试验设计法、功能图法、场景图法等。
顾翔
2019/12/12
3.2K0
自动化测试之-测试用例设计方法总结
黑盒测试用例设计方法一(等价类划分、边界值分析)
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/136310.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/06
3.4K0
黑盒测试用例设计方法一(等价类划分、边界值分析)
软件测试等价类划分实例_软件测试原则
某程序规定:“输入三个整数 a 、 b 、 c 分别作为三边的边长构成三角形。通过程序判定所构成的三角形的类型,当此三角形为一般三角形、等腰三角形及等边三角形时,分别作计算 … “。用等价类划分方法为该程序进行测试用例设计。(三角形问题的复杂之处在于输入与输出之间的关系比较复杂。) 分析题目中给出和隐含的对输入条件的要求: (1)整数 (2)三个数 (3)非零数 (4)正数 (5)两边之和大于第三边 (6)等腰 (7)等边 如果 a 、 b 、 c 满足条件( 1 ) ~ ( 4 ),则输出下列四种情况之一: 1)如果不满足条件(5),则程序输出为 ” 非三角形 ” 。 2)如果三条边相等即满足条件(7),则程序输出为 ” 等边三角形 ” 。 3)如果只有两条边相等、即满足条件(6),则程序输出为 ” 等腰三角形 ” 。 4)如果三条边都不相等,则程序输出为 ” 一般三角形 ” 。 列出等价类表并编号
全栈程序员站长
2022/09/27
3.3K0
用例设计方法及其覆盖率
  在表象中添加了不正确的信息,是过失故障。未输入正确信息,是遗漏故障。遗漏故障更难发现。
顾翔
2019/12/11
1K0
用例设计方法及其覆盖率
测试从零开始-No.6-测试用例设计方法(等价类+边界值)「建议收藏」
是把所有可能的输入数据,即程序的输入域划分成若干部分子集,然后从每一个子集中选取少数具有代表性的数据作为测试用例。该方法是一种重要的,常用的黑盒测试用例设计方法。
全栈程序员站长
2022/09/27
1K0
软件测试用例的设计方法_设计测试用例的依据
把程序的输入域和输出域划分成若干部分,然后从各个部分中选取若干代表性数据作为测试用例。这些数据在测试中的作用等价于其所属部分的其他值。
全栈程序员站长
2022/11/07
1.1K0
软件测试用例的设计方法_设计测试用例的依据
黑盒(功能)测试基本方法
(1)黑盒测试又称功能测试、数据驱动测试或基于规格说明书的测试,是一种从用户观点出发的测试。
wangmcn
2022/10/30
1.3K0
等价类划分法测试用例举例_使用等价类划分法设计测试用例
是在测试执行之前,由测试人员进行编写的指导测试过程的重要文档,主要包括:用例编号,测试目的,测试步骤(用例描述),预期结果(期待结果)等(不同公司模板不同,但是大同小异)
全栈程序员站长
2022/09/27
7680
黑盒测试用例测试方法
等价类划分法是一种典型的、重要的黑盒测试方法,是指某个输入域的子集合。在该子集合中,所有的输入数据对于揭露软件中的错误都是等效的。
全栈程序员站长
2022/07/01
1.4K0
黑盒测试用例测试方法
黑盒测试:等价类划分法(弱健壮)
问题 构造下述三角形问题的弱健壮的等价类测试用例。 三角形问题:输入三个不超过100的正整数作为三角形的三条边,判断三角形是等边三角形、等腰不等边三角形、完全不等边三角形还是不能构成三角形。 解答 有效等价类划分: R1 = {<a, b, c>: the triangle with sides a, b, and c is equilateral} R2 = {<a, b, c>: the triangle with sides a, b, and c is isosceles} R3 = {<a, b,
梦飞
2022/06/23
9240
等价类划分法三角形测试用例_三角形等价类划分
测试一个图形是不是三角形,需考虑到三角形的性质要求。除了满足A B C均是正数且大于0,还需满足
全栈程序员站长
2022/11/02
1.2K0
等价类划分法-案例剖析-设计测试用例「建议收藏」
等价类划分法是把所有可能的输入数据,即程序的输入数据集合划分成若干个子集即等价类,然后从每个等价类中选取少量具有代表性的数据作为测试用例。
全栈程序员站长
2022/11/07
3K0
等价类划分法-案例剖析-设计测试用例「建议收藏」
黑盒测试的测试方法有哪些_黑盒测试包含哪些测试内容
一般我们在做软件测试的时候,会遇到黑盒测试,白盒测试,我们今天主要说的是黑盒测试的 主要测试方法有那些。接下来就是干货了。
全栈程序员站长
2022/11/01
2.2K0
黑盒测试的测试方法有哪些_黑盒测试包含哪些测试内容
软件测试用例设计 (一)等价类划分法「建议收藏」
如果要从事软件测试,那么有些必备的技能还是要有的。比如,测试理论、测试工具、测试文档的编制。
全栈程序员站长
2022/11/02
5.2K0
推荐阅读
相关推荐
测试思想-测试设计 测试用例设计之等价类划分方法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档