Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >科大讯飞“AI同传造假”风波:机器翻译替代人工还很遥远丨科技云·视角

科大讯飞“AI同传造假”风波:机器翻译替代人工还很遥远丨科技云·视角

作者头像
科技云报道
发布于 2022-04-14 13:03:00
发布于 2022-04-14 13:03:00
3K0
举报
文章被收录于专栏:科技云报道科技云报道

2018世界人工智能大会刚落幕,科大讯飞却陷入了“AI同传造假”的风波。9月20日,一位同传译员在知乎上发文称,讯飞的翻译其实为人工同传,并非机器智能翻译,并且译文由机器进行朗读,此事引发了媒体的广泛关注。


科大讯飞AI同传造假一事引起了轩然大波,业界对AI同传的能力产生质疑的同时,也让科大讯飞成为了舆论中心。针对此事,科大讯飞董秘江涛对外回应称,“讯飞从没讲过AI同传的概念,始终强调是人机耦合的模式。”

科大讯飞这么解释同传领域的人机耦合:“翻译字幕上中英文同时显示时,是嵌入式机器实时全自动同传,单个语种显示时是人工同传。人工翻译时,讯飞听见可以帮助同传提升效率和水平。”

按照科大讯飞的解释,科大讯飞的机器只是起到了识别同传人员的语音翻译,再用AI将翻译机器播报出来,与语音识别有关,却与AI同传无关。

事实上,科大讯飞并不是第一家被质疑AI造假的企业。两年前,搜狗在乌镇世界互联网大会秀的一把“实时机器翻译”现场演示,就在网络上引发了一波“伪科技”的质疑。

大会演讲现场不仅实时语音识别显示中文内容,还有机器同步翻译成英文,生成双语滚动字幕。据搜狗方面称,其机器翻译准确率达90%,未来有望取代人类同传。

然而搜狗现场机器翻译不时出现的“中式英语”翻译,甚至当中文识别出现错别字时,英文翻译却毫无错误,这些BUG的出现不禁让人质疑,难不成机器翻译早已熟知稿件,而并非根据实时中文来进行翻译?

无论是谷歌、微软,还是百度、有道、金山等,国内外目前对于机器翻译的准确率并没有一个准确的数据,基本都以“翻译错误降低率”来衡量其进步,而搜狗却直接对外抛出了90%的准确率,着实令业内哗然。

机器翻译的乌龙闹剧并未停止。今年4月,博鳌亚洲论坛有4场分论坛应用了腾讯AI同传,结果腾讯AI同传现了单词乱码、连续出现同一个单词的卡机状况。更为严重的是,腾讯AI同传将“一带一路”变着花样翻译成了好几种不同的说法,因此只能紧急应召同传译员来救场。

AI机器翻译实际水平如何?

无论是科大讯飞的AI同传造假事件,还是搜狗、腾讯的机器翻译事故都让人困惑,一直闹得火热的AI同传停留在了什么层次?距离同传人员“被下岗”还有多久?

从目前AI同传在大会上的表现来看,同传人员目前依然是同传领域的主力军,还要频频为出意外的AI君救场。在同声传译领域,AI需要正视这些事情。

AI机器翻译的准确率有多高?

评价AI机器翻译内容质量的好坏,国际上有一些方法,除了人工评测,也有多种自动评测方法有,其中,IBM的watson研究中心在2002年提出的BLEU方法被业界较为广泛认可。

参考《机器翻译及其评测技术简介》的说法,BLEU方法就是比较候选译文(candidate)与参考译文(reference)中相同的片段数量。其思想是用翻译结果中连续出现的N元组( n个单词/字或标点)与参考译文中出现的N元组进行比较,计算完全匹配的N元组的个数与翻译结果中N元组的总个数的比例。

然后,作者使用一个测试语料,让2个翻译专家和3个机器去翻译,也就是它允许一个原文有多个参考译文。但请记住,对于机器翻译的准确率没有一个绝对值,而是以“翻译错误降低率”来衡量自身技术的成熟度。

不过对于AI而言,如果要提高其准确率,首先得保证它你能“听得懂”和“听得清”。

机器翻译技术被检验过了吗?

之前搜狗机器翻译之所以被嘲笑,另一个原因就是未经验证,这其中最大的BUG是技术还未获得足够量级的测评,也就是技术的成熟度未经市场验证。比如有媒体就直言“从始至终,搜狗实时机翻的用户只有王小川一人。”

所以“光说不练假把式”,技术不能被钉在墙上当作菩萨拜,AI要真正取代人工,做同声传译、写作等人类高复杂的工作,就得先应用到实战中来。

机器缺失的情感因素怎么补?

语言是门艺术,是活的,是有起伏有感情的,只有放在一个大的语境下面才可能被完全准确理解。即便是同一句话,放在不同语境下表达的也是不同的感情色彩,对应的翻译也就不同。

也许,AI机器能达到95%准确的翻译,但是那剩下5%的感情,又该如何表达出来呢?这5%的情感就可能造成一定的理解障碍甚至是误解。

要让这些机器表达出这些情感因素,最基础的前提是AI需要提高语境理解能力。目前智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。

但智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,所以在识别感情色彩方面,还需加强。

口语化能特殊处理吗?

前面说,要提高AI翻译的准确率,需要保证能“听得懂”和“听得清”,这不仅要求AI能准确判断出被翻译对象(如演讲者)的语音、停顿,并在极短时间内进行“语音断句”,还需要在涉及一些模糊音时能够根据“上下文”进行及时调整,更棘手的是要让A能灵活处理一些特殊情况,比如口语。

要应付这些复杂情况,AI需要大量补充口语化语料,并且需要改变直译方式,让机器翻译真正智能起来。

事实上,同声传译需要有极高的资格才可以担任。在同声传译中,译员需要遵循顺句驱动、随时调整、适度超前、信息重组、合理简约、信息等值等基本原则,此外,由于演讲者讲话速度普遍较快,演讲中可能掺杂各地口音和方言,同传译员还需要调动自己的一切知识储备和经验全力以赴。

看来用机器取代人类同传的高调口号在短期内还只是空谈。神经机器翻译系统目前所能做的只是优化翻译结果,并不是万能药,将其作为黑科技大书特书,过分拔高人们对于机器翻译实际水平的期待,实际上并不可取。

不仅仅是科大讯飞、腾讯、搜狗,所有的人工智能应用和公司都应该正视人类和机器真正的差别,这不仅仅是一场技术谁优谁劣的较量,更是一场如何理解人和人的需求的对垒。如果科技公司给予人们太多不切实际的幻想,那么无形中也将透支着公众对于AI的兴趣。


【科技云报道原创】

转载请注明“科技云报道”并附本文链接

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技云报到 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
科大讯飞正式回应“同传造假”,称机器翻译尚无法达到同传效果
9月21日晚间8点,针对白天“同传造假”的新闻,科大讯飞紧急召开了电话会议给出了正式回应,并向媒体发布了《关于所谓的“同传造假”,我们有话要说》的声明。
镁客网
2019/11/12
6910
科大讯飞正式回应“同传造假”,称机器翻译尚无法达到同传效果
AI同传效果媲美人类,百度翻译出品全球首个上下文感知机器同传模型
百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音的机器同传系统:DuTongChuan(度同传)。
量子位
2019/08/19
7460
AI同传效果媲美人类,百度翻译出品全球首个上下文感知机器同传模型
博鳌AI同传遭热议!腾讯翻译君负责人李学朝、讯飞胡郁有话说
---- 【新智元导读】首次正式亮相国际级会议的AI同传,腾讯翻译君不仅仅代表了自己,还代表了整个AI智能翻译业界。近几天AI同传遭遇社会嘲笑,对此,腾讯翻译君负责人李学朝,讯飞胡郁有话说。 这几天又有一个AI火了。 没错,我们说的是在2018年博鳌论坛担任同声传译的腾讯同传。 这个事件让人想起了2017年“3·15晚会”打假人脸识别,让人脸识别技术一夜走红,也让众多人脸识别公司躺枪。一年后的今天,公众对人脸识别的接受度已经明显提升,技术在不断发展,人脸识别的商业化应用在不断产生。 当时,人脸识别公司云
新智元
2018/04/17
1.2K0
博鳌AI同传遭热议!腾讯翻译君负责人李学朝、讯飞胡郁有话说
搜狗首创语境引擎:AI同传最强进化,PPT翻译正确率猛升40%!
“全球95%的信息是用英文所写的,100%的国际商贸活动是用英文的,因此如何帮助中国人跟外国人进行更好的交流,这变成了一个重大的技术课题。”
新智元
2019/12/30
7170
腾讯AI翻译首次亮相博鳌论坛,只证明了一件事……
不管是技术层面,还是训练数据,当前的AI翻译距离取代人类还有好一段距离。 “一带一路”=“一条腰带和一条路”? 4月9日下午,“腾讯同传”在博鳌论坛现场上闹了一个大乌龙。 这是博鳌论坛首次采用AI同声传译技术,作为头一份的“腾讯同传”竟然还出现这种离谱的翻译错误。 另外,从网上一些上传的现场翻译图片来看,一些错误简直令人不忍直视: 按照官方所称,上面的错误简称“大面积单词无意义重复、大小写及字符混乱”。 首次亮相结果闹乌龙 说好的取代人类呢? 在博鳌论坛现场,基于自研的NMT(神经网络机器翻译)、语音识别
镁客网
2018/05/29
6470
神经网络机器翻译技术及应用(下)
前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用?
用户1386409
2019/06/10
9880
神经网络机器翻译技术及应用(下)
对话搜狗口语机器翻译团队:全球夺冠只为验证技术,更看重落地商用
在今年的国际顶级口语机器翻译大赛IWSLT上,搜狗战胜科大讯飞、阿里等众多国内外好手,一举夺魁。
量子位
2018/12/07
5730
对话搜狗口语机器翻译团队:全球夺冠只为验证技术,更看重落地商用
学界 | 百度机器同传系统新突破:可预测译文、延迟可控
百度的 STACL(Simultaneous Translation with Anticipation and Controllable Latency)是首个拥有预判能力和可控延迟的机器同传翻译系统。它是一个能够进行高质量双语同传的自动系统,代表了自然语言处理方向的重大突破。这一技术的挑战很大一部分在于源语和目标语之间的次序差异以及现实世界同传应用的延迟需求。
机器之心
2018/11/23
6720
从机器翻译来看中国最酷AI挑战赛:赛手体验放第一位
李飞飞在整个学术界和工业界的重心都放在如何做出更好的算法时,她不顾一切质疑和阻挠创建了ImageNet数据集,至此世人再难复制ImageNet创立过的辉煌。同样,参加了第一届ImageNet挑战赛的竞赛优胜者,现在都出任了百度、谷歌和华为等公司高管(如林元庆,余凯,张潼)。还有些在获奖算法基础上创立公司,如马修•泽勒(Matthew Zeiler)2013年赢得ImageNet挑战赛后,创办了Clarifai公司,之后获得了4000万美元风险投资。 2014年的ImageNet挑战赛冠军中的两位牛津大学研究
AI科技评论
2018/03/14
1.1K0
从机器翻译来看中国最酷AI挑战赛:赛手体验放第一位
科大讯飞刘庆峰再谈“人机耦合”:耦合才是AI真落地
科大讯飞今天在合肥举办1024开发者节,上万名开发者来到合肥奥体中心,一起见证中国语音技术领域最大企业的新动态。
新智元
2018/11/22
7320
AI同传PK人类同传,这或许是两个职业
今年的博鳌亚洲论坛上,第一次出现了AI同传。值得注意的是,这是博鳌论坛创办17年首次采用人工智能同传技术。然而,在如此重要的场合,现场配备的腾讯AI同传却掉了链子。词汇翻译不准确、重复、短语误用等“乌龙”引来各方“嘲笑”。
用户2908108
2019/08/20
7770
AI同传PK人类同传,这或许是两个职业
一周简报|2016科大讯飞年度发布会:开放全平台语音SDK,拥抱人工智能
网易七鱼:跨屏交流、多平台服务,我们只想做人工智能云客服;云智慧携手海航云,共建APM新生态;2016科大讯飞年度发布会:开放全平台语音SDK,拥抱人工智能;API管理平台Rapid获350万美元融资
BestSDK
2018/02/27
8900
一周简报|2016科大讯飞年度发布会:开放全平台语音SDK,拥抱人工智能
AI词典笔赛跑下,科大讯飞的技术流超车
日前科大讯飞2020年报正式发布,显示智慧教育业务营收取得70.68%的同比高增长。
刘旷
2021/04/23
3590
AI词典笔赛跑下,科大讯飞的技术流超车
直播预告 | 机器翻译是否能替代人工翻译?从前世今生说起
在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。
机器之心
2021/10/26
5570
直播预告 | 机器翻译是否能替代人工翻译?从前世今生说起
2018年AI圈八大造假事件:罗生门此起彼伏,比娱乐圈精彩
英伟达的新一代假脸生成器,高清人脸大图毫无破绽;Google的“打Call”机器人真假难辨,一句“嗯哼”全场笑翻;OpenAI的AI打DOTA2血虐人类,拼尽全力也难保周全。
量子位
2019/04/24
6180
2018年AI圈八大造假事件:罗生门此起彼伏,比娱乐圈精彩
百度新突破:AI同声传译系统STACL,可预测,低延迟
百度开发了新的AI系统,名为同声传译和预期与可控延迟(STACL),百度声称这代表了自然语言处理的重大突破。
AiTechYun
2018/11/22
1.2K0
科大讯飞发布第三季度业绩报告:扣非净利润同比减少近9成
科大讯飞10月23日晚发布2018年第三季度业绩显示:前三季度,科大讯飞营收为52.8亿元,同比增长56%;归属上市公司股东净利润2.19亿元,同比增长29.94%;归属上市公司股东扣除非经常性损益的净利润2462.7万元,同比减少79.75%。
量子位
2018/11/22
5850
拒绝boring,炫酷潮AI竞赛来袭!
韩梅梅 听说,上周AI界发生了一件大事? 李雷 对,李开复、王小川、张一鸣组了一个AI Challenger全球AI挑战赛,吸引了65个国家,1万多AI界武林高手参与。 韩梅梅 来打架了? 李雷 人家是竞技,不是打架。在视觉和翻译两大领域,分出人体骨骼关键点检测、图像中文描述、场景分类、英中机器文本翻译和英中机器同声传译五个赛道,展开激烈较量。 韩梅梅 听不懂。 李雷 ok,给你科普下,先来看一段热舞视频。 看透你,管你是哆啦A梦还是恐怖分子 人体骨骼关键点检测 人体骨骼关键点检测?乍一听,还以为和医学有关
企鹅号小编
2018/01/17
9880
拒绝boring,炫酷潮AI竞赛来袭!
2017腾讯媒体+峰会,三大AI鼎力相助
2017年11月16日,由腾讯主办的2017腾讯媒体+峰会在上海召开。这是腾讯集团COO任宇昕第一次参加媒体峰会,“半年以前,我基本上是一个纯粹的媒体读者,在过去的半年时间之内,我基本上算是一个媒体的从业者。所以我正好可以分别从媒体读者和媒体从业者,这两个不同的角度,来分享一下,我对当前媒体行业变化的一些看法。”就在他分享半年心路历程的同时,腾讯微信智聆、腾讯翻译君以及机器人写作工具Dreamwriter三个AI产品向现场观众实时输出内容和报道,并推送了出去。
曾响铃
2018/08/21
2.7K0
2017腾讯媒体+峰会,三大AI鼎力相助
腾讯信息安全部征战世界机器翻译大赛获不俗战绩
北京时间5月22日下午4点,在刚结束的世界机器翻译大赛(WMT)中,信安代表队(由信息安全部北京基础研究组bojiehu(胡博杰)、ambyera(阿敏巴雅尔)、springhuang(黄申)三人组成)经过激烈的鏖战,最终获得汉英翻译 BLEU (Bilingual Evaluation Understudy) 打分指标第2名,BLUE-cased 打分指标第4名的好成绩,在另一项英汉翻译上,也取得了第7名的成绩。   Fig.1   队名为TencentFmRD, 译为“腾讯基础研发”,详见比赛官方网站 
TEG云端专业号
2018/06/12
2.2K0
推荐阅读
科大讯飞正式回应“同传造假”,称机器翻译尚无法达到同传效果
6910
AI同传效果媲美人类,百度翻译出品全球首个上下文感知机器同传模型
7460
博鳌AI同传遭热议!腾讯翻译君负责人李学朝、讯飞胡郁有话说
1.2K0
搜狗首创语境引擎:AI同传最强进化,PPT翻译正确率猛升40%!
7170
腾讯AI翻译首次亮相博鳌论坛,只证明了一件事……
6470
神经网络机器翻译技术及应用(下)
9880
对话搜狗口语机器翻译团队:全球夺冠只为验证技术,更看重落地商用
5730
学界 | 百度机器同传系统新突破:可预测译文、延迟可控
6720
从机器翻译来看中国最酷AI挑战赛:赛手体验放第一位
1.1K0
科大讯飞刘庆峰再谈“人机耦合”:耦合才是AI真落地
7320
AI同传PK人类同传,这或许是两个职业
7770
一周简报|2016科大讯飞年度发布会:开放全平台语音SDK,拥抱人工智能
8900
AI词典笔赛跑下,科大讯飞的技术流超车
3590
直播预告 | 机器翻译是否能替代人工翻译?从前世今生说起
5570
2018年AI圈八大造假事件:罗生门此起彼伏,比娱乐圈精彩
6180
百度新突破:AI同声传译系统STACL,可预测,低延迟
1.2K0
科大讯飞发布第三季度业绩报告:扣非净利润同比减少近9成
5850
拒绝boring,炫酷潮AI竞赛来袭!
9880
2017腾讯媒体+峰会,三大AI鼎力相助
2.7K0
腾讯信息安全部征战世界机器翻译大赛获不俗战绩
2.2K0
相关推荐
科大讯飞正式回应“同传造假”,称机器翻译尚无法达到同传效果
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档