首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能驱动机器翻译更进一步,像Star Trek里的通用翻译器不再是梦想

不少人要了解外文文章,常常倚赖Google翻译等机器翻译服务。但如果要查阅的语言不是主流语言,没有大量训练材料,现行的机器翻译就抓不太到大致意思。

如今两篇新论文可能是小语言的救星,不必靠大量有双语作品存在的文本训练,也不需要人工监督,不用两种语言对译的文本,AI就可以学会对译两种语言。

科幻作品如Star Trek的通用翻译器,成为消弭不同种族沟通障碍的利器。两个研究团队-西班牙巴斯克大学,以及美国卡内基美隆大学,提出的论文不用两种语言都有平行的字词库,甚至只有单一语言也行。

因为语言里的字词用类似方式组成群组,像是桌子和椅子,透过非监督式机器学习,AI猜出在另一种语言的对应字词,再用猜出的结果,分析句子结构,最后翻译到其他语言,再翻译回去,AI评估机器翻译的结果,学会语言的结构。

不少人运用的Google翻译,则可以服务103种语言间的对译,包括世界十大语言如中文、西班牙文、印地语、孟加拉语等。Google运用有平行字词库的语言,包括有大量翻译文本存在的语言,用监督式学习让AI学习两种语言间如何翻译转换。

尽管Google翻译有时候会出现相当好笑的结果,经过大量训练时间及文本,往往翻译效果会越来越好,但不是每一种语言都有足够的文本能够运用,学者找出用单一语言库,甚至用非监督式学习就能得到不错的成果,是机器翻译领域相当大的突破。

研究团队成员的巴思克大学Mikel Artetxe说:“想象一下给一个人很多本中文书及很多本阿拉伯文书,没有一本是讲重覆的内容,这个人得学会如何从中文翻译成阿拉波文。上述说法看来不可能,对不对?但我们用电脑做到了!”

机器翻译的权威,Microsoft的AI专家Di He的研究影响了上述两篇论文,则评论说:“很讶异计算机能在不需要人类监督的状况下完成翻译工作。”

两篇论文将投稿给International Conference on Learning Representations大会,并且已经被接受,不过仍得等待经过同侪审查的程序,在正式发表时,论文内容可能有些微调整。

两篇论文的研究者都指出,他们的方法仍在初期阶段,翻译的正确率仍达不到Google水平,还不知道最后会走到什么程度,加上彼此的方法能增进翻译效果。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171213G0MHWM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券