源Rankred译张柳芳
机器翻译的概念可以追溯到几十年前。首先,它只是一个基于规则的机器翻译系统。然后在20世纪80年代,研究人员开发了统计机器翻译。二十一世纪,机器翻译技术的飞跃将来自机器学习和神经网络技术。
在过去的几年中,我们看到一些翻译公司的重大发展,这些翻译公司正在使用这些人工智能技术来提供更好的机器翻译。一些最令人印象深刻的例子都来自像谷歌的神经机器翻译系统(GNMT)和微软的神经翻译器。
什么是神经机器翻译?
机器翻译已经广泛使用,而且已经有好几年了。您可以在许多流行的应用程序中找到机器翻译系统,并且有在线服务提供机器翻译服务。然而,现有的翻译服务和开发中的使用神经网络系统之间存在着显著的差异。
现在你能发现的大多数系统都是统计机器翻译系统。他们使用算法和统计模型对短语的正确翻译作出最好的猜测。它用于短语的表现很好,但要求翻译较长的样本时就有局限,像为电子学习翻译整个数字教科书。结果可能是一个非常准确的解释来翻译,也可能完全是胡扯。
神经机器翻译代表了与使用统计机器翻译的旧系统截然不同的方法。神经网络使用NMT系统来训练并优化翻译服务。
这些系统使用深度学习来分析大量的人工翻译。通过分析这个庞大的数据集,它可以解释整个句子,理解上下文和不同的变化,并利用语言的精妙之处。最终使得机器翻译系统更流畅自然。
神经网络如何工作?
提供这种学习能力的机器的关键在于神经网络。这是一种计算技术,它被设计成模仿人脑的运作方式。在大脑中,神经通路是在我们学习的过程中形成的。如果这个途径有用且有益,它就会变得更强。如果它不能提供正确的结果,它就会变弱。
神经网络的思想是模拟大脑中神经通路的相互关联性。通过这种设计,计算机可以学习、识别模式并做出类似于人脑的决策。
人工神经网络模拟这种结构,有几十到几百万个人工神经元,称为单元。这些单位是层层排列的。一方面,您输入的单元是为了接收信息而设计的。在相反的方面,您有输出单元,表示对所学信息的响应。
在输入单元和输出单元之间,有隐藏单元。这些层构成了大多数神经网络,它们也用于形成大多数连接。
给定的一个神经网络,神经网络中每个连接的权重表明连接的两个单位之间的强度。一个正的的权重可以连接excites其他单位或连接suppresses负权重行动的其他单位。权重越大,在一个单元中有过其他连接的影响越大。
神经网络通过比较产生的输出和期望输出来学习。信息被输入到系统的输入端。然后触发隐藏单元中的连接。这将导致与输出端的连接。然后将网络实际产生的输出与期望的输出进行比较。然后根据产生的输出和期望输出之间的差异修改权重。
相比基于规则和统计系统,机器翻译中神经网络的结构使系统更自适应,能处理更多更复杂的模型。它也可以根据经验自我学习。如果它提供了不正确的输出,它能从错误中吸取教训,并作出调整,以便下次更有效地执行任务。
神经网络对于机器翻译意味着什么?
机器翻译仍然是一个新的神经网络技术。即使是在它的早期阶段,它已经使用优越的统计机器翻译系统得出最好的结果。也就是说,在神经机器翻译能胜任有竞争技能的人力翻译之前我们还有很长的路要走。
神经机器翻译的进步不会来只自一家公司,这将是来自不同组织和世界各地的研究人员的几项进步的结果。 随着技术的发展,NMT将成为人类翻译的重要工具。 随着越来越复杂的翻译需求,专业人士将使用这些系统在更短的时间内提供准确的翻译,这将有助于他们满足日益增长的需求。
-END-
译者 张柳芳
毕业于重庆邮电大学,电子信息工程专业。关注大数据、数据挖掘、人工智能等前沿技术。热爱生活,热爱思考。
了解如何加入我们
领取专属 10元无门槛券
私享最新 技术干货