翻译评价研究新课题浅谈
秦颖/文
语言是人类活动中最复杂的一项活动。我们每个人都能运用母语交流思想,互通信息,学习技能。和语言信息处理打交道了十几年,我深深地感悟到,其实语言是时空中的一个“活物”。语言是立体的,随时间的变化而变化着。说它是立体的,指语言是有声的,声音的节奏、声调、强调等能表达不同的意思;而说话的时候,辅以不同的眼神、表情、动作等,表达的思想又会有所不同。语言随时间变化的特点更是不言而喻,不断有新的词汇和表达方式加入进来,也有不再使用的内容。人类的语言系统似乎有着无限的生成能力。
翻译是打破不同语言之间交流壁垒的桥梁。随着地球变为“地球村”,人们对翻译的需求量也在急剧增长。借助工具实现更自由、便捷、廉价的翻译是计算机、语言学等领域的研究人员长期努力的目标。机器翻译的研究经历了跌宕起伏的几十年,近年来,在人工智能发展的大潮中,机器翻译作为突出体现智能的重量级角色也有了长足的进步,而进步的结论是源自评测的结果。因此,机器翻译的发展对翻译评价研究提出了大量新的课题,体现在:
一、海量的翻译评价需求
机器翻译的速度远高于人类译员。这些在很短时间内产出的译文是否可信、可用?目前采取的一般方法是人工评判机器译文的准确性和可读性。人工评价的方法显然不能满足不断产出的大量机器译文评价的需求。
二、评价的效率和准确率的需求
机器翻译的研发需要即时的评价结果,为此,高效率的自动评价研究应运而生。虽然在翻译质量自动评价领域呈现出百花齐放的现象,但是目前仍未达到替代人工评价的阶段。评价的准确率不高,主要原因是机械匹配,尚未真正深入到语义的层面进行评价。
三、深层次的评价需求
深层次评价是要发现译文中存在的问题或错误,寻找错误的原因和规律。深层的质量评价才能更有针对性地改进翻译系统的性能。实现自动深度评价在目前看来也是个极具挑战性的问题,等同于机器翻译的研究。翻译和翻译质量评价是密不可分的两个方面,如影随形,相互促进和影响。目前翻译评价面临的主要问题有:人工的评价标准不一致,评价体系尚未建立,导致评价的内部一致性和外部一致性都较低;自动评价算法基本局限在语言形式的浅层比对上,要实现真正意义的语义等价的翻译评价十分困难;深层次的翻译错误的发现研究也没有全面展开,而且缺乏用于训练机器深层评价的标注语料。这些挑战正是《翻译质量评价的标准与自动评价方法研究》一书要阐述的几个核心问题。
本人在自然语言处理领域坚持了十多年的研究,尤其对跨语言信息处理进行了多方的思考和探索,现将拙作呈现给各位同行和对该领域感兴趣的读者,既有一些成就感,也有些许的惶恐。由于本人水平有限,以及机器翻译和评测领域的快速发展,本研究还有很多不足之处,很多问题都是开放性的,值得进一步深入探索,欢迎同行和广大读者交流指正。
秦颖
北京外国语大学
*本文摘自《翻译质量评价的标准与自动评价方法研究》一书前言。
领取专属 10元无门槛券
私享最新 技术干货