编组
控制台用户中心

澜舟科技机器翻译新进展:汉语与世界15 种主要语言的翻译超越谷歌

2022-10-19

本文介绍澜舟科技多语言机器翻译技术最新进展。

本文将首先概述多语言翻译基本方法。在此基础上,介绍澜舟科技在多语言机器翻译的最新进展。我们与传神语联网紧密合作,构建了以汉语为中心的 15 种语言的互译系统,已在澜舟 SaaS 平台上发布。经过国际公开评测集上的自动评测和专业译员的人工测评,澜舟科技在“汉语与 15 种语言”的机器翻译上达到了世界领先水平。在与汉语互译的 30 个翻译方向上,澜舟多语言机器翻译引擎在自动评测指标上有 28 个超过了谷歌翻译的评分或与谷歌水平相当。

1、多语言机器翻译进展#

近年来,很多国际自然语言处理研究机构在机器翻译方向上持续发力,希望构建一个可以连接世界上任何语言的翻译系统。传统的技术一般为每种语言对单独构建翻译模型,实现多种语言间的翻译需要更多资源,模型部署和维护成本高昂。最近的研究路线主要采用多语言翻译技术,即利用一个神经网络模型实现多种语言间的互译,以覆盖更多语言和改进翻译质量,如 Meta AI 提出的包含 200 种语言的大规模多语言翻译模型。相比单语言模型,采用多语言模型主要有以下几方面的优势:

  • 改进低资源语言翻译质量:通过多语言联合学习一个神经网络模型,借助富资源语言向低资源语言的知识正向迁移,可以有效改善低资源语言间的翻译质量。
  • 降低模型部署和维护成本:由于只需要部署一个模型,就可以实现多种语言间的互译,显著降低了实现多语言互译能力的部署和维护成本。
  • 有效整合多种学习资源:多语言翻译模型可以利用单语数据以及多语言预训练模型等资源,从而提升模型泛化能力和鲁棒性。

多语言翻译模型从提出到现在经过了许多改进,包括模型结构、训练优化方式、数据构建等。但由于世界上语言数量众多,且面临着很多语言间缺少训练数据的现状,多语言机器翻译的研究和落地仍面临很多挑战。

  • 低资源过拟合问题:基于数据量的采样方法没有考虑到数据质量等因素的影响,很容易导致低资源语言对的过拟合。
  • 跨语言知识迁移较差:受语言特点的影响,模型跨语言知识迁移能力较弱,同时,一些语言之间没有平行训练数据,其模型训练时只利用一种或某几种语言为中心的数据,导致一些语言之间(低资源或零样本方向)的翻译质量改进较小。

针对低资源过拟合问题,一种有效的方法是通过动态学习率使得所有语言的损失达到整体较低的区间,从而平衡模型在所有语言上的训练步调。研究人员提出了基于曲率感知的多语言神经机器翻译模型训练方法。对多任务训练的损失进行分析,表明语言之间的相互干扰主要来自于局部曲率的影响,通过最小化加权联合曲率计算动态权重,调整不同语言对在不同训练阶段的学习程度,从而使模型能够得到充分训练的同时低资源语言对不至于过拟合。这类方法对多语言参数优化进行了改进,可以更好地训练多语言翻译模型在众多翻译方向上达到较好性能。

针对跨语言知识迁移较差问题,一种有效的方法是基于对比学习的模型训练和词典增强的多语言训练数据构建。对双语平行句对使用对比学习,提升编码器表示空间的跨语言一致性,使用多语言词典对双语数据和单语数据进行随机替换提升跨语言词汇表示的一致性。最终,通过改进共享编码器对多语言的表示能力,可以更好实现跨语言的知识迁移。

除了对翻译模型本身的改进之外,随着大规模预训练语言模型的发展,如 mBert、MBart、mT5 等预训练语言模型,其利用大规模单语数据进行自监督训练,模型具有强的文本理解与生成能力。同时,通过整合多语言数据联合训练,模型在下游任务上具有较好的泛化能力。借力多语言预训练语言模型,当微调的双语数据量较少时,这类模型往往性能更优,从而有利于低资源翻译和零资源翻译。

整体来看,目前多语言技术取得了很好的进展,但现有多语言翻译模型主要以英语为中心构建,没有充分利用其他语言方向的双语数据,同时很多语言和汉语间语言资源稀缺,导致以汉语为中心的翻译质量还有很大改进空间。

2、澜舟多语言机器翻译实践#

在充分借鉴已有研究工作的基础上,澜舟科技与传神语联网紧密合作,构建了多语言翻译模型。特别地,针对以汉语为中心的语言进行了专门改进,对汉语与英语、阿拉伯语、法语、德语、西班牙语、希伯来语、印尼语、意大利语、日语、韩语、葡萄牙语、罗马尼亚语、俄语、泰语、越南语 15 种语言的互译进行了重点改进,目前已经在澜舟 SaaS 平台发布了以汉语为中心的多语言翻译引擎。

澜舟多语言机器翻译模型

经过国际公开评测集上的自动评测和专业译员的人工测评,澜舟科技在“汉语与十五种语言”的机器翻译上已达到了世界领先水平。值得一提的是,在与汉语互译的 30 个翻译方向上,澜舟多语言机器翻译引擎在自动评测指标上有 28 个超过了谷歌翻译的评分或与谷歌水平相当。评测采用机器翻译领域标准的 BLEU(Bilingual Evaluation Understudy)指标作为计算标准,BLEU 值通过比较机器翻译的结果与参考译文的重合度进行打分,得分越高表明机器翻译结果和人的翻译结果越接近,即翻译质量越高。

澜舟多语言机器翻译-BLEU自动评测

为了更好分析不同引擎的翻译结果,我们分别挑选了一些高资源语种(如德语、俄语)、低资源语种(如印尼语),进一步进行人工评测。评测由专业人工翻译平台采用多文档众包盲评方法,主要从语义忠实度、语句表达流畅度、语法正确性、是否符合阅读习惯等几个方面进行评测,评分区间为 0-5 分。可以看到,目前澜舟多语言机器翻译引擎在所评测的几种语言上相较谷歌翻译整体取得了较好的人工评测得分。

澜舟多语言机器翻译-人工评测

3、总结与展望#

本文概括了多语言神经机器翻译的研究,同时分享了澜舟科技在多语言翻译模型方面的最新进展。在与汉语互译的 30 个翻译方向上,澜舟多语言机器翻译引擎在自动评测指标上有 28 个超过了谷歌翻译的评分或与谷歌水平相当。

我们已发布澜舟机器翻译 SaaS 平台,大家可以通过 API 接口便捷地将多语言机器翻译能力引入到具体业务场景,同时也期待使用者提出反馈,以便我们进一步改进。

产品服务

商务合作邮箱

bd@langboat.com

ewm

公司地址

北京市海淀区北四环西路(街)52 号方正国际大厦 16 层 1603


gongan京公网安备 11010802035393号京ICP备 2021021087号

经营许可证编号:合字 B2-20220333

大模型备案号:Beijing-MengZiGPT-20231205


合作:

bd@langboat.com

地址:

北京市海淀区北四环西路(街)52 号方正国际大厦 16 层 1603

公众号:

ewm

support
business