机器翻译与人工翻译之争

 行业资讯     |      2019-08-14 23:08

机器翻译是指利用计算机把一种自然语言翻译成另一种自然语言的技术,是一门结合了语言学和计算机科学等学科的交叉学科。认知智能是人工智能的最高阶段,自然语言理解是认知智能领域的“皇冠”。机器翻译这一自然语言处理领域最具挑战性的研究任务,则是自然语言处理领域“皇冠上的明珠”。近年来,机器翻译发展十分迅猛,但对于机器翻译与人工翻译孰优孰劣、机器翻译能否取代人工翻译,一直存在争议。正规翻译公司机器翻译之父韦弗曾提出“翻译即解码”的结构主义观点,但是,数年之后,他自己又推翻了这一论断,表示“机器成不了普希金,机器翻译永远都无法传达出语言本身的优雅与格调”。

机器翻译发展迅速

语言能力是区分人类和动物的重要特征之一,是人类有效交流的保证。用机器来进行语言翻译的想法,最早可追溯到古希腊时期。现代意义上的“机器翻译”一词,由古图拉特(Couturat)和洛(Leau)1903年在《通用语言的历史》一书中最早提出。1949年,韦弗发表了具有广泛影响力的名为《翻译》的备忘录,正式提出了机器翻译的思想。直到2006年Hinton提出深度学习技术,才为实现这一目标提供了更好的解决途径。目前的前沿技术是基于人工神经网络的机器学习,其技术核心是一个拥有海量节点(神经元)的深度神经网络,可以自动地从语料库学习翻译知识。一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。

2015年,蒙特利尔大学引入注意力机制,使得神经机器翻译达到实用阶段。此后,神经机器翻译不断取得进展。2016年,谷歌GNMT发布,该系统可模仿人脑的神经思考模式,翻译出与人工翻译相媲美的译文。同年,微软在Switchboard对话语义识别达到人类水平,讯飞上线NMT系统,神经机器翻译开始被大规模应用。科学杂志Nature梳理了2016年科技领域的十大突破,排在首位的就是人工智能,其中提及人工智能的机器翻译使错误减少了约60%。随后,Facebook的人工智能研究团队开发了一种新的神经机器翻译算法,在三种机器翻译任务上得分高于所有同类系统。2017 年,微软在斯坦福问答数据集 SQuAD 上达到人类水平。机器翻译的发展速度远远超出人们的想象,但是对于机器翻译是否能够真正完全代替人工翻译,学界仍旧争论不休。

机器翻译取代人工翻译

目前而言,一部分专家认为机器翻译很快会达到人工翻译水平,在不远的将来会完全取代人工翻译。2010年,谷歌机器翻译专家欧赫认为文本机器翻译是合理有效的,真正的挑战只在语音识别方面。他提出,未来几年即有可能实现手机端语音到语音的自动翻译。2019年2月《卫报》刊登《机器翻译的时代是否已经到来》一文,美国韦弗利实验室(Waverly Labs)的安德鲁·奥乔亚表示“在未来十到十二年内,机器翻译技术可与人工翻译相媲美,甚至超过人工翻译的水平”。

专家们对于机器翻译的信心来自最新一代的翻译技术——神经网络翻译。神经网络翻译打造的机器翻译系统,采用了一系列新的学习手段来模拟人工翻译。首先,利用人工智能任务的天然对称性进行对偶学习。当训练集中的一个中文句子被翻译成英文后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的反馈信息,对机器翻译模型进行修正。其次,利用推敲网络,模拟人们写作时不断推敲、修改的过程。这样,通过多轮翻译,不断地检查、完善翻译的结果,使翻译的质量得到大幅提升。再次,采用联合训练的方法迭代改进翻译系统。用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。最后,采用一致性规范让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。这一系列技术有效模仿了人工翻译的过程,极大提升了机器翻译的整体质量。

除此之外,机器翻译相关学科之间的互动更加频繁,合作更加紧密。翻译界和技术界都呈现出了更大的包容性,相关人士达成一定共识,即过去那种把语言学家排除在外,仅依赖技术界,埋头做数据、分析开发系统的做法是不可取的。在语言学和翻译学领域,越来越多的人开始关注机器翻译,对技术应用探索也不再一味抵触,开始从用户和市场需求的角度来客观看待不同层级和不同受众的语言服务,计算机辅助翻译在专业翻译领域发挥着越来越重要的作用。

机器翻译技术仍备受质疑

对于现有的机器翻译技术,很多学者也表示质疑。一方面,他们认为机器翻译的广泛适用性还有待考察。尽管机器翻译在某些测试中正确率较高,而且在某些领域接近或超过人工译员,但是这些测试只是针对特定范围的文本,要想达到测试水平,必须满足对于源语言和环境的苛刻要求。在笔译方面,冯志伟在《机器翻译研究》中表示,目前的机器翻译系统对普通文本的翻译在可读性和准确性方面离人们的实际需求还有相当大的距离。机器翻译系统对普通文本的翻译,通常需要大量的译后审校工作才能使译文达到出版的要求,所花费的时间和费用往往会超过纯人工翻译。在口译方面,中国科学院自动化研究所宗成庆在《机器翻译的梦想与现实》中指出,在日常口语对话中,目前口语机器翻译仅能对资源较为充分的语言(如英汉、日汉等),在说话场景不是非常复杂、口音基本标准、语速基本正常、使用词汇和句型不是非常生僻的情况下,可基本满足正常交流的需要。

另一方面,针对机器翻译的译文整体水平,目前还没有建立起专业合理的评价体系。目前使用较多的是BLEU和METEOR标准,BLEU评测由IBM公司于2002年提出,认为翻译系统的译文越接近人工翻译,翻译的质量就越高。该评测通过分析候选译文和参考译文中n元组共同出现的程度来定义系统译文与参考译文之间的相似度,缺点在于没有考虑翻译的召回率。METEOR标准于2004年由Lavir提出。研究表明,召回率基础上的标准相比于那些单纯基于精度的标准(如BLEU),其结果和人工判断的结果有较高相关性。微软全球技术院院士黄学东表示,“当机器翻译质量很差的时候,使用 BLEU 评分还行,但是当机器翻译质量提高以后,就需要靠人类来评价”。但人工评价很难保持统一的标准,所以有些专家直接否定了现有的评价体系以及将译文水平量化的做法。美国印第安纳大学侯世达教授在《论谷歌翻译的浅薄》一文中表示,“这是一种对无法量化的事物进行量化的伪科学,用看上去很科学的图表去证明翻译质量,不过是对科学方法的滥用而已”。

机器翻译不可能代替人工翻译

神经网络翻译技术的应用带动了机器翻译的飞速发展,使得一部分学者对此非常乐观,但也有许多学者对此提出了批评。语言学和翻译学界的很多学者认为目前机器翻译的发展有限,“信”尚且未达成,更遑论取代人工翻译。多位学者表示人在翻译中的主动性和创造性是机器无法比拟的。如美国加州大学伯克利分校语言学系教授乔治·莱考夫与美国俄勒冈大学哲学系教授马克·约翰森在《我们赖以生存的隐喻》一书中提出,语言在本质上更多是隐喻性而非事实性的。人类语言习得常基于对抽象的、具有比喻意义的概念的学习,向机器解释这些概念非常困难,文学翻译更是机器翻译难以逾越的鸿沟。胡壮麟在《语言学教程》中提出,仅靠文本分析、忽略现实、没有“人”这一主体参与的“机器翻译”,是站不住脚的。

专家们认为测试中机器翻译技术的进步带来的译文虽有改善,但不论文本翻译还是口译,机器翻译的质量远没有达到令人满意的水平。尽管机器翻译已迭代至神经网络翻译,宗成庆研究员在《机器翻译的梦想与现实》中指出,目前的翻译系统“难以准确处理篇章范围内的指代问题,无法准确区分由于细微文字或句法差异造成的句子语义反转,无法从译员译后编辑过程中自动学习翻译知识。在复杂长句翻译中大量出现漏翻、错翻和次序颠倒;面对原文的噪声束手无策;俚语成语的翻译仍是不可攻克的堡垒,机器同声传译的语音识别问题仍然没有很好地解决”。清华大学智能技术与系统实验室主任刘洋在《基于深度学习的机器翻译》的报告中提到了机器翻译的进展和面临的三个挑战,知识整合、解释性和对噪声具有鲁棒性。现有的研究正针对这三个挑战进行系统优化,但从理论研究到应用还需要继续努力。

人机协同是必然趋势

笔者认为机器翻译和人工翻译各有优势,人机协同是必然趋势。随着语言学、计算机科学、认知心理学等学科的发展以及以上学科在机器翻译领域的进一步合作,机器翻译技术的迭代必将以更快的速度持续发生,从而推动机器翻译的质量不断提升至接近甚至在一定条件下达到或超过人工翻译的水平。但是在情感、文化等需要对语言进行深度理解的情况下,机器翻译并不能完全代替人工翻译。二者将在理论发展、技术进步与市场推动的多重作用下,成为紧密结合互补的有机整体,实现真正意义上的人机协同。

人工智能旨在让计算机复制人类的行为。看、听、行动、计划都是典型的人类行为,而其中最复杂的任务是沟通,最难的是具备翻译的能力。这就是人工智能研究人员将解决机器翻译问题看作实现人工智能关键的原因。人工智能的时代已经到来,与语言服务业蓬勃发展态势相适应的是,传统意义上的译者角色已满足不了新时代语言服务提出的新要求。技术必将逐渐改变人们的工作、生活方式,实现消灭语言障碍的终极目标。在这个过程中,机器翻译可以减少译员大量重复、翻译难度较低的劳动,避免翻译疲劳、提高翻译效率,替代诸如天气预报查询、旅馆预订服务、交通信息咨询等低端翻译人员,但不可能取代高端翻译(如重要文献、文学名著等翻译)人员,更不会消除翻译职业。如刘星光在《中国机器翻译研究述评:问题与对策》一书中提出,机器翻译与人工翻译并不矛盾,机器翻译和人工翻译我们都需要,这要根据所翻译的材料而定。

“机器会翻译了,人类就不需要学习外语”的思维逻辑与“有了计算器,就可以不用学算术”一样无稽。即使未来人工智能翻译在准确性和速度上超越了人工翻译,人工翻译在传达情感、文化以及语言深层含义方面的作用仍不可替代。低端译员的淘汰,本质上讲,是行业内部优胜劣汰加速的结果,机器翻译的出现只是加快了这一进程。人机协同是人工翻译在人工智能时代下的必然选择,也是提升行业质量与竞争力的必由之路。正如赵联斌在《论机器翻译时代人工译员与机器译员的共轭相生》一文中提到,“未来的人工译者绝不是仅懂计算机技术或仅具备双语能力的人,而应是集计算机能力与双语能力于一体的复合型人才”。

(作者单位:厦门大学嘉庚学院)