国内几种翻译软件AI同传及语音翻译
质量评估分析
【摘要】AI同传的出现为翻译行业发展注入了新动力,同时也引起业内学者与
专业译员们的极大关注:AI同传未来发展前景如何,翻译质量有无保证,能否
取代人工翻译?此类讨论将研究者的视线聚焦在AI同传的核心技术——神经机
器翻译上。在人工智能与大数据飞速发展的当今,越来越多的综合方法可应用
于神经机器翻译技术的更新与完善。本文以3款融合AI技术的翻译软件为例,
选取实用性原文素材为研究对象,参考权威口译质量评估标准,建立起一套评
价标准,得出结论:AI同传及语音翻译译文仍未达到人工水平并存在较大差
距,融合AI技术的神经机器翻译仍存在改进空间,如扩大语料库、增强学习功
能与联想功能等。
【关键词】AI同传;神经机器翻译;口译质量评估
【作者简介】赵玉蓉,杨鑫,刘欢,龙玟月,杨茜,安超,阮先玉,西南石油
大学。
【基金项目】本文由2019四川省级大学生创新创业训练计划项目“大数据背景
下AI同传翻译质量研究”(2)、西南石油大学第18期(2018-
2019年度)课外开放实验重点项目(KSZ18C01)资助。
一、引言
自2016年起谷歌率先推出神经网络机器翻译系统NMT(NeuralMachine
Translation),机器翻译(MachineTranslation)技术领域开始发生重大变
革,机器翻译质量实现了大幅度提升。借助飞速发展的人工智能技术,国内各
大互联网公司加快研發推广步伐,竞相推出融合了AI技术的翻译产品和服务。
融合了AI技术且易获取的口译软件在得到广泛使用的同时也收获了大量反馈信
息,无论是应用于口译实战,还是应用于大众生活,其翻译质量参差不齐,得
到了褒贬不一的评价。
二、国内几种支持AI技术的翻译软件翻译原理——神经机器翻译(Neural
MachineTranslation,简称NMT)简介
神经机器翻译在翻译建模上不借用其他手段,只采用神经网络完成源语言到目
标语言的转换。随着信息技术的进步、语言学理论的发展和人工智能技术的飞
跃,引入神经网络的机器翻译对提高机器翻译效率和质量做出了重大贡献。但
是,经典的机器翻译模型是一种通用的模型,并不完全针对机器翻译任务本身
而设计,导致神经机器翻译仍然存在一些问题亟待解决。
三、研究方法
1.使用软件与素材。本文选用3种为大型会议提供过AI同传服务的翻译软件
(腾讯翻译君、讯飞听见、搜狗翻译),人声录入原文,将软件译文与标准译
文对照,进行初步分析。
本文选取的现场原文素材以及配套权威标准译文,内容涵盖国际会议演讲或致
辞、历年政府工作报告、总理答记者问等。素材特点为:选词意义准确,表意
清晰。多采用书面词汇、政治术语及复杂且长但逻辑性强的句式结构等,措辞
严谨、精准,绝不会出现模棱两可、易生歧义等语句,文体正式化和语体口语
化兼备的特点上。
2.分析理论——杨承淑的口译质量评估标准。台湾辅仁大学杨承淑提出的“量
化”和“质化”理论是认可度较广的一种口译质量评估标准,评估项目及评分
占比为:忠实(准确、完整)占50%,表达(明确、流畅)占30%,语言(语
法、选词、风格)占20%,时间控制(原文与译文的时间比)以总分为基础上
下浮动2%。由于该理论的对象为口译专业考试,在考试过程中时间有限的情况
下,将时间控制一项纳入质量评估有一定的必要性。但在本项目研究中,对于
时间控制没有过高要求,因此不做为重要评估标准参考。
四、译文质量分析
1.译文错误类型及译文质量量化表。为了确保译文对比质量,本团队前期先完
成6期素材的录入、整理和分析,总结出几种频繁出现的错误类型。在完成译
文错误类型归纳的基础上,参考杨承淑的口译质量评估标准,制定出一套适用
于本研究的评分标准,采用扣分制,对10期译文打分。错误类型、扣分细则及
评分表如表1所示。
2.无错句的案例。无错句分为零翻译、完全相同翻译和基本标准翻译。零翻译
指原文不需要做翻译处理,译文只需与原文保持一致,本素材译文中不存在此
情况。完全相同翻译指的是机器译文与标准译文完全相同,可直接采用的情
况。基本标准翻译指的是机器译文虽然与标准译文基本相同,有修改的余地,
但不做改动也能表意清晰顺畅的情况,亦可直接采用或稍做修改。
(1)完全相同翻译。
原文:中华人民共和国成立70周年。
标准:the70thanniversaryofthefoundingofthePeople’sRepublic
ofChina
三个软件:the70thanniversaryofthefoundingofthePeople’s
RepublicofChina
(2)基本标准翻译。
原文:我们已经走上一条符合中国国情、适合时代要求的正确道路。
标准:WehaveembarkedonarightpaththatfitsChina’sconditions
andisinkeepingwiththetrendofthetimes.
三个软件:Wehaveembarkedonacorrectpaththatconformsto
China’snationalconditionsandmeetstherequirementsofthetimes.
3.典型的有错句案例。
(1)词汇错误——用词(组)不当,导致语义错误或者偏差,与原文意思不
符。
例:将“位居前列”译为“rankingfirst”(名列第一),与原文意思有出
入。
原文:国内生产总值达到67.7万亿元,增长6.9%,在世界主要经济体中位居
前列。
标准:GDPreached67.7trillionyuan,reprentinganincreaof
6.9%overthepreviousyear-agrowthratefasterthanthatofmost
othermajoreconomies.
搜狗:Thegrossdomesticproduct......rankingfirstamongthe
world’smajoreconomies.
腾讯:Thegrossdomesticproduct(GDP)......,rankingfirst
amongtheworld’smajoreconomies.
讯飞:......,anincreaof6.9%,rankingfirstamongthemajor
economiesintheworld.
(2)句法错误——语法错误。
例:使用现在分词做状语将“回顾历史”译为“lookingbackon
history”,但主句的主语为theeconomicglobalization,不能与该状语构
成主谓关系,是明显的语法错误。
原文:回顾历史,20世纪兴起的经济全球化,起初只是西方发达国家、或者说
是地中海文明的经济全球化。
搜狗:Lookingbackonhistory,theeconomicglobalizationthataro
inthelastcentury......
——生硬直译,导致不能表意。
原文:坚决打好蓝天保卫战。
标准:Wewillmakeourskiesblueagain.
讯飞:Fightagainstthebluesky!
(3)段落错误——语义分析错误,导致表意有误。
例:将“背水一战”译为“thespiritofthefirstWorldWar”,对该词
组语义理解有误。
原文:您在报告里讲改革要有壮士断腕的决心、背水一战的气概
腾讯:Inyourreport,......thedeterminationofastrongmanto
breakhiswrists,thespiritofthefirstWorldWar......
(4)其他错误。原文:40年来,达沃斯小镇以其独特魅力,已经成为中国观
察世界、交流思想、阐述主张和谋求共识的重要平台。
标准:Overthepastfourdecades,Davos,thislovelysmall
town......
讯飞:theDavossmalltownapparatusapparatushasbeenso
attractive......(乱译)
4.定量分析。本文10期素材统计得出素材原文小句总句数为508句,各软件所
译有错误译文小句总句数统计情况为:搜狗154句、腾讯187句、讯飞162
句,基本标准译文小句总句数统计情况为:搜狗99句、腾讯95句、讯飞120
句。
按评估标准对十期素材进行打分,并计算平均分,所得结果如下:搜狗88.35
分,腾讯87.85分,讯飞85.1分。
5.原因分析。(1)词汇。词汇的问题在于英语词汇普遍一词多义,AI口译软
件无法准确选取最恰当的词义,这是机器翻译历来为人诟病的弊端之一。从本
项目研究过程来看,基于深度学习的神经机器翻译在这方面已有一定改观。
(2)语料库。AI口译软件译文中许多类型的错误都是由于语料库的明显不
足。由于语言具有动态性,而神经机器翻译为了加快训练速度,会将双语词典
限制在一定范围之内,语料不足必然导致翻译质量的降低。(3)语法。AI口
译软件翻译单句的语法结构与源语语法形式一致,而未顺应目标语言的语法内
涵,造成一些明显的语法错误,无法将原文隐性逻辑理清理顺并体现在译文语
法结构中。(4)语境。胡壮麟曾将语境归纳为三类:语言语境即语篇的上下
文,情景语境即语言交流的环境、方式、条件和参与者等,文化语境即语言产
生的人文背景等。语境本身就很复杂,对于神经机器翻译来说,无疑更是巨大
的挑战。首先,在语言语境方面,AI口譯软件译文缺少衔接词,连贯性较差等
问题,一方面可能与神经机器翻译的源语分析能力有关,神经机器翻译无法识
别分析词汇或各句语境的统一关系或独立关系;另一方面与其可译句子长度的受
限有关,由于句子长度限定在一定词数范围内,同一语境下超出限制部分的词
句无法整合到同一逻辑关系或语法结构中,导致断句错误等问题。其次,在文
化语境方面,即结合源语文化背景处理译文方面,由于文化是多种因素结合的
产物,其蕴含在语言中的广度与深度表达,要求译员要具备丰富的文化常识和
敏锐的学习观察能力。神经机器翻译具有一定的长时记忆,对于文化常识也有
一定的内存储备,但根据分析过程中出现的诸多问题来看,这种记忆联想和学
习能力还远远不够。
五、结论
1.综合评价结果。参照翻译理论和口译质量评估标准,本文从词汇、句法、段
落以及软件自身其他问题四个方面,将三个软件的AI同传及语音翻译译文与标
准人工译文进行对比分析,得出定量和定性分析结果显示,三种软件的AI同传
及语音翻译质量基本在同一水平。整体上,人工翻译译文质量优于三个软件的
AI同传及语音翻译译文质量,后者翻译质量仍有待提高。2.研究启示。(1)
提高神经机器翻译源语分析能力是解决神经机器翻译诸多问题的根本。目前针
对该问题,改善注意力机制已成为研究热点。将大数据应用到神经机器翻译系
统中,其语言学习能力或许能得到增强。(2)扩充神经机器翻译语料库规模。
当前神经机器翻译为了加快训练速度,将语料库规模限制在一定范围内,也限
制了系统的联想预测能力。(3)AI口译结合人工翻译及译员不断自我提升的
必要性。本文认为,神经机器翻译与译后编辑结合,能大大节省译员的时间与
精力,并有效检验、修正机器译文的错误。这不仅对翻译标准研究提出了要
求,还对译员个人素质与技能水平做出了要求。AI口译的进步必然与人工翻译
的进步紧密相连。3.本项目的局限性由于时间、精力、能力和篇幅有限,另外
出于便利统计和整理的目的,本文仅能通过案例研究的方式对三种软件的AI同
传或语音翻译质量进行评估,样本类型不够丰富,量化数据只作为一项参考指
标,意在探寻量化分析的可能性。因此,本文建议未来研究可由翻译界和其他
相关学界专家合作进行,融合多学科研究方法,将翻译与科学技术尤其是AI技
术紧密结合,建立实用可行的评估模型,积极探索AI同传及语音翻译质量评估
与改善的新途径。
参考文献:
[1]姜敏浩.政府工作报告特点及英译策略研究[J].学周刊,2015(30):18.
[2]杨承淑.口译教学研究:理论与实践[M].北京:中国对外翻译出版公司,
2005.
[3]李梅,朱锡明.英汉机译错误分类及数据统计分析[J].上海理工大学学报
(社会科学版),2013,35(03):201-207.
[4]孙逸群,周敏康.机器翻译质量综合评价方法研究[J].中国科技翻译,
2017,30(02):20-24.
本文发布于:2022-12-27 06:57:29,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/38810.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |