在线翻译网站译文质量评测
徐馨文
【摘要】文章采用人工测评的方法,综合构建一套译文评价标准,对三种普遍使用的
在线翻译网站金山词霸、有道和谷歌进行测评。研究结果表明,译文的总体质量从
高到低的排序为谷歌、有道、金山词霸。三个在线翻译网站的译文质量参数符合度
顺序依次为信息完整度,术语规范,忠实原文,行文通顺。此研究可供互联网用户以及
英语使用者参考,以选取需要的翻译网站进行翻译活动。%Asthefrequentuof
theInternetandEnglish,
paperevaluatesthreekindsofonlinetranslationwebsiteswhicharemost
ud,thatisiciba,youdao,andgooglewiththemethodofmanual
resultssuggeststhatasforthecomprehensivetranslationquality,the
quencedegradesasgoogle,youdao,heparameter
influencingthetranslationquality,thequencedegradesasinformation
completeness,termnormality,faithfulnesstotheoriginal,andtextual
earchprovidesthereferencetotheursoftheInternet
andthelearnersofEnglish,inguidanceoftheirlectionofonline
translationwebsitesovertranslationactivityaccordingtotheirvarious
needs.
【期刊名称】《郑州航空工业管理学院学报(社会科学版)》
【年(卷),期】2012(031)002
【总页数】3页(P124-126)
【关键词】在线翻译网站;译文质量;质量测评
【作者】徐馨文
【作者单位】安徽大学外语学院,安徽合肥230601
【正文语种】中文
【中图分类】H315.9
20世纪90年代以来,随着互联网的飞速发展和全球化进程的推进,国际间的交
流越来越频繁,更多的人在网络上直接接触和使用英文信息。然而,人们整体的英
文素质不能很好地帮助人们理解英语原文,因此,整个社会对翻译的要求越来越高。
大部分人群选择机器翻译,一是因为机器翻译可以随时随地使用,而人工翻译往往
耗时过长,二是因为机器翻译不需要资金的投入,而人工翻译需要一定的费用。于
是,人们对于机器翻译的需求空前增长。
而机器翻译只有结合网络技术才能有更好的发展,于是,在线翻译网站应运而生。
根据艾瑞咨询于2011年12月6日发布网络翻译服务的网民调研发现,“超过6
成网民在日常生活、工作和学习过程中会接触或使用到外文;而高达97%的网民需
要借助辅助工具解决外文问题。”该结果显示网络翻译市场的发展潜力巨大。并且
在多元化的翻译辅助工具中,近四成网民选择在线翻译网站,使其成为网民们的首
选。因此,在线翻译网站越来越受到人们的关注。
在线翻译是近年来才兴起的翻译工具之一,因其可操作性强且参照性高,颇受用户
喜爱。它通常是指借助互联网的资源,利用实用性极强,内容动态更新的经典翻译
语料库,将网络技术和语言精华完美结合,为网民提供即时响应的在线翻译或者人
工翻译服务。然而,学界对在线翻译网站的研究寥寥无几。作者以为可以将其看做
是机器翻译的一种衍生物。
国外机器翻译的研究早在20世纪30年代便开始萌芽。60年代,ALPAC报告的
提出使得MT研究转入低谷。70年代,机器翻译研究开始复苏,欧共体启用
SYSTRAN系统。80年代,机器翻译研究呈繁荣局面,日本实施五国合作的ODA
计划,欧盟实施Eurotra计划。90年代,机器翻译方法呈现出多样化。
国内翻译软件的历史不过二十年。20世纪90年代初,中软的译星为国内翻译软
件打响了第一炮。国家科委早已把机器翻译列为863计划,1997年6月,在西安
召开了第8次科技翻译研讨会。90年以后,我国先后有天津通译和北京高立公司
的翻译软件。近几年的翻译软件市场已是百花齐放。在网络主宰一切的今天,任何
一种软件都必将和网络联姻,让网民能够更方便地使用产品。各大翻译软件公司又
纷纷推出在线翻译服务功能。
机器翻译的测评技术分为两种,自动测评和人工测评。自动测评用于处理大量语料,
且对译文质量的判断不够精准。单就人工测评方法而言,可分为三类:第一类为操
作性评估(OperationalEvaluation)。第二类为说明性评估(Declarative
Evaluation)。第三种常用的评估方法为分类评估法(TypologicalEvaluation)。自
动测评主要涉及各国研发的自动测评软件。而人工测评涉及各种测评标准。国际上
有ALPAC报告(ALPAC,1966:69),日本科学技术厅的机器翻译译文评估,欧洲
共同体EUROTRA的评估标准等等,国内有英汉机器翻译测试大纲以及学者提出
的各种译文评价标准。
在线翻译与传统的机器翻译相似,笔者以为可借鉴机器翻译的测评方法对在线翻译
的译文进行研究。本设计的研究目的是网民使用在线翻译网站达到对源语文本的理
解。
1.研究问题
本文根据艾瑞的调研数据选择三个知名度最高的在线翻译网站,即把金山词霸、有
道、谷歌作为研究对象,提供相同的待测语料,比较三个网站翻译的译文质量及各
个参数的符合度。
本研究主要围绕两个问题展开:一是在线翻译网站在翻译相同语料时,各网站的译
文质量如何?二是在线翻译网站的译文测评参数中,哪种参数的符合度最高?
2.研究对象
本设计的研究对象是谷歌、金山、有道三个在线翻译网站。根据研究目的,源语选
择为英语,目的语为汉语。根据1995年布瓦泰(C·Boitet)区分的机器翻译的四种
类型,本研究的适用人群是浏览者(forthewatcher),称之为MT-W,旨在为读
者查阅外文资料时提供帮助(张政,王贵明,2008:112)。
3.研究工具
比较在线翻译网站译文质量,需要用到测评技术标准和受测语料。
(1)测评技术标准
本研究的目的是读者对于译文质量的可接受性,因此,本研究采用人工测评中的说
明性评估,因为这种评估侧重通过译文质量评价各机译系统的性能。所谓人工测评
就是利用人工根据制定的评分标准对机器翻译系统输出的译文进行评分。ALPAC
报告的评分就是采用这种方法,欧洲一些国家和日本大多采用这种方法。
为了保证人工测评的客观性,笔者选择了十名对英语和汉语均有较高掌握程度的英
语系研究生作为评测员,他们分别来自北京外国语大学、上海外国语大学、对外经
贸大学、山东大学等高校。
测评以ALPAC的国际标准为主,并参照日本科学技术厅的评估标准和欧洲共同体
的评估标准,结合GBT1968-2005翻译服务译文质量(国家质量监督检验检疫总
局,2005:1-8)要求,笔者自拟出适合该研究的评测标准,即可懂度、忠实度、
信息度和流畅度。
以下给出译文评分标准:一是忠实原文,即完整、准确地表达原文信息,无核心语
义差错。二是术语规范,即术语符合目标语言的行业、专业通用标准或习惯,并前
后一致。三是信息完整,即译文与原文的信息度保持一致,既不增加额外信息,也
不减少必要信息。四是行文通顺,即符合目标语言文字规范和表达习惯,行文清晰
易懂。各项满分为2.5分,2.5表示译文完全符合该项考评标准。2表示译文较
为符合该项考评标准。1.5表示译文基本符合该项考评标准。1表示译文基本不
符合该项考评标准。0.5表示译文较为不符合该项考评标准。0表示译文完全不
符合该项考评标准。
(2)受测语料
考虑到本研究的适用对象及目的,本研究所选用的十句语料随机选自2011CWMT
测试语料的新闻文体和科技文体(CWMT,
2011:mt.xmu.edu.cn/cwmt2011/testdata.html)以及北京大学的
《英汉机器翻译测试大纲》。因此,该语料范围与MT-W上网浏览的语料相符。
4.设计描述及数据收集
测试时,笔者将待测语料分别输入各网站,并将其输出的译文填入到译文评分表中。
为保证测试的客观性,翻译网站由数字代替,评测员并不知道其对应关系。每个评
分员都收到一份评分标准表和译文评分表,在仔细阅读评分标准表之后,独立地根
据自己的双语知识对待测语料开展评分活动。为保证评分质量,三天后收回译文评
分表。
评分材料收齐后,笔者对十名评测员的评测表进行统计,分别统计出各个句子在三
个所测翻译网站的译文的平均分以及总分。金山词霸总分59.8,句1得分
3.25,句2得分2.9,句3得分3.5,句4得分4.8,句5得分3.9,句6
得分5.75,句7得分9.35,句8得分9.8,句9得分6.75,句10得分
9.8;有道总分64.85,各句子得分依次为6.2,5.1,4.7,4.85,5.9,
6.2,9.35,8.85,3.9,9.8;谷歌总分为66.85,各句子分别得分为
7.25,5.9,7.1,6.95,7.3,8.95,4.7,8.35,4.3,6.05.
此外,参照各个得分参数,根据评分标准,笔者又统计出各个在线网站的每个参数
的平均得分及总分。据统计,金山词霸总分为59.8,忠实原文14.95,术语规
范15.5,信息完整16.55,行文通顺12.8;有道总分64.85,各参数得分依
次为16.3,17.3,17.65和13.6;谷歌总分66.85,各参数得分依次为
15.75,17.75,17.65和15.7.
从得分可以看出,谷歌的在线翻译网站译文质量总体较高。在译文的可接受程度上,
谷歌优于有道和金山词霸。
从三个翻译网站的参数符合度来说,三个网站在传递源语信息上的符合度较高。对
于MT-W来说,他们使用在线翻译网站的主要目的就是为了获取信息,因此,
在线翻译网站已能基本满足他们的需求。其次,符合度较高的是术语规范,由此可
以得出,在翻译专业性语篇时,术语的翻译可以供用户参考,但仍需用户进一步核
实。在忠实原文方面,各个翻译网站的得分均不高,因此,用户在使用网站译文时,
需要有辨别地接受译文的内容。在行文通顺方面,网站的得分普遍较低,所以,用
户若需要较为通顺的译文时,尽量不要直接采用网站的译文,或者对译文的语序进
一步加工。
从本文的研究分析可以得出,待测评的三个在线翻译网站,其译文质量的优劣顺序
为谷歌、有道、金山词霸,而它们的各个参数的符合度依次为信息完整度高,术语
规范,忠实原文,行文通顺。本研究的结果希冀可供计算机用户以及英语学习者参
考,指导用户们根据自己的需要选择适合的在线翻译软件。
诚然,笔者所做的研究仍有一定的局限性,比如语料的选择不够大,测评人员不够
多,语料研究不够专一等等,这些因素都有可能造成研究结果存在一定的误差。本
研究是希望可以将研究的视线转移到新兴起的在线翻译网站上来,为未来的翻译工
具测评研究提供对比参照。
【相关文献】
[1]ALPAC.Languageandmachines:computersintranslationandlinguistics[R].A
reportbytheAutomatickj,.languageProcessingAdvisoryCommittee.Divisionof
BehavioralScience,NationalRearchCouncil.Washington,D.C.:NationalAcademy
ofSciences-NationalRearchCouncil,1966:69.
[2]葛敬民.国内翻译软件的现状和发展方向[J].中国科技翻译,2000,(1):29.
[3]巩茗珠.浅议机器翻译的发展历史和前景展望[J].吉林省教育学院学报,2009:135.
[4]俞士汶,段慧明.英汉机器翻译译文质量大纲[J].计算机世界,1998,(4):45.
[5]张政,王贵明.论机器翻译系统的评价体系[J].北京理工大学学报,2008,(2):112.
[6]赵铁军.机器翻译原理[M].哈尔滨:哈尔滨工业大学出版社,2002.
[7]国家质量监督检验检疫总局.中华人民共和国国家标准GB/T19682-2005翻译服务译文质
量要求[S].2005,(9):1-8.
[8]艾瑞.翻译服务多元化发展网民最常使用有道谷歌金山
[EB/OL].www.cnbeta.com/articles/164465.htm,2011.
[9]CMWT.第七届全国机器翻译研讨会测试语料
[EB/OL].mt.xmu.edu.cn/cwmt2011/testdata.html.2011.
本文发布于:2022-11-27 13:07:08,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/31161.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |