机器翻译中的翻译单位研究

更新时间:2023-07-07 16:06:32 阅读: 评论:0

一一一一一一一一
翻译研究
本栏目责任编辑:梁书
机器翻译中的翻译单位研究
谢婧
(江南大学外国语学院,江苏无锡214122)
中国的科技发展摘要:翻译单位一直是翻译理论和实践的重要课题,国内外学者从不同视角对此进行了研究。该文立足于机器翻译视角,
宝贝生日祝福语
描述不同时期机器翻译系统的翻译单位。在此基础上,综合分析近年来参与翻译评测竞赛的机器翻译系统,发现当前机译系统的翻译基本单位主要是短语或层次短语。开展这项研究,有利于为翻译单位争论提供新的佐证。关键词:翻译单位;机器翻译;机器翻译系统;短语;层次短语中图分类号:H315.9
文献标识码:A
文章编号:1009-5039(2016)23-0120-03
1946年,世界上第一台电子计算机“ENIAC ”诞生。同一年,美国洛克菲勒基金会副总裁韦弗(W.Weaver )与英国工程师布斯(A.D.Booth )在探讨计算机应用范围时提出了利用计算机进行语言自动翻译的想法。1949年,韦弗发表了一份题为《翻译》的备忘录,正式提出了机器翻译的问题。
青岛理工大学是几本机器翻译就是利用计算机及其软件系统实现从一种自然语言(源语言)的文本或语音到另一种自然语言(目标语言)的
文本或语音的翻译【1】
。作为翻译中的重要研究领域,机器翻译与翻译单位的结合并未受到足够重视。本文拟从机器翻译层面考察翻译实践中的具体操作单位,通过综述机器翻译系统发展轨迹,分析当前机器翻译系统翻译单位分布情况,从而为翻译单位研究提供崭新方向。
1从机器翻译系统发展看翻译单位研究
1954年,IBM-701计算机成功利用6条语法规则把250个俄语词汇和60多条俄语例句翻译成英语【2】,
第一次向世界正式揭开机器翻译研究序幕。至今为止,机器翻译发展可以归纳为“初创期”“高潮期”“沉寂期”“复苏期”和现在正在经历的“快速发展期”五个阶段。
入团申请书动漫画画图片大全20世纪90年代以前,基于规则的翻译方法在机器翻译系统设计方案中占据着主流地位。基于规则的翻译方法又称理性主义方法,主张根据语言学理论和翻译理论采用物理符号系统模式构建符号表达式表征翻译过程。1.1直接翻译法
早期基于规则的翻译方法主要指直接翻译法,即以词典为驱动,借助词典查询的手段把源语言输入分解为单个词汇进行逐词翻译的方法。运用这种简易翻译方法操作的机器翻译系统只对源语言进行形态分析和必要的局部词序调整,生成的翻译晦涩难懂。
此后,机器翻译工作者意识到源语和译语之间的翻译不仅需要浅层词汇形态分析,还需要深层句法结构和语义分析【3】。于是,机器翻译系统开始利用转换翻译方法和中间语言翻译方法,在翻译过程中引入语言学家编写的语言规则知识。1.2转换翻译法和中间语言翻译法
嗤之以鼻的意思
转换翻译方法涉及分析-转换-生成三个阶段:第一步是将源语言输入分析为其句法结构表征式;第二步是把源语言句法结构表征式转换为对应的目标语言句法结构表征式;第三步是从目标语言的句法结构表征式中生成目标语言输出。这种基于转换的翻译方法与人工翻译方法具有高度契合度,因而成为实用规则机器翻译系统的主导翻译策略。
中间语言翻译方法是指运用一种抽象的语义表达式翻译的方法。这种抽象语义表达式与源文本无关,但能捕捉源文本必要语言信息以生成恰当译文。可惜的是,语言学家编写的深层文本表达式无法达到抽象意义表达式的效果。
机器能够依靠规则理解它所面对的自然语言,但语言学家编写的规则主观性强、覆盖性差,难以处理大量真实文本。此外,常宝宝(2002)和何莲珍(2007)曾一针见血地指出基于规则的机器翻译系统默认词为翻译基本单位,在消除歧义和语境联
系方面仍然存在不足【4】【5】
1990年前后,大规模平行语料库的应用带领机器翻译研究进入了新纪元。机器翻译系统设计方案中融入了基于语料库的翻译方法即经验主义方法,其中包括基于实例的方法和基于统计的方法。
1.3基于实例的翻译方法
基于实例的翻译方法把双语对照翻译实例库作为主要的知识源,依靠已有的知识经验,通过类比原理进行翻译【6】。其翻译流程可以描述为:首先将源语言句子分解成片段,然后在实例库中搜索与源语言片段匹配度最高的对应目标语言片段,最后对目标语言片段进行适当重组生成目标语言句子。在
基于实例的机器翻译系统中句子是翻译的基本分析单位,单词或短语是翻译的基本操作单位。1.4基于统计的翻译方法肉食鸡
基于统计的翻译方法是指利用统计算法自动地从双语平
行文本中学习翻译知识的方法【7】。这种翻译方法借助翻译模型和语言模型实现源语言句子与目标语言句子的解码。统计机器翻译系统应用的翻译模型已历经三代发展:第一代是基于词的翻译模型,把单词作为翻译的基本单位;第二代是基于短语的翻译模型,翻译基本单位由单词扩展为具有泛化概念的“短语”;第三代是基于句法的翻译模型,可以细分为形式上基于句法的模型和语言学上基于句法的模型。语言学上基于句法的模型以句法短语作为翻译基本单位;形式上基于句法的模型中应用频繁的是Chiang (2005)提出的层次短语模型【8】,该模型主要使用同步上下文无关文法将层次短语生成翻译规则作为操作的基本单位。1.5基于混合策略的翻译方法
由于以上不同翻译方法驱动的机器翻译系统取得的翻译结果存在自身难以克服的弊端,计算技术专家开始在翻译后处理阶段或翻译过程中利用混合策略翻译方法。这种翻译方法旨在单词、短语、句子三个不同级别对多个单系统引擎输出的
收稿日期:2016-10-10修回日期:2016-11-10
汉书作者
作者简介:谢婧(1991—),女,安徽安庆人,江南大学外国语学院硕士研究生,主要研究方向为翻译学、机器翻译。
120

本文发布于:2023-07-07 16:06:32,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1071797.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:翻译   方法   系统
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图