译星多语智能翻译系统
1. 概述
1.1、背景介绍
中国软件与技术服务股份有限公司机器翻译事业部从1984年开展机器翻译的研究工作,1988年推出世界上第一个英汉机器翻译系统产品--"译星",随后又推出"译星"汉英翻译系统和"译星"汉日翻译系统。产品遍销美、日、东南亚等地区,机器翻译技术曾多次向海内外转让。
机器翻译事业部部利用自身技术优势,先后与国内外许多著名企业、权威研究机构建立了合作关系,在技术创新、多领域应用、产品推广上取得了较大的发展。中软曾代表中国政府,联合清华大学、中国人民大学等7家单位参与亚洲五国政府合作机器翻译项目-MMT(多国语言机器翻译);参加与日本政府间合作的纤维产业电子数据交换(EDI)系统的研制工作;国际软件开发总部曾与Nortel公司合作,将机器翻译与TM(Translation Memory) 软件相结合,形成实用化的企业翻译工具。
2000年,机器翻译事业部开通了"译星"翻译服务网站()及WAP翻译网站。网站具有英汉双向文本翻译、网页翻译、邮件翻译、聊天翻译功能。
在2002年,机器翻译事业部根据用户的需求,提供专业的翻译应用解决方案。
译星软件曾获奖项
( 国家科学技术进步奖。
( 国家"七五"攻关重大成果奖。
爱你英语怎么说 ( 国家级科技成果重点推广计划。
( 国家863计划智能计算机课题成果。
( 中国软件行业协会推荐连续三年优秀软件产品。
(中国软件最具应用价值的软件产品
2. 专业翻译技术
2.1 机器翻译技术 (Machine Translation)
(机器翻译流程图-图2-1)
大班安全计划机器翻译技术是一种人工智能技术,它是利用计算机模拟和抽象人的翻译过程,实现在计算机上将一种语言自动翻译成为另一种语言。计算机翻译语言的过程就是将源语言翻译成为目标语。
"译星"翻译系统的具体翻译过程是先对源语言进行词法分析,之后在词法分析的基础上再进行句法分析,然后根据源语言句法分析的结果,相应的生成目标语。当然,这只是对翻译过程的粗略描述,实际的翻译过程有大量复杂的技术细节,而且由于计算机所知道的语言知识是有限的,其分析结果也很难百分之百正确,因而最终的译文不可能象人工翻译一样正确和流畅。
"译星"英汉机器翻译核心采用SCOMT描述语言实现语言的句法分析、语义分析和生成。"译星"汉英机器翻译以逻辑型算法语言实现语法、语义分析。采用有定义子句文法(DCG)作为语法分析程序的基础,并结合功能合一文法、词汇功能文法。汉日翻译机器利用语义分析
辅佐语法分析,采用属性制约文法(Attribute Restriction Grammar)。
"译星"翻译软件不仅在翻译技术及翻译质量上保持领先水平,而且在翻译语种、翻译功能上也是同类软件中最多的。在翻译功能上,"译星"系统具备英汉双向互译功能,在目前的翻译软件市场上是屈指可数的,由于配备了多部专业词典,"译星"系统不仅适用于一般用户,还可服务于专业领域翻译的需求,为专业翻译提供了方便快捷的翻译工具。
从翻译质量上,对于一般复杂程度的文章,"译星"英汉翻译系统的翻译准确率在85%以上,"译星"汉英、汉日翻译系统的翻译准确率在75%以上。在翻译速度上,"译星"英汉系统每小时可翻译100万词,"译星"汉英系统每小时翻译20万词,汉日系统每小时翻译40万词。同时"译星"软件还配备了大容
量词库,"译星"英汉系统的基本词汇和专业词汇的总量达到了100万单词,汉英系统的总词库超过了20万词,汉日系统的词库有10万词。
2.2 翻译记忆技术(Translation Memory)
翻译记忆简单的说就是把已经翻译过的译文在计算机里存储起来,将原文、译文记忆在翻译记忆软件中,当再进行新的翻译时,翻译记忆软件可以搜索和提取在翻译记忆库里相同或相似的原文及译文结果,从而使新的翻译不必从新进行,而可以参照和使用以往的翻译结果,因而大大提高了翻译效率。
近年又出现了一种新的趋势,那就是翻译记忆技术与机器翻译技术的结合。这两种技术可以说互为补充,因为翻译记忆无法翻译没有记忆的语言,或者由于寻找不到匹配度足够高的原文,而无法输出译文,而这时就可以使用机器翻译实现自动翻译。这种结合技术我们称为:TM+MT技术。
2.3翻译功能
( MT+TM+CAT整体流程图-图2-2 )
2.3.1翻译服务
针对用户数据进行翻译处理:
● 对于以前翻译过的数据,可自动将译文作为翻译结果。如果译文有多个,用户可选择 译文。
● 对于以前未翻译过,但与以前翻译过的数据相似的数据,可将相似数据的译文作为参
考,由人工修正译文。
● 对于以前未翻译过,与以前翻译过的数据也没有相似性的数据,提供自动翻译译文,由人工进行修正。
2.3.2辅助处理功能
● 译前处理:拼写检查、人工分词等处理。
● 译后处理:对于翻译处理后的数据提供辅助校对/修正平台。
● 用户词典管理:用户可以建立自己的专用词典--用户词典,系统提供用户词典的维
护(增、删、改)功能,用户词典版本、优先级的管理。
● 词汇表(Glossary)管理:为多名译者协同翻译大型文献、资料,系统提供面向不同
翻
译对象的同一词汇表(术语表)的管理。
2.3.3提供的翻译语种
英汉翻译
英文翻译成为中文
汉英翻译
中文翻译成为英文
汉日翻译
中文翻译成为日文
日汉翻译
日文翻译成为中文
2.3.4处理对象
● 直接翻译文本、HTML文件;
● 后台处理Word文件;
● 嵌入IE、Word、Excel、PowerPoint、Framaker,作为它们功能的一部分。
2.4翻译流程管理
3. 应用
3.1、翻译系统的应用
3.1.1、系统简介
为专业翻译人员和企业用户,提供自动翻译辅助平台,同时适合于企业用户进行
专业领域的翻译。系统配备英汉翻译常用词汇 7 万余条,覆盖 27 个专业领域;汉英翻
译常用词汇 10 万余条,覆盖 7个专业领域。
系统的性能:
译文可读性
翻译速度/小时
英汉翻译
85%
100万
汉英翻译
75%
20万
3.1.2、系统基本结构
(翻译终端应用流程图-2-3)
3.1.3、系统各功能模块特点:
全文翻译器:在"译星"全文翻译器中,系统支持的文件类型为:
① 文本文件(*.txt, *.chn, *.eng)。
② RTF文件(*.rtf):*.rtf是一种具有丰富格式的文件。
③ 对照文件(*.etc,*.cte,*.bil):是经过"译星"全文翻译器翻译并保存后产生的译文与原文对照文件。
嵌入翻译:
主要是将"译星"翻译工具按钮或菜单嵌入到 Internet Explorer 5.0 以上、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、Adobe Acrobat、Adobe FrameMaker 内,翻译网页、翻译 Word 文档、翻译 Excel 表格、翻译 PowerPoint 文稿、翻译 PDF 文件、翻译 FM 文件。它既支持全文英汉/汉英翻译,也支持选中部分的英汉/汉英翻译。
批量翻译:
对多个文件同时进行翻译。
专业领域翻译:
可通过专业领域的选择解决部分词的歧义问题,从而提高翻译效率。
译星翻译系统配备词汇 110 万余条,英汉除基本词典外有19 部专业词典:经济、计算机、通信、医学、化工、火电、印刷、陶瓷、炼油、石油物探、矿冶地质、汽车拖拉机、外贸、水利、铁路(新增)、数学(新增)、声学(新增)、电技术(新增)、机械(新增),共覆盖 27 个专业领域;汉英除基本词典外有 7 部专业词典:互联网(新增)、计算机(新增)、环保、冶金、化工、元器件(新增)、汽车,共覆盖 7 个专业领域。
日汉、汉日专业词典有
台湾娱乐节目
用户词典:
用户可以创建自己的词典,并且用户词典优先于系统词典。
双语对其工具
* 对过去翻译过的数据(原文和译文)进行分析,处理确认后的语对可以导入到翻译记忆库(TM:Translation Memory)中。为翻译资源的将来再利用提供方便。
* 提供原文和译文的语句编辑、对齐的交互界
面,方便用户完成原文语句和译文语句的修改。编辑操作如原文和译文的拷贝、粘贴、增加、删除、修改;对齐操作如原文和译文的移动、合并、拆分。
* 提供句子切分接口,方便用户根据不同的文章设定原文和译文句子的切份选项。
术语抽取工具
该工具可以从一篇或批量文章中抽取专业术语,处理的文件类型有*.txt、*.rtf、*.doc、*.html、*.htm格式文件。
3.1.4.系统优势:
● 技术先进性:系统采用专业的翻译引擎,运行速度快、安全性能好,能处理批量数据。
● 灵活适应性:系统完全采用开放技术构造,客户可以根据需要进行功能定制。
● 强针对性: 系统面向专业翻译领域,翻译流程清晰,功能集中。
● 高可靠性: 系统已投入运行,强大的专业翻译技术为客户提供完善的技术服务
3.2局域网的应用
3.2.1、系统简介
本系统自动统计翻译业务量、员工工作量,出具业务报表,并保证严格的财务审查程序。大大降低了翻译业务管理的难度和复杂度,可快速处理翻译业务的分配、统归,加快了业务周转速度,提高了工作效率。租赁合同备案
3.2.2、系统基本结构
(翻译系统局域网应用流程图-3-2)
3.2.3、系统各功能模块特点:
① 基于服务器的自动翻译服务。
② 基于局域网专业术语库的记忆翻译服务。
③ 专业翻译平台支持所有的人机交互操作。
雪人歌曲④ 支持所有文档格式。
⑤ 支持翻译工程化管理。
⑥ 支持翻译的流程化管理。
⑦ 支持翻译人员管理。
⑧ 支持翻译记忆管理。
⑨ 按照特定服务对象的特殊需求,对通用翻译平台进行定制开发。
系统优势:
① 技术先进性:系统采用浏览器/服务器模式,运行速度快、安全性能好
② 灵活适应性:系统完全采用开放技术构造,客户可以根据需要进行功能定制。
③ 强针对性:系统面向翻译业务管理,处理流程清晰,功能集中。
④ 高可靠性:系统已投入运行取得良好效果,并为客户提供完善的技术服务。
系统适用范围:
为具有较大翻译需求的集团用户(专业翻译公司或拥有较多翻译人员的企 业、机构),提供自动辅助翻译平台。 网络版软件基于客户/服务器工作模式,由专门服务器运行翻译服务和工程服务,客户端执行翻译操作,多人共享本地知识库。
3.3 广域网的应用
3.3.1、Internet应用方案
花菜简笔画系统简介:
Internet 信息翻译是当前一项综合利用机器翻译、计算机、网络与通讯技术,将因特网中的信息资源
进行自动翻译的新兴技术。
中软公司多语Internet 翻译解决方案,为用户、商家及网络服务商进行多语种I
nternet 翻译与增值服务等创造了一个崭新的商务模式。
系统基本结构:
(翻译系统广域网应用流程图-3-3)
系统各功能模块特点:
① 网页自动翻译:用户首先登录"译星"网(),然后根据提示输入要翻译的网站地址(如)、浏览语言与是否翻译后续页面等,选择"提交"按钮后,"译星"网进行翻译、检索、匹配,构造响应页面,最后将翻译完的页面发送给用户浏览器。
② 网上翻译 : 客户端的用户将自己要翻译的内容(书信、文本)提交给Internet 翻译服务器,服务器对提交的内容进行翻译,并将翻译结果即时发送到客户端。
③ 翻译检索:用户登录"译星"网之后,在"译星"搜索栏目的对话框中输入欲搜索的关键词(如"微软")并选择相关语种,系统会自动检索,迅速提交目标语种的检索结果。
系统适用范围:
为需要自动翻译引擎的网站、企业局域网,提供翻译功能引擎,网站底层专用翻译功能接口。针对大型网站和有大量翻译需求的企业、机构,提供全面网络信息处理平台。
3.3.2、移动应用解决方案
3.3.2.1、系统简介
这是针对经常处于非固定状态的客户的移动化需求而定制的全面解决方案,中软"译星"的移动在线翻译解决方案,将上述问题一一解决。
3.3.2.2、系统基本结构
(翻译系统移动应用流程图-3-4)
3.3.2.3、系统各功能模块特点
①通过JDBC、JNDI等标准实现与"译星"翻译引擎、翻译处理数据库等系统的无缝连接 。
红苕饼
②集中大量处理用户的移动终端设备中的待翻译信息 。
③帮助用户实现移动信息流,打破翻译信息获取的时间、地点限制 。
④根据移动设备类型发布信息和进行交互,保证不同类型的终端设备都得到正确的信息。
⑤可提供汉英、英汉、汉日等多语言处理功能,保证系统的安全。
3.3.2.4、系统优势
1、提高用户信息的利用度和效能,使移动即时在线翻译信息为用户提供有效的帮助。
2、为用户翻译信息系统提供了新的应用手段。
3、可以与现有Internet翻译信息系统实现无缝连接,使用户的翻译信息协作实现移动化,提高系统的使用效能。
3.3.2.5、系统应用平台
* 服务器端:JDK1.3版本JVM
* 客户端:Palm OS、Windows CE、EPOC
* 网络协议:TCP/IP
* 协作服务器支持:Exchange Server 5.5/2000、Domino 4.5/4.6/R5
其它Internet服务支持:LDAP3、IMAP4、SMTP、WCAP/iCAL
3.4 针对软件开发的应用
3.4.1、翻译引擎简介
机器翻译体系的核心所在,支持多线程。目前拥有英汉(简繁体中文),汉英(简繁体中文),汉日多种翻译引擎。翻译引擎充分考虑了当今世界一体化对英语的需求,采用最先进
的语言分析技术,依据语法信息,并结合语义进行翻译。拥有强大的词典库和规则库。可支持几十部英汉专业词典和汉英专业词典。已经应用于一些网站、大中型企业、软件开发商及网络服务器,并达到了非常好的效果。可集成在其他应用软件中,使其他应用软件拥有强大的翻译功能。
3.4.2、系统特点:
技术先进,占用资源少,性能稳定,贴近用户,需求安全可靠,扩展性强.
3.4.3系统适用范围:
为需要自动翻译引擎的网站、企业局域网、软件开发商,提供翻译配套技术支持和翻译功能引擎。对网站或企业局域网提供网站的底层专用翻译功能接口 。针对大型网站和有大量翻译需求的企业、机构,提供全面网络信息处理平台。对软件开发商提供翻译引擎功能接口,使其充分的利用翻译引擎。
4.服务
4.1、售前服务
针对客户进行面对面的咨询服务
主要是帮助客户最大程度地了解"译星"翻译软件系统的效用,有针对性地为客户设计所需要的解决方案,并运用成熟的实施策略制定切实可行的实施方案,以保证"译星"翻译软件系统能与客户其它系统的有机兼容。
对客户进行产品方案演示
根据客户的需求意向,"译星"咨询顾问利用原有成功的产品技术方案,为客户进行演示,详细征求并深入了解客户的每一个需求,为客户未来的平台发展作出周全的考虑。
针对客户所需和所想,提出相应方案
得到客户的每一个详细要求后,由"译星"技术工程师会同"译星"咨询顾问为客户制定用户解决基本方案,保证用户的每一个需求得到完善的解决支持。
为客户制定切实可行的应用解决方案
在基本方案得到客户认可的基础上,"译星"会形成一个针对的项目小组,制定出切实可行的、以客户为出发点的应用解决方案。在通过实际测试运行后,再交与客户签收使用。
4.2、售中服务
根据用户的特点制定相应的培训方案
为客户提供一个快速了解"译星"系列翻译软件的途径。新老客户通过"译星"技术培训,更深入地了解软件及其新版本的功能和特性。
对用户安装使用进行技术支持
马中赤兔
在客户的安装使用过程中,"译星"的技术工程师会随时随地地并细致地为客户解释每一个细节及安装使用过程中的问题。一直到客户应用的"译星"翻译系统正常使用为止。
对用户使用中提出的问题,给予充分解答和帮助
在客户的使用过程中,对客户提出的每一个细小问题都会给予细致的充分的解答,让客户没有后顾之忧。
4.3、售后服务
为每一位"译星"用户量身订做每个年度的客户服务计划
提供年度客户服务计划。内容包括热线电话、Web