面向技术文档翻译的双语术语知识库建设研究
作者:李双燕 苗菊
来源:《中国科技术语》2021年第01期
pirate
摘 要:技術文档翻译关系企业全球化进程,是语言服务行业的重要内容,其翻译质量在很大程度上受制于译员对专业领域知识的正确理解。基于领域本体的双语术语知识库将概念与概念之间的关系进行形式化描述,形成知识图谱,辅助译员学习领域知识。文章选取信息通信技术中的云计算领域,按照知识采集、知识表示、知识应用等知识组织活动,
探讨双语术语知识库的建设模型、原则、流程与方法等,并手工构建了一个云计算领域双语术语知识库,可为译者等语言服务人员提供知识服务,助力企业跨语言跨文化经营,同时也为其他垂直领域双语术语知识库建设提供实践范例与研究启示。
deli音响没声音 关键词:双语术语知识库;领域本体;技术文档翻译;云计算
中图分类号:H083; H059; U46 文献标识码:A DOI:10.3969/j.issn.1673-8578.2021.01.007sheep是什么意思
Construction of Bilingual Terminological Knowledge Ba for the Translation of Technical Documents//LI Shuangyan MIAO Ju
Abstract: Translation of technical documents plays an integral part in the globalization of enterpris, thus being an important business of language rvice industry. The translation quality depends to a large extent on translators’ command of domain knowledge. Ontology-bad terminology knowledge ba can prent a formal description of concepts and their relations, forming a well-structured knowledge map,
which can rve as a great help for translators. Taking cloud computing in the domain of information and communication technology as a demo, we explore the construction of bilingual terminological knowledge ba in terms of the constructing model, principles, process and methods, etc. and t up a bilingual terminology knowledge ba for cloud computing. This bilingual terminology knowledge ba can rve language rvice providers, facilitate the cross-cultural business, and shed light on the construction and rearch of bilingual terminological knowledge ba for other vertical fields.
Keywords: bilingual terminological knowledge ba; domain ontology; technical translation; cloud computing
busybody 收稿日期:2020-08-15
基金项目:国家社会科学基金重大项目“双语术语知识库建设与应用研究”(15ZDB102)阶段性成果
引言
renade
技术文档(technical documents)是指“与程序或硬件一起交付的一套操作说明”[1],比如,产品说明书、在线帮助、维修手册等,旨在为用户提供产品介绍、操作步骤、常见问题处理等信息,在一定程度上代表着产品的软实力,是产品交付的必备组成部分[2]。技术文档的专业化水平是衡量企业发展成熟度、制约企业全球化进程的重要因素。随着“一带一路”“中国制造2025”等国家发展战略的提出,跨国产能合作及产业链分工调整给中国企业海外发展提供了全新的投资机遇,中国企业“走出去”开启2.0时代,企业技术文档的翻译服务亟待升级,以匹配企业国际化需求。技术文档翻译不仅需要译员具备较高的双语语言能力,还需要熟悉专业术语和领域知识,后者往往是大多数语言背景的译员所欠缺的。传统翻译术语库虽然可以提供与术语相关的信息,但对术语所代表的概念间的关系及所对应的客观现实描述不足,译者只能获得知识碎片。
本体(ontology)的引入可有效解决这一问题。基于本体的双语术语知识库是当前知识组织领域的重要研究内容,通过对各类专业领域知识进行组织、描述和管理,形成具有一定深度的知识结构框架,为用户进行专业知识的学习、交流与传播提供帮助。国内外现已在术语知识库的建设方面取得了不小的成就。国外相关研究日臻成熟,代表性成果有加拿大的多领域大型术语库TERMIUM(支持英语、法语、西班牙语、葡萄牙语4种语言),
西班牙的环境领域术语库EcoLexicon(支持英语、西班牙语、德语、法语、俄语和希腊语6种语言),德国的网络术语库WebTerm,俄罗斯的计算机信息系统科技术语库AISNT,和涵盖欧盟24种官方语言的大型互动型术语库IATE等。国内代表性成果有通用型术语知识库HowNet(汉英双语)、CCD中文概念词典(汉英双语)等 ,专业领域术语知识库有电信领域知识库 [3]、中华烹饪文化知识库 [4]、中医典籍知识库 [5]、慢性病健康教育知识库 [6]等,不过这些专业术语知识库多为单语,而非双语或多语,不是直接服务翻译的。因而,亟须探索面向翻译的专业领域双语或多语术语知识库,满足企业全球化发展与国家战略发展需要。
union 当前对技术文档翻译需求最大的是信息通信技术(information and communication technology, ICT)领域,占各行业技术文档总需求的51.09%[7],因而,本研究选择信息通信技术领域构建双语术语知识库。又由于信息通信技术涵盖范围广泛,本研究特聚焦于云计算(cloud computing)这一前沿领域。云计算描述了一种基于互联网的新的信息技术(information technology,IT)服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且虚拟化的资源。云产品种类较多,更新换代较快,译员学习新知识的速度须与产品更新的速度相匹配。云计算市场目前还不太规范,在IT文献和IT媒体中有着对基于
dwolves云的模型和框架的各种不同定义和说明,增加了人们的困惑,使用过程充满了陷阱、歧义和谬误[8]。解决的途径就是正确界定云计算的概念及概念间的联系,以知识为基础来决定一个术语该如何使用、如何翻译,以及在多大程度上需要调整。确切地说,就是基于本体理论描述云计算领域知识,构建该领域核心概念及概念之间的关系,使领域基本概念得以清晰化、系统化、可视化,帮助译员便捷地获取领域知识图谱,更好地进行翻译。
1 建设双语术语知识库的理论基础
建设双语术语知识库需要宏观与微观两个层面的理论指导。
宏观层面,双语术语知识库依托知识组织理论进行总体框架设计,将整个研究分为知识采集、知识表示、知识运用三部分,每一部分都为下一阶段的研究奠定基础。(1)知识采集,主要指运用信息技术手段构建大规模数据并从中进行自动化术语信息的抽取和预处理;(2)知识表示,指描述专业领域知识,构建知识网络,实现计算机对于领域知识的语义识别;(3)知识运用,包括两方面:建立知识导航系统、知识检索系统和人机交互界面;开发双语术语知识库在生产、科研、教育等领域的应用途径,根据实际应用效果和用户要求验证开发流程的合理性并进行完善。
微观层面,依据术语学理论和本体论进行术语知识体系的建构。最初,知识库是基于关系数据库构建起来的。在此基础上构建的专题数据库对领域知识的揭示不足,不能准确呈现概念之间的关系,语义检索、知识推理、知识发现与知识共享等高级功能难以实现。要有效克服传统术语库的不足,术语知识库需要做好两方面的工作:一是术语概念关系的表示与架构,二是知识处理技术[9]。前者解决内容问题,后者解决方法问题。
第一项工作主要依托术语学理论完成基础数据的组织整理工作,具体包括:确立术语筛选标准,设定双语术语条目存储结构,完成术语的提取、存储、标注、编码、定义、术语属性粒度设置等工作,并确定术语翻译的原则与方法等。在此,术语是指“构成某特殊领域中知识的独立概念实体、特征或关系” [10]。第二项工作主要依托本体论完成专业领域知识的概念网络构建工作,形成立体化的主题知识图谱,实现知识的体系化与可视化[11]。本体模拟人类认知思维过程构建概念语义网络,对领域概念及概念间的关系进行规范化描述,使概念之间的各种规律、联系等都被显性地描述出来,这有利于全面获取、分析并利用知识,它是一种系统性表示某一领域知识框架的手段[12]。具体包括:构建领域主题图,对专业领域主题的名称、主题所在的资源出处、主题包含的所有概念之间以及概念与主题间的关联进行构建;在此基础上,利用基于 XML 语法的扩展性资源描述语言编写主题
申正焕事件图中概念链接的计算机识别程序,建立人机交互界面。
这两项工作相辅相成,反映了术语学与本体论的融合。把传统术语学中基于概念的术语观(concept-bad viewpoint)推进到基于知识本体的术语观(ontology-bad viewpoint),用知识本体的理论和方法来研究术语,扩大了术语学的研究范围[13]。
2 建设双语术语知识库的技术基础teacherclub com cn
建设云计算领域的双语术语知识库需要确定云计算领域本体,选用合适的本体建设工具。