《牛津高阶英语词典》(第七版)词典信息的计算词典
学认知
一、引言
计算词典学是数字化科技通过词典反映、传播和推进语言创
新能力而形成的新型跨学科研究方向,是数字化时代推动辞书现
代化发展的理论保证。数字化科技的发展推动了计算词典学理论
的发展,而计算词典学理论在词典编纂上的应用推动了人们认知
数字化社会的过程。
在数字化科技和电子词典同步发展的社会背景下,牛津大学
出版社于2005年在英国推出基于英国国家语料库编纂的《牛津
高阶英语词典》(第七版)(OxfordAdvancedLearner's
Dictionary,以下简称OALD7);2007年,OALD7英文版由商务
印书馆引进出版;2009年6月OALD7英汉双解版出版。计算词
典学的编纂理念在该词典中得到充分应用,词典使用者可以同时
使用该词典的印刷版、光盘版、掌上电子词典版和免费开放的网
络版。
正确认知词典信息在数字化时代显得尤为重要。从语言实用
论的角度来说,词典不但记录人类语言发展的事实、反映社会环
境发展过程和结果,而且能通过改变人类认知世界的方式,从某
种程度上推进某一特定社会发展时期生产力的发展(Ayto2007:
1)。本文将从计算词典学的认知角度出发,分析和研究OALD7的
词典信息建构模式,以期推动计算词典学理念在国内双语高阶学
习词典编纂方面的应用。
二、OALD的数字化沿革
计算词典学和传统词典学是一种相互依存、共同发展的关
系。传统词典学和计算机科学不断结合,产生了新的词典学分
支――计算词典学。计算词典学的研究对象主要是基于数字化技
术而编纂的各种词典,包括供人使用和供机器使用的词典。供人
使用的词典存在形式多样,有些以印刷版词典为蓝本进行数字化
转换,有些利用语料库和印刷版词典编纂,有些完全以语料库为
基础编纂;这类词典涵盖以数字化科技为基础编纂的印刷本词
典、光盘词典、掌上电子词典、手机词典和网络词典等。供机器
使用的词典内置于计算机等数字化设备中,帮助实现信息的自动
化处理。数字化技术的发展推动计算词典学研究的发展,进而推
动词典编纂理念的革新,促使词典编纂技术和词典质量不断提
高。
OALD编纂理念的革新与计算词典学研究同步发展。自20世
纪六七十年代,国外开始了计算词典学的理论研究,到八九十年
代其理论框架和研究范围渐渐趋于明朗(章宜华2007:19)。20
世纪80年代出版的OALD也在这一阶段改造成可适于自然语言处
理的机器词典。90年代初期,部分机器词典开始转型为供词典
使用者查阅的电子词典,大量进入市场,使词典实现了从印刷版
向电子版的转变。同一时期,OALD也开始改造成供查阅的电子
词典,实现了词典从印刷版向电子版的转变,为词典使用者提供
光盘版,并与掌上电子词典出版商合作。
21世纪是数字化科技发展的重要阶段,计算词典学研究和
基于这一研究的词典编纂技术不断进步。同一时期,牛津大学出
版社实现了基于大型语料库的词典编纂,不断推出新词典和词典
不同载体的版本,尤其重视词典的网络化发展。2005年,OALD
推出印刷版第七版,同时上市的还有该词典的光盘版,并免费开
放网络版。网络版OALD7实现了即时更新,从某种程度上说,其
提供的语言信息比印刷版丰富、及时,为词典使用者提供免费的
优质服务,实现资源全球共享,这不能不说是电子词典挑战传统
英语学习词典出版观念,服务社会、推进社会发展的一大革新举
措。
三、OALD7词典信息的宏观概念
如何实现词典信息表述方式多元化是计算词典学的研究重
点之一。数字化环境下,只有建立“宏观认知概念”,才能正确
认知词典内容,提高词典的使用效能,正确分析和研究词典。
1、“词典”定义的宏观角度
“词典”一词的定义应当体现“合为时而变”的特性,从宏
观的角度辩证地说明词典的存在,既反映纸质词典的特性,又适
应词典数字化的事实。给词典下定义并非易事。如果定义过窄,
则不能涵盖所有类型的词典;但如果定义过宽,又不能反映词典
的特质(姚喜明2008:6)。建立词典的宏观认知概念首先应当正
确理解词典的定义。OALD7给“词典”一词下的定义较完整地诠
释了传统词典学和计算词典学的关系,既突出了纸质词典的特
点,又融合电子词典的特征,有利于引导词典使用者建立认知词
典内容的宏观概念。
OALD7中“词典”一词共有三个义项,第三个义项为新增义
项。第一个义项指出“词典”指的是按字母顺序汇集词语,提供
词的释义或词在另一语言中的对应词的书;第二个义项指出词典
是汇集某一领域专业术语,并提供词在该专业领域中的释义的
书;第三个义项为新增义项,指出词典是以电子文本形式存在的
词的集合,该义项意味着数字化科技发展给“词典”一词带来了
新的意义和用法,词典的内涵和外延都发生了变化,把光盘词典、
掌上电子词典、手机词典、网络词典和机器词典等各类电子词典
融入了词典定义的范畴,体现了词典学与计算机科学相互依存而
又相互独立的关系。新增义项完善了词典的概念,突出了计算机
技术对词典编纂方式的影响,在一定程度上体现了“词典”的计
算词典学理念,暗示计算词典学作为一个新的研究分支在词典学
领域的重要性。
数字化环境下,词典信息不再仅仅通过单一的载体形式静态
地存在于印刷版词典中,而是综合应用各种载体动态更新、有机
存在。从完整意义上说,《牛津高阶英语词典》(第七版)应当涵
盖收录于印刷版、光盘版、掌上电子版、机器词典版和网络版等
中的相同和不同的词典信息,以不同载体形式存在的词典信息共
同构成该词典完整的信息。由于网络版的实时更新特点,词典信
息增添了实时更新的动态性。
2、释义和例证的多元化建构
由于受传统印刷版词典存储空间的限制,词条的义项和例证
在数量和内容上受到很大的限制。数字化时代,词典业普遍应用
语料库编纂词典,并通过纸质载体和数字化载体多渠道地表述词
典信息。OALD7建立了多元化提供释义和例证的信息建构模式,
充分应用和体现了计算词典学的理念,通过应用OALD7印刷版、
光盘版、掌上电子版和网络版相结合的形式,使用者可以同时使
用多种词典载体,多层次地获取同一词条的释义和例证信息。通
过抽样对比同一词条在印刷版和网络版词典中的不同释义和例
证信息,数字化科技在辅助词典多元化建构信息中的优势得到了
有力的证明。
“rollover”在印刷版OALD7中以独立词条形式收录,但
提供的释义没有涉及该词在计算机科技领域的意义。在网络版
OALD7中,提供了详细的词性、释义和例证,用以诠释该词在计
算机科技领域的特定含义,网络版词典正文还提供了这个词条的
同义词“mouoversth”,同时开辟专栏,指出“rollover”
是计算机和信息技术领域内的新词,说明这类词语毫无疑问是当
今英语新词的主要来源,每年都有大量该领域的新词产生,而其
中许多以词组的形式存在,还列举了类似的新词,如logon/
off,copysbin(onsth),drilldown,greysthout,pagedown
/up,以及这些词的简单释义和例证。
“google”是一个新词,在印刷版和网络版OALD7的正文中
均提供了该词的词性、释义和例证,但在网络版中增加了两条例
证,同时开辟专栏,指出这个新词的形成和发展过程,揭示了英
语词汇形成的普遍趋势,许多动词短语在新词发展过程中形成,
如googlesbup,googlearoundforsth,同时指出这两个动
词短语的结构源于looksbup和lookaroundforsth这两个
旧有的动词短语。
3、词条收录的全球化语境
全球化是数字化时代的主要社会特征,在全球化的驱动下,
英语作为国际语言正快速产生大量变体。OALD7通过语料库实时
收集英语在全球化语境下产生的各种语言变体,并通过词典信息
建构和反映了英语的全球化语境,其网络版更使得实时收录和实
时查阅英语语言变体发展情况成为现实。
为了全面反映英语语言的全球化语境,OALD7在页面材料中
增设附录R91“世界英语”和附录Rg0“英国英语与美国英
语”。在原有旧版本基础上,OALD7在词条收录上突出体现了对
世界英语变体的反映,增设澳大利亚英语、加拿大英语、东非英
语、西非英语、南非英语、印度英语、新西兰英语等语体标注形
式,收录了1700个世界英语变体词汇,取消美国英语语体标注
形式,把在加拿大、美国等英语国家通用的英语词语归为北美英
语,同时收录大量中国式英语、日本式英语、东南亚英语等英语
变体词汇。
随着汉语热在全球兴起,带有汉语语言色彩的“中国英语”
日益流行。在国际语言学界,中国英语已与印度英语、巴基斯坦
英语、澳大利亚英语等共同成为“世界英语”的组成部分。很多
涉及中国历史文化、传统食品、风俗习惯、社会现象等的中式英
语被收入OALD7正文或“当月词汇”页面,如"English
corner”,该词条指出“英语角”是中国特有的社会现象,每周
五人们会聚集在广场、咖啡馆等地方练习英语口语,在例证中还
提到2008年奥运会期间,北京奥委会的工作人员在工作场所开
辟了英语角;在百科信息中指出,“大量国外游客涌入阳朔,这
里成了中国最大的英语角”,“中国最有名的英语角每周五在中
国人民大学的一个小广场举行,这种练习口语的方式早已风靡全
国”。
数字化科技加快了英语全球化的速度,各种英语变体加快了
变化和融合的过程。在各类英语学习词典中,OALD7在反映和推
进英语全球化语境方面走在前列。
四、OALD7词典信息的数字化建构
1、词条的数字化语用因素
词典是社会的一面镜子,词典词条的收录体现了语言符号与
指称对象之间的联系,记录人类对社会发展的认知过程和结果。
20世纪90年代以来,互联网成了实现经济增长的主要力量,
信息技术成为人类社会生活的核心,大量反映计算机、网络和信
息技术的新语言符号以前所未有的速度产生,反映这一时代发展
的语言符号无疑成了各大学习词典收录的主要对象。OALD7应用
最具代表性的当代英语语料库之一――英国国家语料库快速跟
踪语言发展状况,自动对照、判定、选定和收录词条,客观而真
实地反映了数字化科技与社会发展的关系,快速、全面地记录词
汇产生的数字化认知语用因素。
OALD7词条收录总体上注重体现人类的数字化语用认知过
程,通过新旧语言符号反映计算机、信息科技的发展及其给人类
生活带来的影响。词典收录了“bloatware,bounce,background,
corrupt,charactercode,clone,v-chip”等大量体现计算机
科技的词条,收录“activelist,,dotcom,emoticon,homepage,
HTML,http,MP4,newsticker,outbox,webcam,LAN,Eth-ernet”
等大量体现网络科技的词条,收录“ringtone,SMS,texter,
breakup,pushtechnology”等大量体现手机应用科技的词条,
收录“silversurfer,technophile,phishing,newbie,
netizen”等大量体现数字化生存方式的词条。OALD7在新词收
录上同样注重体现词条产生的数字化语境,词典中新增的2000
多个新词中,与计算机、网络和信息技术及数字化生存方式有关
的居多。
显而易见,OALD7在词典信息建构中注重诠释人类认知数字
化社会的过程。词典借助语言符号反映人类认知数字化新产品、
新时尚、新态度、新工作方式和新社会现象的过程和结果等,进
而推动了人类认知数字化社会的进程,推进社会发展的数字化步
伐。
2、词条收录的实时化特征
在计算词典学编纂理论基础上,OALD7通过各种载体形式共
同建构实时化的新词信息网。
新词可以分为“稳定性新词”、“非稳定性新词”和“一次
性用词”。“稳定性新词”指在特定语域广泛应用、接受考验并
演变为普通词的新词,OALD7新增了2000多个“稳定性新词”。
“非稳定性新词”指在特定语域广泛应用、接受考验并有演变为
普通词的巨大可能性的新词;“一次性用词”指的是高度依赖特
定语域的“极不成熟新词”,甚至是“生造词”,其发展往往很
不稳定,但在很大程度上昭示着语言发展的可能性,是动态语言
信息的一部分(王馥芳2004)。由于传统印刷本词典在新词收录
方面所受局限很大,所以大多收录的是“稳定性新词”;而网络
词典由于容量大、更新及时、动态性强,改变了词典存在的方式,
扩大了词典的概念,满足了词典收录“不稳定性新词”,甚至是
“一次性用词”的需求。
全球化、数字化的社会背景下,新词语涌现速度加快,语流
中存在着大量“不稳定性新词”和“一次性用词”,OALD7没有
设计专门的“一次性用词”的语体标注,而是通过OALD7网络正
文和“当月新词”专栏,收录“不稳定性新词”和“一次性用
词”,上传通过语料库收集、整理、提取的最新词汇,提供因印
刷版容量限制而无法收录或最新产生的一些新词,如
“cybersquatting,glocaliza-tion,podcast,caucHs,
twitter”等。“podcast”是2004年产生的新词,它的
中文译名尚未统一,但最多的是将其翻译为“播客”。OALD7通
过网络版正文提供了“podcast”一词的发音、语法信息、释义、
例证、词源信息等,指出该词产生于2004年,是在“iPodTM”
基础上合成的一个词,该词可作名词和动词用。“cauclis”一
词产生于2008年美国总统选举这一社会背景下,OALD7通过“当
月新词”专栏收录该词,并提供“Obamasupportersneedto
attendcaucusheldonFebruary5th,”等例证,这些例证
选自实时更新的语料库。印刷本OALD7收了“twitter”一词,
但只提供“小鸟的鸣叫”一种释义,也未提供例证;网络版OALD7
在词典正文中收录“twitter”,增加释义,指出“twitter”是
微博的典型应用,并提供了两个相关例证;“当月新词”页面提
供了“twitter”的多个例证和丰富的百科信息,以及该词最新
的应用情况说明,并以美国总统BarackObama竞选时充分利用
微博这一事实为例,引出“twitter”的名词“twitterer”和固
定搭配“twitterthrough”等。
从这些典型例子可以看出,OALD7通过不同载体为词典使用
者实时地提供新词信息。
3、释义和例证的语篇化趋势
由于存储空间的扩展,网络词典提供释义和例证的形式产生
了明显的语篇化趋势,许多词条在提供释义的同时还附上了语篇
化的解释或百科信息,如“caucus”一词,除提供该词的新旧释
义和例证外,还在例证后附上了长达200字的解释。“text
messaging”在印刷版中作为“textmessage”派生的短语收
录,所提供的信息也很简单,它在网络版OALD7中以独立词条形
式收录,提供了详细的词性、释义和例证,并开辟专栏以语篇的
形式诠释该词条在信息科技领域的应用情况。
网络为词典提供了大容量的信息储存空间,使得词典的释义
和例证开始呈现语篇化特点,提供丰富而翔实的信息,帮助使用
者更透彻地理解、更准确地使用词汇。
五、结语
OALD7是数字化时代权威高阶英语学习词典的典型代表,反
映了这类词典的发展趋势。这类词典广泛应用计算词典学的编纂
理念,借助数字化技术,采用多元、动态、多维和实时的模式建
构词典信息。词典编纂者只有认可宏观的认知概念,把印刷版、
光盘版、掌上电子版、手机版、机器词典版和网络版词典等作为
一个完整的整体,才能科学应用、分析、研究和编纂适合数字化
社会发展的高阶英语学习词典。
目前,在词典信息的数字化建构模式方面,国内自主编纂出
版的双语高阶学习词典还相对滞后,多数还停留在印刷版的发展
阶段,这些词典的数字化大多也只是把印刷本内容以数字化的形
式存储,在通过网络实时收录、更新信息等方面的发展尤其缓慢。
只有大力加强计算词典学编纂理念的应用,建立词典信息的宏观
编纂模式,才能加快推进自主研编词典的科学性,改变国外权威
高阶英语学习词典一统中国英语学习词典市场的局面。
本文发布于:2022-11-26 08:23:46,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/90/23945.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |