汉英学习型词典中动词“提升”的类联接信息表征研究
作者:曾利 陈丛梅
来源:《辞书研究》2020年第02期
摘要類联接是语法层面的组合关系,是二语词汇学习的一项重要内容,文章以“提升”为例,尝试构建汉英学习型词典中动词词目的类联接信息表征方式。首先,采用中介语对比分析法,得出汉语学习者“提升”一词的类联接习得现状;其次,考察三部汉英学习型词典和三部英汉双解学习型词典的类联接现有处理方式;最后,借鉴英汉双解学习型词典类联接信息表征方式,尝试采用“类联接+真实例证”的方式,构建动词义项“提升”的微观结构,希望为汉英学习型词典的编纂提供一些启示。
关键词类联接《汉英学习型词典》语料库“提升”表征
一、 引言
类联接(colligation)最早诞生于伦敦语言学派对于“意义的情境化”研究(庞双子2014),这一术语首先由Simon(1953)提出,后经Firth等语言学家发展并逐渐为学界所关注。Firth(1957)认为,语法关系涉及一些抽象的语法形式,如在句子“I watched him”中,类联接涉及人称代词,即第一人称主格单数形式I、第三人称宾格单数形式him和及物动词watch的过去时态-ed等语法关系,它们或隐含或直接呈现该肯定句中的语法类别和语法范畴之间的内在联系,这些联系即为类联接。Mitchell(1975)认为,词语搭配不
仅要考察词项间的共现,还应考察词项间相互结合的语法结构或框架。类联接是关于词语组合类别的抽象表述,搭配则是类联接在词语层面的具体实现,所以由具体的词语搭配可以提炼出语法层面的类联接形式,如“读书”“看报”等这类动宾搭配可以抽象出共同的类联接形式: 动词+名词的搭配组合。
类联接描述词汇在语法层面的组合关系,在词汇教学中加入类联接信息可有效帮助学习者提高语言产出能力。此外,类联接信息也是学习型词典设计特征中的必要信息类型之一。(赵连振2017)现有许多英语学习型词典或英汉双解学习型词典都在微观结构中直接表征了词目的类联接信息,而汉英学习型词典还鲜有表征汉语词汇类联接形式的编纂先例。汉英学习型词典作为汉语学习者的重要工具书,也有必要表征汉语词汇的类联接信息。另一方面,与英语语言相较而言,汉语语言是一种动词性语言(刘丹青2014),汉语动词优势明显,使用比例较高。因此,本文基于语料库,以汉语动词“提升”(《汉语水平词汇与汉字等级大纲》丁级词)为研究对象,通过考察汉语学习者“提升”一词的类联接习得现状和现有汉英学习型词典中该动词词目的描写情况,借鉴目前英汉双解学习型词典的类联接信息处理方式,探索汉英学习型词典中该词目的类联接信息表征方式。
二、 基于语料库对动词“提升”的类联接习得现状分析
汉英学习型词典的编纂目的是满足母语为英语或其他语言的词典用户的语言编码需求,需以学习者的水平和特点为导向。本文以汉语本族语者的类联接特点作为参照,分析汉语学习者与汉语本族语者使用“提升”时的类联接形式差异,揭示汉语学习者“提升”一词的类联接习得情况。
(一) 研究问题
本研究采用中介语对比分析法(Contrastive Interlanguage Analysis),将北京语言大学创建的“HSK动态作文语料库”(以下简称“HSK语料库”)作为研究语料库,以“国家语委现代汉语语料库”(以下简称“语委语料库”)作为参照语料库,对汉语学习者和汉语本族语者使用“提升”一词的类联接形式进行考察,主要回答以下问题:
1. 汉语学习者使用“提升”一词的类联接特征是什么?
2. 汉语本族语者使用“提升”一词的类联接特征是什么?
3. 汉语学习者和汉语本族语者在“提升”一词的类联接形式使用上有何差异?
(二) 研究工具与方法
本研究使用的语料库为HSK语料库,是母语非汉语者参加高等汉语水平考试(HSK高等)作文考试答卷语料库,收集了外国考生的作文答卷11569篇,共计424万字;参照语料库为语委语料库,作为一个大规模的平衡语料库,其语料选材类别广泛,时间跨度大(1919—2000年),共计约2000万字。本研究采用HSK语料库提供的在线分词和词性标注功能进行生语料的分词和词性标注。
研究所采用的语料库分析软件是日本早稻田大学Laurence Anthony教授开发的AntConc3.5.8。另外,还使用了Chi-square Calculator(梁茂成,李文中,许家金2010)来计算汉语学习者和汉语本族语者在“提升”一词类联接形式上的差异是否显著,具体值为: 卡方值(χ2,自由度为1)如果大于临界值3.83、6.64和10.83,则表明该值在显著性水平0.05,0.01和0.001的情况下具有统计学意义。显著性有以下三种判定标准:
1. 当0.01≤p≤0.05, χ2>3.83时,便认为差异是显著的(用*表示)。
2. 当0.001≤p≤0.01, χ2>6.64时,便认为差异是很显著的(用**表示)。
3. 当p≤0.001, χ2>10.83时,便认为差异是相当显著的(用***表示)。
具体研究步骤如下:
1. 从HSK语料库和语委语料库检索并导出“提升”一词的相关语料。
2. 通过人工分析,将HSK语料库和语委语料库中“提升”名词义项的索引行进行剔除。
3. 用Excel工作表进行语料整理,对于HSK语料中的熟语料,删除其标注,使其还原为生语料。
4. 使用HSK语料库提供的在线分词和词性标注功能对生语料进行分词和词性标注,然后逐个检查处理好的语料,按照《现代汉语词典》第7版中的相关词汇信息对部分分词或词性标注错误的词汇或句子进行人工校对。
5. 将处理好的语料分别按HSK语料库和语委语料库存成两个文本文件,分别导入语料库分析软件AntConc3.5.8。
6. 先利用AntConc3.5.8的词丛(Clusters)功能检索出“提升”周围的词丛列表,然后在Excel工作表里统计两个语料库中每类类联接形式的数据,再用Chi-square Calculator计算差异值。
7. 利用AntConc3.5.8的搭配(Collocates)功能分别检索两个文件中“提升”的左右搭配词并进行记录。
(三) 研究结果与讨论
以“提升”为节点词,从HSK语料库和语委语料库中检索得出:“提升”在HSK语料库和语委语料库的出现频次分别为59次和71次,剔除“提升”名词义项的索引行,整理出动词“提升”在HSK语料库和语委语料库的使用频数分别为46次和52次。借助AntConc3.5.8和Excel工作表进行检索和归纳分析,得出动词“提升”在两个语料库中的类联接形式(见表1)。
说明:
1. V=“提升”;v=动词;n=名词或名词词组;q=数量短语;c=连词;adv=副词;pron=代词;prep=介词。
2. 其他形式1(在语委语料库中未出现): “v+n+V”(频数=2,百分比=4%)、“V+adv”(频数=1,百分比=2%)、“v+V”(频数=1,百分比=2%),因频数太少不统计差异。
3. 其他形式2(在HSK语料库中未出现): “V+pron+为+n”(频数=3,百分比=6%),“V+v+n”(频数=1,百分比=2%),“V+pron”(频数=1,百分比=2%),“prep+n+V”(频数=1,百分比=2%),“V+c+n”(频数=1,百分比=2%),“adv+V+v”(频数=1,百分比=2%),因频数太少不统计差异。
经分析发现,在HSK语料库中,“提升”有八类类联接形式: “V+n、adv+V、V+为+n、V+q、V+到+n、v+n+V、V+adv、v+V”,总体而言,汉语学习者更倾向使用“V+n”(59%)[如例(1) ],偶尔使用“adv+V”(15%)[如例(2)]和“V+为+n”(9%)[如例(3)],很少使用“V+q”(4%)、“V+到+n”(4%)、“v+n+V”(4%)、“V+adv”(2%)和“v+V”(2%)。
V+ n:
(1) 现在我又修读有关设计的一些课程,希望借此提升我的设计水平。
adv+ V:
(2) 烟的价格年年提升,可仍吸引了无数人浪费钱去买它。
V+为+ n:
(3) 我在推销方面有过不错的成绩,曾被提升为推销小组组长。
在语委语料库中,“提升”出现了11类类联接形式: “V+为+n、V+到+n、V+n、V+q、V+pron+为+n、adv+V、V+v+n、V+pron、prep+n+V、V+c+n、adv+V+v”,其中,汉语本族语者通常使用V+为+n(37%)[如例(4)],偶尔使用“V+到+n”(19%)[如例(5)]和“V+n”(15%)[如例(6)],较少使用“V+q”(8%)、“V+pron+为+n”(6%)、“adv+V”(6%)、“V+v+n”(2%)、“V+pron”(2%)、“prep+n+V”(2%)、“V+c+n”(2%)和“adv+V+v”(2%)。因类联接形式“V+为+n”(37%)、“V+到+n”(19%)和“V+n”(15%)使用频率较高,故将它们判定为主要类联接形式。