2023年12月31日发(作者:自信作文600字)
第06讲意义理解
导语
假若您是一位来厦门旅游的远方客人,带着笨重的行礼刚走下火车。如果此时有位机器人主动上前用流利的汉语询问你:“先生,您好!我叫郝仁,是“帮一把”型机器人,如果你需要帮助的话,请您尽管吩付,我愿为您效劳!”然后你不必知道任何有关机器人的操作指令,就可以直接用汉语指示机器人做任何事,那该多好啊!
是的,能用汉语等这样的自然语言,直接指示机器人为您工作,一直是人类梦寐以求的事情,但前提就是我们必须拥有能够理解听懂人说的语言的机器系统!而要使机器具备语言理解能力并非是一件轻而易举的事情,这其中会涉及到几乎人类心智和文化的所有方面。因此语言理解能力也就成为智能的基础,从而实现这一能力进一步成为人工智能研究的一个重要目标。
美国和在他们合著的一部书中指出:“(对语言的理解)涉及智力的许多方面:辨词,断义,按语法分割意群,将意群组合成句,推测各段陈述间的联系,在处理后面的内容时依旧记着前面的内容,推测作者或演讲者的意图,总结出段落大意,以及在回答关于某段落所提问题时记忆的检索。”可见语言理解是一项十分复杂的智力活动。本讲就是专门讨论语言的理解问题。
第6.1节诗歌解读
为了能够一开始就对语言意义获取的困难有一个直观的了解,让我们首先从汉语诗歌的意义解读开始我们的讨论。下图是宋代大学士苏东坡写的一首“晚眺”图解诗。
据《回文类聚》卷三记载:(宋)神宗熙宁间,北朝使至,以能诗自恃,以诘翰林诸儒。上命东坡馆伴之。此使乃以诗诘东坡。坡曰:“赋诗,亦易事也,观诗稍难耳。”遂作《晚眺》诗示之,北使惶惶不知所云,自后不复言诗矣。
这一故事是否确有其事现已不得而知,但这首“晚眺”却给语言的理解提出了一些重要而有
趣的课题。
由于这首诗的妙处在于图文相掺,须按图解读,将语言理解与元语言指示混合方能概全诗文。《晚眺》诗解读的内容实为:
长亭短影无人(士)画,
老大横拖瘦竹筇;
回首断云斜日暮,
曲江倒蘸侧山峰。
这不但充分体现了语言的绝妙;而且也有力说明理解语言并非是一件轻而易举的容易事。
记得还是这位大学士苏东坡,传说他有一个妹妹叫苏小妹。有一次,苏东坡同他的朋友佛印和尚谈论佛理,佛印高谈快论,大肆宣染佛法无边。此刻躲在帘后的苏小妹听了很不以为然,便有意要捉弄一下这位大言不惭的和尚,于是写了一幅上联讥讽挖苦佛印和尚,让使女拿去让佛印对下联:
人曾是僧,人弗能成佛
佛印看了上联,知道苏小妹的用意,便随手对出了下联:
女卑为婢,女又可称奴
反而把苏小妹给捉弄了一番。
有时,这种元模式转绎需要跳出语言之外,比如在理解著名童话小说《爱丽丝镜中世界》中这首诗歌,就是这样:
'Twas brillig,and the slithy toves
Did gyre and gimble in the Wabe:
All mimsy were the borogoves,
And the mome raths outgrabe.
可见语言理解中文字解读在完成意义合成中所起作用,是离不开某种元模式语境机制的。也就是说,你只有跳出语言层次,站到元语言角度去看待它,然后再将元语言获得的理解信息,并入语言层次理解信息的洪流中,才能意合出完整的阅读效果。这里元语言指的是那种对语言单位本身进行描述的语言。这种对元模式机制的依赖,就是意义理解的第一个困难。
有一个古老的字谜为:“上头去下头,下头去上头,两头去中间,中间去两头”(谜底是“至”)。同样,要想猜出谜底,你也要作一种元模式转绎,即对“去”的解读既要看作是语言层次的动词“去”,又要看作是被处理的元语言名词“去”。也就是说要将“上头去下头”理解为“上头“去”去下头”,其它也一样。
实际上,前面一开始讲到的“晚眺”诗也当如是解。比如说,“亭”字写得长所以读作“长亭”,“影”字写得短所以读作“短影”,如此等等,你需要对文字进行元模式转绎。
因此,在语言理解的完整考察之中,首先必须解决这种文字解释机制的实现问题,然后才是“正规”的从音到词,从词到句,再从句到篇的语言理解问题。
除了上述的文字解释机制的实现问题外,对于诗歌这样的语言意义的解读,还有一个更为困难的隐喻意义的转绎问题。应该说,对隐喻的领悟能力,反映的是人类心智活动的一种根本属性,也是一种特殊的诗性元模式转绎能力,需要的是洞察力、理解力和领悟力,因此
不仅在语言理解中是如此,其它如在音乐、绘画和诗歌等艺术欣赏活动中无不如此。
只是诗歌中的隐喻之意就更是深厚凝重了。欧阳修的《蝶恋花》词云:“庭院深深深几许?杨柳堆烟,幕无重数。玉勒雕鞍游冶处,楼高不见章台路。雨横风狂三月暮。门掩黄昏,无计留春住。泪眼问花花不语,乱红飞过秋千去。”读诵之间,不禁就有心泪涌动之感概。词语能打动人,不在语浅而在隐喻深,由此可见一斑。
只是诗歌中的隐喻之意就更是深厚凝重了。欧阳修的《蝶恋花》词云:“庭院深深深几许?杨柳堆烟,幕无重数。玉勒雕鞍游冶处,楼高不见章台路。雨横风狂三月暮。门掩黄昏,无计留春住。泪眼问花花不语,乱红飞过秋千去。”读诵之间,不禁就有心泪涌动之感概。词语能打动人,不在语浅而在隐喻深,由此可见一斑。明代学者袁宏道对此有过精辟之论:“世人所难得者唯趣。趣如山上之色,水中之味,花中之光,女中之态,虽善说者不能下一语,唯会心者知之。”对艺术作品中隐喻的领悟同样也是如此。
隐喻,不管出现在什么艺术形式中,一个最基本的特点就是含糊性,而这恰恰是精确严密的逻辑形式系统所不能容忍的。本世纪50年代中,美国逻辑学家王浩通过将数学归纳法应用于“小的”这一含糊概念性质,就导出了一个“悖论”:
(1)1是一个小的数
(2)如果n是一个小的数,那么n+1也是一个小的数
(3)所有的数都是小的数
问题出在哪?问题恰恰出在“小的”是一个含糊概念。隐喻理解的困难之处就在于此。
对诗歌语言理解更高要求是,要能够做到对理解的内容下一转语,给出其引伸或隐喻的另外一种说法。典型的下转语的例子就出现在唐代著名比丘尼无尽藏的《悟道诗》中:
终日寻春不见春,
芒鞋踏破岭头云。
归来偶把梅花嗅,
春在枝头已十分。
你是否明白其中玄旨?
明代李卓吾在评点《西游记》第一回写樵夫回答猴王打听神仙住处时所说的话:“不远,不远。此山叫做灵台方寸山。山中有座钭月三星洞。”时指出:“灵台方寸,心也,钭月象一勾,三星象三点,也是心。言学仙不必在远,只在此心。”便是领悟吴承恩原旨而下的转语。
我们常说善读书的人是善于把握书中的言外之意。我们之所以认为读书重要,也就是指书中所阐述义理的重要。正所谓《庄子·天道》中所说的:“世之所贵道者书也,书不过语,语有贵也。语之所贵者意也,意有所随。意之所随者,不可以言传也,而世因贵言传书。”而想要领悟这超然言外的意义,就须要有人生的体验,只有在细读人生大书之中,体会深刻,才能“意会”那些“言传”的不尽之意。
确实,正象圣·托马斯·阿奎那认为的那样:“借助于概念的类比特性,人具有意指上帝的语义能力。” 瑞士神学家H·奥特在《不可言说的言说》中也指出:“对象征的体验使我们获得对不可说的真实的体验。因为正是在象征之中并且通过象征,在我们之间实际产生了对语言界限彼岸的理解。” 而对这种理解他又进一步认为:“它们源自某种东西,并趋于某种东西,源自不可支配的真实,并趋于不可支配的真实。” 这样就把语言的不可言说的指的,可以类比到天文学中的黑洞之上,看作是一种语言“黑洞”,它存在但却看不见(不可言说),你只有通过可见物质(可言说的言辞)来测定这不可见“黑洞”的存在。
惠洪在《临济宗旨》中指出:“心之妙不可以语言传,而可以语言见。盖语言者,心之源、道之标帜也。标帜审则心契,故学者每以语言为得道浅深之候。”比如在如下公案中,你能体悟到那个语言黑洞吗:
僧问:“指即不问,如何是月?”(文益禅师)师曰:“阿那个是汝不问底指?”又僧问:“月即不问,如何是指?”师曰:“月。”曰:“学人问指,和尚为什么对月?”师曰:“为汝问指。”
当然,一旦你领悟了那奇妙的言下之意,你便进入另一种全新境界,打开的是通向全新境界的大门!卡尔·雅斯见斯说过:“语言终止之处,阐释便到尽头。阐释在沉默中完成。然而只有通过语言才可达到尽头。”(《宗教:如果没有上帝…》)。于是你只能将语言的言说看作是某种象征,在这种象征中,通过种种思想冲突的感悟,理解才能实现。它能使我们突破语言的界限,并在语言终止之处沟通思想。
第6.2节语言处理
如上所述,尽管对语言意义的获取有着种种难以逾越的困难,但是人工智能研究者们还是在语言的机器理解方面开展了大量的研究工作,这样的研究,统称为自然语言理解。就汉语而言,目前的研究内容主要包括词语切分与标注、句法语篇分析、歧义消解等多个方面。为了突出意义理解这一核心问题,我们分别从意群分割、句法分析以及歧义消解三个方面来介绍自然语言处理主要问题及其处理方法。
首先就是多尺度意群分割问题。所谓意群,指的是我们的语言所表达的思想,都是通过一群相互关联一起的意义单元体现出来的,而这些意义单元根据其所处语言片段的角色,有大有小,因此意群分割也就有一个多尺度问题。
实际上,语言理解就是一个“依篇断句,析名分词”的过程。小到音节的切分,大到段落划分,无不贯彻着这样一个中心问题。因此不管是用耳朵听读,还是用眼睛看读,这一过程的核心问题都是要根据语言的运用规律,层层分解不同尺度大小的语言单元,简称语元,然后在这些不同尺度层次的语元及其相互关系中来理解整个语篇的思想内容。而这其中层层分解出不同尺度的
语元,就是语言理解中的意群分割问题的任务。
过去,我国文言文不用标点符号,句读成为断句破文的重要技巧。例如,从前有一老汉老年得子,耽心死后女婿抢夺儿子的家产,于是留下遗嘱:“老汉八十生一子,人云非是我子也,家产事业均属予女婿,外人不得争执。”待儿子长大后,他按照老汉临终前的嘱咐,到官府告状说遗嘱原意是:“老汉八十生一子,人云非,是我子也;家产事业均属予,女婿外人不得争执。”结果老汉的儿子终于要回了应由自己继承的遗产。
如果利用现代汉语丰富的标点符号来解读古代诗词,那么会引出更有意思的结果来。比如唐代诗人杜牧的“清明”,原是一首七绝诗:
清明时节雨纷纷,
路上行人欲断魂;
借问酒家何处有,
牧童遥指杏花村。
不同的句读可形成一首散词:
清明时节雨,纷纷路上行人,欲断魂。
借问酒家何处?有牧童,遥指杏花村。
更有甚者,当你可以毫无节制地引入各种标点符号时,又可变其为一则微型戏剧:
[清明时节][雨纷纷]
[路上]
行人(欲断魂):借问酒家何处有?
牧童(遥指):杏花村!
可见,句读,也就是意群分割的重要。
其实,不仅对于古代汉语意群分割中这种多重性解读十分突出,即使对于现代汉语,如果你着手的是语词分割问题时,那么由于再也没有标点符号和空格可资利用,这时同样也会存在多重性歧义分割问题。特别是,原则上不同尺度意群分割之间存在着非常相似的规律,因此这种歧义性分割问题也是具有普遍性的现象。
实际上,这样的认识在我国的语言学家朱德熙的《语法答问》中早就有过明确的论述。朱德熙认为汉语句子的构造原则跟词组的构造原则基本上是一致的,因此他明确提出了以语词为基点的语法体系。对于意群分割问题,这就意谓着只要能够解决语词切分问题,那么就能够打下语法分析的基础,而其它尺度上的意群分割,也就可
以通过语词意群的语法组合和语境制约来实现。
那么,又如何进行语词意群分割呢?在语言理解研究中,语词意群分割的任务就是要从构成语句的语词层次开始,逐级地划分出全部语元并建立起反映层次关系的联系。例如,对于语句“帮助二春去照应照应大家伙儿。”下图便是反映这种要求的意群分割结果。这其中最关键的便是一个个语词的切分问题。
帮助二春去照应照应大家伙儿。
对于机器来说,如果我们已经建有一个完全的机器词典,其中收录了全部可用语词,那么最简单的机器语词切分方法就可以采用最大语词匹配策略来进行。这种方法通过依次读取语句中的汉字,并当汉字串积累到最长且构成为机器词典中可接受的语词,那么就将该汉字串作为一个语词对待,然后再从语句余剩的汉字流中如法去分割下一个语词,如此等等,直到语句结尾,就完成全部语词级的切分工作。对上面例子就是用最大语词匹配法来切分得到的结果。采用这种方法,对于比语词大的意群语元划分,则归于语法分析去完成。
很明显,由于语词搭配多种可能选择的存在,这种最大匹配切分方法虽然能够保证切分出来的语词均是合法的,但却不能保证这种切分结果是在句法上是合理的。例如对于“他的确切意图是什么?”按照最大匹配切分法结果为:
他|的确|切|意图|是|什么|?
而合理的应该是:
他|的|确切|意图|是|什么|?
尽管对于“他的确切菜了”能保证正确分为“他|的确|切|菜|了”。
语词切分的歧义性问题是普遍存在的。例如“这个故事太|平谈了”、“请将|军用毛毯盖在她身上”、“美国|会采取行动制裁伊拉克”、“该研究|所得到的奖金很多”等俯拾皆是。而歧义性语词切分只有在一定的语境考察下才能够得到正确的切分,仅靠机械的最大匹配显然是不能彻底解决语词的切分问题的。当然,为了利用语境上下文制约的关系,我们可以通过对所有可能切分作最优选择的策略来进行语词的切分。
遗憾的是,有时词语关联的确定还会依赖于更高层次意义的理解,也就是说只有在理解了整个语句之后才能够确定语词的分割。这样由于更高层意义的理解反过来无疑又是要依赖于分割好的语词的,于是就有一个语词分割与语句整体意义理解相互依存的问题。因此,如果在这基础上,再进一步考虑跨层次相互作用问题,那么意群分割看似一个小问题,实际却是动一牵百的大问题,甚至与整个语篇的理解密不可分。
于是,想要解决意群分割问题,我们就离不开意义的整合问题,而意义的整合问题,反过来又是以意群分割为基础的。在语言理解的机器实现研究中,为了避免这种无谓循环,往往采用在一种初步的意群分割之后,再考虑面向意义的句法分析。
如果说意群分割是一种自下而上的理解步骤,那么句法分析便是一种自上而下的理解步骤。二种步骤的相互补充递进,也许就可以在某种程度上突破那种“无谓循环”的桎梏,走出语言理解的困境。问题果真如此吗?那么机器又是如何面向语义来进行句法分析的呢?1968年,美国语言学家re提出的格语法无疑为此打开了一丝光亮。从而引发了一场面向语义进行语句分析的浪潮。
面向语义进行语句分析,就是要通过语句中语词关
系分析,建立起语词之间的各种语义联系。比如在“我开门”中,“我”是“开”的实施者,“门”是“开”被施者。在这个简单句子的理解中,你只有建立起“我”、“门”和“开”之间这种正确的语义关系,你才能够真正理解这一句子的意义。而这种建立语义联系进而理解句子意义的能力是每一个语言掌握者所具备的基本能力。
从属关系语法的创始人特思尼耶尔(re)在《句法结构的要素》(Elements de syntaxestructurale)中就强调:“所谓造句,就是建立一堆词之间的各种关联,给这一堆词赋予生命;反之,所谓理解句子,就意味着要抓住把不同的词联系起来的各种关联。”基于这样的原则,在格语法提出以后,作为一种直接发展的结果,1973年美国耶鲁大学的科学家提出了一种概念依存语法理论,并在机器理解语言的研究中广泛被应用采纳。概念依存语法的句法分析方法首先是找出语句中的主名词和主动词,形成一个初步的语义结构,然后通过在语句中寻找所需要的其它成份来不断完善这一语义结构,最后给出语句所反映出来的概念依存网络。例如,对于语句“日本海沿岸多雪”,以“多”为中心词的概念依存分析可表示为:
日本海沿岸多雪
依存定语依存定语依存主语依存宾语
这就给出了“日本海沿岸多雪”语句的语义结构。
看得出来,只要定义足够反映语义依存关系,那么通过概念依存关系的确定,是能够有效地得出语句所对应的语义结构的,并表示为机器内部可以处理的形式。概念依存理论注重的是语言成分之间的外部联系,强调语句中各成分之间存在的功能关系。而这些功能关系又是以主名词或主动词为中心建立起来的,这样就突出了中心语词在语句语义结构中的中心作用。这便是中心词驱动语义分析理论的滥觞。
面向语义的语句分析和理解方法,虽然能够有效地解决语句句法形式到语义结构形式的转换,但有时,我们发现有些语句尽管违犯了规则,但我们仍能理解它们。对于这种情况,显然靠这种规则性成份分析是无济于事的。另外,如何确定中心词选择问题本身会再一次将我们卷进“先有鸡还是先有蛋”的泥潭之中。不过,值得欣喜的是,我们起码在一定范围内可以让机器在语言理解中显显身手了。
当然上述句法分析的有效性给予这样一个前提,就是我们的语言是无歧义的。我们十分清楚,对于严格的形式语言,机器可以很容易实现不同语言之间的相互转换。因此如果我们能够设计一种表示语义的形式描述语言,其满足无歧义性、具有简单的解释规则和推理规则以及具备由语句形式确定的逻辑结构,那么我们就可以通过定义良好的形式语言(比如某种逻辑系统)来确切地表述出给定自然语言语句的语义,只要自然语言的语句含义是无歧义的就行。
但事实上,没有哪种自然语言是不存在歧义现象的,甚至可以说歧义现象是自然语言的一种固有属性。因此,要想解决语句的语义分析,从而可以用形式语言来描述自然语言语句的语义,就不可避免地要解决语言的歧义消解问题。可见在机器的语言理解研究中,不仅不能忽视或回避语言的歧义现象,而且还应将歧义现象的研究和处理作为更重要的课题来研究。因此可以说,如果没有对语言歧义现象有全面深刻的认识和把握,要想实现机器的语言理解是不可能的。
通常语言歧义的表现形式有三类,即模糊、双关和选择。模糊歧义是指语言表达内容时含糊不清而造成的歧义,往往是说写者连自己也不能明确所要表述的观念为何,或者是因无谓的同义反复、无益的语辞矛盾或明显的语焉不详所致。例如“狗给狼吃了”(到底谁吃了谁?)、“明天晴天,别忘了带雨伞!”(晴天带雨伞,莫明其妙)、“王守信全家红”(是得彩了呢,还是成了红人?)之类,都是模糊歧义的例子。
双关歧义则是指多种意义的同时关联,融合成为或暗有所指、或一箭双雕、或蕴意深刻等效果的言辞表述。例如推销皮鞋油的说:“一流产品,为足下争光”、情人的“藕断丝连”、歇后语“竹蓝子打水(暗指一场空)”等等。
选择歧义与双关和模糊歧义都不同,指的是语言中有多种明确独立相互排斥的意义选择可能,每种选择的意义并不模糊。例如“我们三个一组”(要么“我们|三个一组”要么是“我们三个|一组”)、“女子理发店”(要么是“为女子理发的店”要么是“女子开的理发店”)、“有的作品写年轻的妻子死了丈夫发誓不再结婚”(要么是“丈夫死了,妻子发誓”要么是“妻子死了,丈夫发誓”)、“白头翁死了”(要么是人死了、要么是草死了、要么是鸟死了)等都如此,有多种意义可供选择,并选择了一种就排除了其它选择可能。而每种选择可能的意义又都是明确无歧的。
由于能够左右歧义确认的外界条件主要是语境,因此对歧义语句的理解,只有联系语境才能正确把握其正确意义,而仅靠句子本身的结构成分及其组合意义是不够的。为了使机器也能够进行歧义消解工作,就必须有一种强调语境条件的语义分析方法。美国语言学家e和提出的情境语义学正是基于这种要求而产生的一种语义分析新方法。跟传统语义的解释模式比较,新方法强调的正是语境条件的参与。这样对语句的理解就不仅仅是“意义表达”及其真假取值(指称真值)的结合,而是“意义表达”与在一定的语境条件(前提)参与下得出的真假取值的结合。
用语境条件下的语义解释模式可以处理歧义语句的机器理解中的非模糊类的歧义问题,方法是对多种歧义理解可能分别用逻辑表达式表示,然后形成“与”(代表双关歧义)“或”(代表选择歧义)联式,最后利用语境条件式来推演,取联式真假值为真的某个逻辑表达子式为其结果。如果结果为真的子式不唯一,则表示在此语境条件下也不能完成歧义消解。
不过,话又说回来,语境可以消歧是有一定限度的。我们常常把能够将有歧义的语元确定其意义的语境,称
为该歧义语元的自足语境。这样我们就会发现,有些歧义语元常常是不存在确切的自足语境的。特别是由于任意语元都具有潜在含义的可能性,只要提供特定的语境就可使这种潜在意义显现出来。例如就“胡说八道”这样无歧义性的语词,到了“我有一位同学姓胡,我问他一共设了几道关卡,胡说八道。”这一特定的上下文中,“胡说八道”就不再是“胡说八道”的原义了。这样一来,即使通过语境确定歧义性的情况,我们照样还可以设置更大的语境,使其消失的歧义重新再现显出来。
总之,语言意义的不确定性、对语境的敏感性,是自然语言最重要的功能表现,而歧义的产生也是诸种因素相互作用过程中处于不同动力学制约下状态冲突的、必然会出现的现象。言传与意会之间、思想与现实之间以及语言表达能力与表达内容认识之间等等的不一致性,都会成为歧义产生的源泉。甚至我们还会有意地利用歧义现象来表达特定场合下的思想和情感,以达到一定的目的。
当然,大多数歧义是可以通过语言的或主观的语境条件来消除,这也是人类语言理解能力最有效、也最基本的机制之一。因此,对于语言理解的机器实现而言,重要的不是寻找语境来使语言不含有歧义,而是要在给定的语境中来理解歧义的语言。自然语言的理解,说到底就是一种解释,将歧义的语句通过语境条件作用得出其尽可能确定的意义,或者同时保留多种关联或选择的意义,并用机器可以严格无歧义处理的形式加以表述。
第6.3节意义领悟
机器能够处理的与机器难以处理的,就语言现象而言似乎是十分泾渭分明的,那就是关于意义这条鸿沟。凡是不涉及意义问题的符号化形式处理,机器都能够“得心应手”加以快速有效地处理;反之,凡是需要意义参与的非形式化处理,那么机器似乎就必定限于困顿之中。情况之所以如此,就是因为意义的主观解释性。
语言理解是一个十分复杂的问题,任何局限
于句法分析或逻辑描述的解决方案都是不全面的。因为语言的意义理解不仅仅是一个客观的过程,更主要的是一个自始止终都有主观心理参与的过程。或者说,任何语言片段的理解过程,要将其组构为一致连贯的意义整体,都需要从某个立场或观点出发,这便离不开解读者主观心理以及主体知识结构的参与。正因为这样,理解也是一种再创造活动,是一定主观参与之下的某种“误解”。
打个不是很贴切的比方,语言理解就好比观看图案,其中误解就好比观看图案时所会产生的错觉。在视觉错觉中,尽管得到的往往并非是真实的反映,但有时错误的理解也很有意义。特别是即使对无错觉图案的观看,原则上讲,也都或多或少带有某种主观色彩的“歪曲”,因此都具有某种“错觉”效应。因此,在语言理解中,“误解”反而是正常的,精确再现原旨只是“误解”的一种特例而已。
当然主观心理对意义的理解作用还不仅仅体现在误解之上,有时我们在理解语言时,对于语辞中显露出的意义真空,还会主观地漫为填补,甚至蓄意夸张,使原有的意义迅速膨胀起来。美国生物学家卡尔文在《大脑如何思维》中形象地说明了这种现象:“当我们只是隐约听见什么时,我们总是用猜测把细节填满。在风中吱吱作响的窗户,听起来也挺象你的小狗在向你发出要食的哀鸣,从而使你以为听到小狗的叫声。一旦这种记忆被唤醒,真实的声音可能很难重现——由记忆填满的细节变成了所感知的现实。”
当然,有时心理意向往往还会被一种特定文化所“催眠”,使得人们会按照一种文化通行的价值体系去理解语言内容。此时主观心理的主动性也就受到我们所处的社会文化所影响了。因此,确切地讲,任何意义的产生都离不开一定文化背景下的理解者参与,而作品的解读核心便是作者内容与读者理解相互作用的结果。应该说语言的一切理解都是主观解释,而解释就是一种解释者积极参与的过程。
总之,在意义的解读过程中,涉及到语言与解读者相互作用问题,由于这种相互作用的结果的不可预测性和主观性,目前机器难以企及的。那么面对这样的现实,未来的自然语言理解研究应该如何摆脱这样的困境呢?显然,我们应该做的只能是如何尽可能利用形式描述的心理知识,并与语言知识一起,在更大的语篇范围中来进行语言的理解。为此,应该提倡一种意群动力学来获取意义领悟的新思路。
我们知道,把握语言中的意义,对于掌握一种语言技巧的人们而言,是一种轻而易举的事。尽管有时我们也会为那些晦涩难懂、莫名其妙的话语而弄得不知所措,但就日常生活中通常意义下的语言理解是绝对没有疑问的。那么这一理解过程又是如何的呢?
首先语言理解是一个涉及文化、心理和语言的多层次意义解读问题,就语言本身而言,意义的解读又可以分为语言的框架意义、语言的外在意义和语言的内在意义三个方面。框架意义是指我们使用什么语言编码系统去解读的问题,由汉语给出的话语,只有选择汉语解读系统,才能够理解其中的内容。
语言的外在意义则是指一旦确定了解读语言系统,你又如何运用这一语言系统去解读所体会出来的意义,因为对语言理解本身必然也会受到语言固有思维习惯、定势、语言或元语言熟练运用程度等因素的影响,这便是外在意义强调的意义所在。
语言的内在意义则是语言本身所传递的内容。一般可以进一步分言上之义(明言)和言下之义(暗喻)二种。刘知几在《史通通释》中指出:“然章句之言,有显有晦。显也者,繁词缛说,理尽于篇中;晦也者,省字约文,事溢于句外。”讲的就是这二种内在意义的区分。
然后,从语言构成上看,语言理解又涉及到不同尺度语元的构成与分解的相互关系之中。也就是说,语篇是由语句构成的,语句又由语词构成,语词呢又由语素构成;而在这构成之中,复合意义似乎并非是由成份意
义的简单相加而获得,而是会突现出原来各成份意义并不具备的新意来的。如果把非直接源于成份意义的复合意义部分称为复合中的突现意义,那么突现意义往往就是成份意义之间相辅相成、相克相生等相互作用的结果。
这里面似乎反映了语言理解的这样一种原则,在各个尺度上,整体意义不仅依赖于其成份意义的复合,反过来其成份意义的确定也同样依赖于合成的整体意义。例如“不治而亡”与“不辞而别”,都有一个“不”字且都是“不A而B”形式,但同一个“不”在不同的结构整体中的含义却大不相同。此时应该看到,语言尽管可以依靠一定的形合规则来描述,但从意义的理解规律上讲,却是超然于形合之上而体现意合原则的。
所谓意合,指的是语句或语篇的理解机制主要是构成语句或语篇的语元意义相互映衬、相互制约以及相互影响而引发的一种自展性显现,意义便在这种自展显现中涌现。这完全是一种意群整体相互作用的结果,因此语言理解过程便应看作是大脑的一种多尺度跨层次的意群动力学过程。这就意味着,要么整个儿解决理解过程中的全部问题,要么压根儿就连语素意义的动态确认也无法解决。
具体地说,就意义分割与意义整合这一层次而言,理解过程是这样的:一方面意义分割是以反映整体意义的整合结果所支配,只有在整体意义之中,分割出来的意群才有意义;另一方面,整体意义的整合是由意义分割的全体部分及其关系确定的,没有了意群作基础,也就不会产生出整体意义。必须注意,构成的整体意义不仅制约着整体中每个部分意义的确认,而且这些受制约的部分意义本身也均对整体意义作出贡献。也就是说,整体意义离不开部分意义的整合,而部分意义也只有整体意义中才起作用。
确实这样,在语言理解中,自上而下和自下而上两个方面是同时进行的。用美国思想家埃里克·詹奇的话讲是:“演化在宏观世界和微观世界同时地、相互依赖地形成结构的意义上进行着。复杂性来自分化和综合过程的相互渗透,来自同时自上而下和自下而上进行的过程的相互结合,它们从两方面造就了等级层次。”(《自组织地宇宙观》)在这里,正是这种双向作用(个性意义将要共性化,而共性意义将要个性化)使整体意义变得充实丰满。
实际上,语言的运用就在于可以对事物本性进行的一种展示,在这展示中并非一定需要逻辑上的一致性,人们通过语言的展示来给出所展示事物的意义,那个说话人心目中的“事物意义”。在展示过程中,通过层次的,几乎可以一遍又一遍的来递进展开所要表述的最终意思,就因此成为常见的语言现象。
在层层展示中,每一次递进,那怕是意义重复的递进,都是在不同的意义上或语境中的递进或意义重复递归,此时先前的引用不但给出了当时的意义表述,同时也为以后再次引用时的新语境的形成作出了贡献。正是在这一种相互递进的过程,意群之间得到了充分的相互作用,最终代表最后结果的整体意义便得以涌现。换句话说,语句的意义在于其构成意群的自组织涌现。
那么,我们又如何将这种多尺度跨层次的自展过程落实到机器实现的层面上呢?很明显,这里面涉及的其实便是一个非线性的动力学方程解的问题。毫无疑问,就此而言,如果我们能够给出反映这种意群相互作用机制的动力学方程,并落实到计算层面,或许我们的机器将来能够在语言理解方面会有所突破。对此,我们翘首期待天才的降临,为我们捎来开启机器理解语言之门的钥匙。
第06讲小结
本讲主要介绍了自然语言的特点,特别针对人类理解机制来讨论了复杂的语言意义获取的问题。通过丰富语言现象、规律的展现,给出了目前机器理解语言的主要策略以及存在的局限性,并在此基础上,提出了一种意群动力学的新思路,试图能够让机器更好地把握人类语言的理解问题。希望同学们自己也能够思考这样的问题:如何让机器更好拥有人类的意义理解能力。
思考题
1、对自己的日常用语进行分析,看看都有哪些以前并不留意到的特点与现象?这些现象你认为哪些是机器能够处理的,哪些又是无法处理的?
2、请给句子“每一位新同学都要用好电脑。”进行词语切分与依存句法分析。
3、歧义是自然语言中普遍存在的现象,你认为消解歧义可利用的独立因素有哪些?并给出选择这些因素的理由。
本文发布于:2023-12-31 14:36:57,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1704004617132534.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:智能科学技术导论-周乐昌-第06讲 意义理解.doc
本文 PDF 下载地址:智能科学技术导论-周乐昌-第06讲 意义理解.pdf
留言与评论(共有 0 条评论) |