2024年3月29日发(作者:摆渡人主题曲)
第05讲视觉感知
导语
在人类心智的机器模似研究中,恐怕没有那个方面
像在视觉上那样取得如此巨大的实际应用性成功了。不
仅如此,视觉感知能力是人类获取环境信息的主要渠道,
在人类感知外部世界中起者举足轻重的作用。因此,作
为对人类心智模拟的首要方面,也作为机器感知的典型
代表,我们就从机器视觉方面来还是我们智能科学研究
的讲述。为此,首先还是让我们具体先来看一看人类丰
富的视觉现象吧!
第5.1节视觉机制
在漫长的进化历程中,我们发展了精妙的视觉系统,
使得我们的视觉能力适应在复杂环境中获取有益于更
好生存的视觉信息。因此,对于视觉而言,捕捉环境变
化中的意义是第一位的,而没有意义的视觉信息是可以
被忽略的,事实上也确实被忽略了。英国心理学家
Gregrory在《eyesand Brains》一书中指出:“感官接受
的是生动的图案,但是我们很少看图案,我们看的是事
物。相对来说,图案是无意义的标记的组合,而事物除
了具有感官特征以外,还有许多其它特征。”
对于人类视觉系统这种关注事物意义而忽略无意
义的视觉信息的功能,几乎发展到了无以复加的地步。
美国心理学家卡洛琳·布鲁墨在《视觉原理》一书的开
头就强调指出:“人的头脑从外来的刺激中“毫无节制”
地产生着含意。这是一个事实,你所无法逃脱的过程,
不管你愿意或不愿意都在发生着的活动。你的头脑不断
赋予外界事物以含意——以致有时候这些含意本不存
在,完全是你的幻想创造出来的。”
坐在长椅上的男人
一条觅食的鬣狗
说明这种“无中生意”的极好例子是“坐在长椅上的
男人”幻像。如图所示,除了一些在黑背景中的白斑块外,
原本什么也没有画,但您却能从这幅图中看出意义来:
一位坐在长椅上的男人形象。其实这也不是什么新鲜事,
读者或许在生活中早有这样的经验:从天上的飘云中看
出各种你所熟悉的造形;在斑驳的墙上看到了人物肖像、
各种动作各异的动物形体;甚至还会为自然界形成的奇
石怪峰,牵强附会地来冠以石猴、石龟、二郎探母等名
号,等等。
无中生有的视觉示例
不仅如此,对于一幅视觉图案,含义的理解还存在
着画面意义和画外之音的区分。例如就以右图而言,光
凭图案本身的识别并不能得出其所要发生的一切内容,
只有根据知识和经验并加以推断,才能获得更全面的意
义领会,其中包括那只鸬鹚随时将会捕捉水中小鱼的预
期意义。
正在捕鱼的鸬鹚
有时,视觉图案的意义往往存在多重选择性,对其
含义的确切把握不仅依赖于主观心理定势,而且也依赖
于图案本身所提供视觉刺激的微小变化。例如对于图右,
你可以看作是一位标致的年轻女子微微转过脸去的侧
身像,又可以看作是一位老妇人的侧身像。
少女与老妇
但如果给图案稍稍改变;那么你就不再会有这种二
难选择的困难了,参下面的兔鸭图(b)。此时图(a)
只能被理解为鸭子而图(c)也只能被理解为兔子。
a b c
兔鸭图
当然,对于有多种理解的情形,有时主观意向或意
念也会起到重要作用。只有当一个意念,在一定的环境
因素触动之下,被动的图案及其环境与其发生关系时,
才会突现出来,成为最终理解的结果含义。
环带上凹凸的小球
遗憾的是,我们对人类的这种视觉理解的发生机制
的规律还知之不多,但有一点可以肯定的,这其中包含
了非线性突变的因素,即微小的扰动可以引起完全不同
的理解结果。这种现象我们也称之为蝴蝶效应,指的是
对初始条件的敏感依赖性,是不可预测性的。所谓“差之
毫厘,失之千里”指的就是这种效应。西方有一首民谣唱
到:
钉子缺,蹄铁卸;蹄铁卸,战马蹶;
战马蹶,骑士绝;骑士绝,战事折;
战事折,国家灭。
形象生动地讲的也就是这个道理。
图案多重理解的困难还不仅于此,有时对于歧义图
案的多重选择也存在歧义。也就是说不是所有的歧义图
案都具有确定的几种含义可供选择,有时连有几种意义
本身也是含糊不清的。下一页给出了三种不同类型的歧
义图案,其中(a)图属于“含糊不清”型歧义图,你无
法知道应该将此图案理解为几个人脸;(b)图则属于
“多重选择”型歧义图,其具有二个相互独立的并且是排
他性的含义,主观理解了其一种含义就不会产生第二种
含义;(c)图属于“一图双关”型歧义图,就象一语双
关的句子一样,其同时给出了二个以上含义。于此可见,
歧义图案的理解问题远远要比我们想象的还要复杂,而
这一切又不过只是我们全部视觉思维机制的一部分。
a.有多少张人脸?
b.大号演奏家还是美女c.既是箭头又是小人
在视觉图案的理解把握中,除了对意义本身理解困
难外,在视觉思维中还有一个机器所要面临的更大困难,
那就是机器如何能象人类那样具备观看图案的意图。很
明显,图案隐含着一定的含义这是意义把握问题;而观
察者愿意不愿意以及基于什么样的目的去理解图案则
是观察者的意图问题,这种观察意图直接影响了对图案
的理解结果。
产生一个意图
有时即使遇到像右图那样具有不可整合的认知图
例,在无法完成有意义形象的感知时,我们的视觉系统
也不会一味地死心眼陷于困境而不能自拔,而是会产生
一个新的意图跳出任务,干脆不再去作无谓的观看了。
在人类视觉认知活动中,对图案观察的深度和详细
程度往往是依赖于所要完成的任务的,一旦任务完成,
观看者就不再会去费思耗神作额外的分析理解去把握
不必要的意义。对于给定视觉认知任务,你会发现,当
观看者完成任务后(正确报告了要求回答的结果),对
图形本身的形状和布局依然知之甚少,这说明一旦达到
了目的,观察者是不会再作任何进一步的观看理解的。
归纳起来,人类视觉机制涉及整体知觉、主观意念,
多重选择和意图行为等问题。就感知层面而言,即使不
考虑主观意念,多重选择和意图行为等这些高级思维层
次的认知机制,其中的整体知觉也是不可回避的核心机
制。那么,人类视觉又是如何实现这种整体知觉机制的
呢?机器视觉从中又能获得哪些启示呢?下面,我们就
围绕着视觉整体知觉能力,来展开分析。
请观看右图,我想人们总是将其看作为一个猫头鹰
而不是有字母、线条、圆点部分构成的拼图,这就是整
体知觉效果的结果。也就是说,人们在把握视觉刺激时,
并不是以自下而上逐个分析来获得生动的形象的,而是
同时将整幅图案进行整合感知为有意义的形象。我们具
有整体知觉能力。
猫头鹰简笔画
的确,就我们的视觉系统而言,对视觉对象的识认
本文发布于:2024-03-29 05:55:26,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1711662926301180.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:智能科学技术导论-周乐昌-第05讲 视觉感知.doc
本文 PDF 下载地址:智能科学技术导论-周乐昌-第05讲 视觉感知.pdf
留言与评论(共有 0 条评论) |