《灵魂的科学探索》

第04章 视觉心理学

作者:弗兰西斯·克里克

“当我们追溯心理学发展的历史时,我们就会陷入空想、矛盾和谬误与某些真理交织在一起的迷宫之中。”

——托马斯·里德(thomas reid)

我希望我已经说服了你,看并非如你想像得那样简单。看是一个建构过程,在此过程中,大脑以并行的方式对景物的很多不同“特征”进行响应,并以以往的经验为指导,把这些特征组合成一个有意义的整体。看涉及大脑中的某些主动过程,它导致景物明晰的、多层次的符号化解释。

我们现在要考虑的是,当我们观看物体、它与我们及其他物体的相对位置以及它的形状、颜色、运动等某一属性时,大脑必须执行的某些基本操作。也许,我们应该认识到的最重要的一点,就是视野中的物体并不像你看到的那样。每个物体并非以清楚和确定的方式做了标记,你的大脑必须使用各种线索,使景物中对应同一物体的各个部分整合在一起。在现实世界中,这并不是一件容易的事情。物体可能部分被遮挡或是呈现在易于混淆的背景之中。

举个例子就会较清楚了。请看图5中的这张照片。你会毫不费力地立刻看出,这是一张正在注视窗外的年轻女子的面孔。但仔细观看就发现,窗户的木窗棂将该女子的面孔分成了四部分。但是,你并没有把它看成是四个不同人脸的四个分离的片断。你的大脑将它们组合在一起,解释为一个单一物体——被面前的木窗棂部分遮挡的一张面孔。这一组合是怎样完成的呢?

这便是格式塔心理学家马克思·沃特海默(max wertheimer)。沃尔夫冈·科勒尔(wolfgang kohler)和库尔特·科福卡(kurt koffka)的主要研究兴趣之一。这场运动于1912年前后在德国兴起,并在美国结束。纳粹掌权后,他们三人全部离开德国。我的词典将“格式塔(gestalt)”定义为“一个各部分之间相互影响的有机整体,而整体大于各部分之和。”①换句话说,你的大脑必须根据你以往的经验和你的基因中所体现的远古祖先的经验,通过发现各个部分的最优组合,主动地构造这些“整体”。这种组合最有可能对应于真实世界中某个物体的有关方面。很明显,重要的是各部分之间的相互作用。格式塔学派试图对视觉系统共同的相互作用类型进行分类,并把它们称为知觉定律。他们的组合定律包括接近性、相似性、良好的连续性和封闭性。下面让我们依次对它们进行讨论。

接近律说明,我们倾向于将那些相互靠得很近且离其他相似物体较远的东西组合在一起。这在图6中就看得很明显。该图由许多规则的矩形阵列小黑点组成。你的大脑既可能将它们组织成水平线也可能组合成垂直线。但实际上,你把它们看成是垂直线。这是因为,一个点到其最近点的距离,在垂直方向要比水平方向短。其他实验显示,接近律通常指“空间上接近”,而非在视网膜上的接近性。

格式塔的相似律是说,我们将那些明显具有共同特性(如颜色。运动、方向等)的事物组合在一起。如果你看见一只正在跑的猫,你就会把它身体的各个部分组合在一起。因为一般来讲,当猫跑时,它的各个部分会在一个方向上运动。同样原因,正在树丛中爬行的猫也会被识别出来。但是,如果它纹丝不动,我们就很难发现它。

良好的连续性定律可以由图7加以说明。该图的上部分显示两条相互交叉的曲线。我们的确把它看成是两条线,而不是像该图的下部分所显示的那种交汇于一点的四条线或是两个靠近的v型。我们同样倾向于把中断的线段看成是被某个物体遮挡一部分的连续直线。

请看图8a所表示的一组八个奇形怪状的物体。中间两个与字母y类似,另外六个为扭曲的箭头。而在图8b,你大概会看到一个被三个斜条遮挡的三维立方体框架。现在,那些奇形怪状的物体已成为上下两图的组成部分。第二个图形中更容易看成是立方体,因为它似乎是一个被斜条遮挡的单一物体。而第一个图形,由于缺少任何遮挡线索,因而更容易被看成是八个独立的物体。

封闭性在线画图形中表现得最为明显。如果一条线形成了封闭的或几乎封闭的图形,那么我们就倾向于把它看成是被一条线包围起来的图形表面,而不仅仅是一条线。①

格式塔学派还有一个被称为“简洁”(pragnanz)的普遍原理,它可以近似地被译为“优良性”。它的基本思想就是视觉系统对输入的视觉信息作出最简单、最规则和具有对称性的解释。大脑如何判断哪个解释“最简单”呢?现代的观点认为,最好的解释往往只需要很少的信息(在技术意义上)进行描述,而坏的解释往往需要更多的信息。①

换句话说,大脑需要一个合理的解释而不是奇特的解释。这就意味着,这种解释不因观察点的微小变化而发生根本改变。这是由于,在过去当你看一个物体时,你常常在景物中运动,因此,你的大脑已经把该物体的各个不同方面记录了下来,并认为它们属于同一个事物。

格式塔知觉定律不能看作是严格的定律,而只能算是一种实用的启发式研究。因此,它们可以作为视觉问题的合适的人门知识。真正哪些操作过程导致了这些“定律”的出现,这正是众多视觉心理学家试图发现的东西。

正如格式塔学派已经认识到的那样,视觉中的一个重要操作就是图形背景分离。要识别的物体称为“图形”,其周围环境称为“背景”。这种分离也许并不总是轻而易举的事,仔细观察图9你就会知道,如果你从来也没有看到过这幅图,你会很难看出有什么可识别的物体。但过了一会儿,你就有可能意识到,图画的一部分代表一只达尔马提亚(dalmatia,南斯拉夫地名)狗。在这种情形,图形背景的分离被有意复杂化了。

还可能构造一幅模棱两可的图形背景分离图像。请看图10。第一眼看来,它像一个花瓶,但继续观察就可能看成是两张脸的侧视图。本来花瓶是图形,而现在人脸的轮廓线成了图形,原先的花瓶就成为背景了。但是,这两种解释很难在同一时刻看到。

大脑在决定哪些视觉特征属于某个物体时,要依赖于大体上符合格式塔知觉定律的明显的视觉线索。因此,倘若一个物体较坚实(接近性)、具有明确的轮廓(封闭性)、朝一个方向运动(共命运),而且整个为红颜色(相似性),那么,我们就很可能认为这是一个运动的红球。

对一个动物来说,出色地完成此类任务是至关重要的。否则,它就很难发现天敌或猎物以及苹果之类的其他食物。它必须能把图形和背景分离开来。所谓的伪装物就是试图混淆这一过程,伪装的作用是破坏表面的连续性(如战士穿的迷彩服),并产生一个易于混淆的轮廓,从而使真实的轮廓伪装起来。颜色也可能与背景混杂在一起。一只蹑手蹑脚移动的猫不时地停下来,就是为了避免给猎物提供任何运动线索。正如有人所认为的那样,我们由进化获得的良好的颜色视觉,使我们的灵长类祖先能够在纷乱的绿色背景中发现红色的果实。能给我们带来众多视觉乐趣的东西,可能就是最初发现食物和识破伪装的装置。

我们对最早阶段视觉加工知识的了解,部分来自于对眼和脑的研究(参见第十章 )。需要执行的最早操作差不多是去除冗余信息。眼中的光感受器对落人眼睛的光强起反应。假如你观察一面完全均匀而光滑的白墙,那么你眼内的所有光感受器将会对光作出同样的反应。有什么理由将所有这些信息传递给大脑呢?对眼底视网膜来讲,最好是先对这些信息进行处理,使大脑知道哪里是空间上光强变化的地方——墙的边缘。如果整个视网膜区域没有光强变化,那么就不发送任何信号。大脑从“无信号”就可以得出“无变化”以及墙的这一部分是均匀的推论。

正如我们在后面章节将会看到的,在某种程度上,大脑对不同类型信息的处理是在不同的平行通路中实现的。因此,对如何观看形状、运动、颜色等过程分别进行研究是有道理的,尽管这些过程具有某种程度的相互作用。

让我们先从形状开始,很明显,抽提轮廓对于大脑非常有用。这就是为什么我们对线条图能如此容易地产生反应的原因。即使没有任何阴影、纹理、颜色等特征,你仍然可以对某景物的线条图形作出解释(如图11)。这说明,大脑中某些元素对精细的细节有较好的反应,另外一些对细节较少的部分起反应,而其他元素则对空间上的粗略变化起反应。你如果仅仅能看到后者,这世界就会模糊得像焦距没调准一般。心理学家常使用“空间频率”一词。高空间频率相应于精细的细节,低空间频率对图像在空间上的缓慢变化起反应。

请看图12。你很可能将它看成是具有均匀灰度的一些小正方形的组合体。现在,如果把它弄模糊(摘掉眼镜、半闭着眼睛或将它放到房内的远处),你就可能认出是林肯的面孔。图的细节(小正方形的边缘)干扰了识别过程。当视觉变得模糊时,这些细节就不那么显眼了。这时,尽管由于图像中只有较低的空间频率信息,因此图像仍然有些模糊,但是你却能认出他的面孔了,当然,一般说来,不论低空间频率或高空间频率对解释图像都有帮助。

大脑面对的最为困难的问题之一,是从二维图像中抽提深度信息。我们需要深度信息,不仅是为了确定物体与观察者之间的距离,而且还要识别每个物体的三维形状,使用两只眼睛是有帮助的。但常可利用一只眼睛或看它的照片就能看出它的形状。大脑使用哪些线索从二维图像中获得三维信息呢?一个线索就是由入射光的角度产生的物体阴影。请看图13。你可能将其中的一排看成是平面上的四个凹陷物,而将另外一排看成四个突起物。这样的深度印象就来自人射光的阴影。

偶尔,这种解释也可能是模棱两可的。凝视一会儿该图或者将页面倒置,你就会把凹陷看成突起,或把突起看成凹陷(注意,这种变化是同时发生的)。你的大脑最初认为,照明光来自某一侧,但倘若照明光实际来自另一侧,那么同样的阴影就会对应不同的形状,正如你所看到的那样。

另一个令人信服的线索是“从运动恢复结构”。这是说,如果一个静止物体的形状难以看清楚(经常是由于缺少某些三维形状线索),那么稍微转动一下该物体就容易识别了。在讲课时,如果把一个由小球和辐条制成的复杂分子的模型投影在屏幕上,就不易理解。但如果播放它的转动模型的电影,其三维形状就会一目了然。在电视节目《生命的故事》的片尾,你可能看到过这种情景。在那里,dna分子的模型随空中的音乐而旋转。

要进行三维观察,只看三维空间中的每个物体是不够的。你还必须观看三维空间的整个场景,以便弄清楚哪些物体离你近,哪些物体离你远。即便是二维图像也存在两种很强的深度线索。

第一个线索是透视,它可以用埃姆斯变形房间(因发明者阿德尔伯特·埃姆斯(adelbert ames)而得名)进行生动的演示。这种房间只能用单眼从外部通过小孔去观察。这样,就可以排除任何立体视觉线索。这个房间看起来像个长方体,但在实际上它的一边很长。与正方形房间相比,它的一个墙角要高得多,也离我们远得多。当我在旧金山“探索者博物馆”(exploratorium)通过小孔观看这样的房间时,我看见一些在房间内跑来跑去的小孩。在房子的一侧他们显得很高(因为这时他们离我很近),而在另一侧则显得很矮(这时他们离得很远)。当他们从一边跑到另一边时(实际上是从近处墙角跑到远处墙角,再跑回来),他们的大小会发生惊人的变化。我当然明白,孩子们是不可能通过这种方式改变身高的。但这一错觉是如此逼真,使我无法立刻摆脱它。每个孩子的表观大小是由墙的虚假透视作用产生的。与其他错觉类似,这一错觉很难通过“自上而下”(即大脑的最高水平对这一错觉形成基础的理解)的作用进行校正。

另一个有力的线索

..(本章未完,请进入下一节继续阅读)..

>> 阅读第04章 视觉心理学第[2]节

还没有读完?>>点这里设置下次自动从这里继续阅读《灵魂的科学探索》 或者>>点这里把本页面地址加入到您的本地收藏夹中