认知行为的分散记忆

  认知行为的分散记忆(1)

  任何思维都会酝酿出令人费解的观念。

  因为人体就是一个由术有专攻的器官们组成的集合体——心脏负责泵送,肾脏负责清扫——所以,当发现思维也将认知行为委派给大脑不同区域时,人们并没有感到过分惊讶。

  十八世纪晚期,内科医生们注意到,刚去世的病人在临死之前其受损的大脑区域和明显丧失的心智能力之间存在着某种关联。这种关联已经超出了学术意义:神智错乱在本源上是属于生物学的范畴吗?1873年,在伦敦西赖丁精神病院,一位对此心存怀疑的年轻内科医生用外科手术的方式取出两只活猴的一小部分大脑组织。其中一例造成猴子右侧肢体瘫痪,另一例造成猴子耳聋。而在其他所有方面,两只猴子都是正常的。该实验表明:大脑一定是经过划分的,即使部分失灵,整体也不会遭遇灭顶之灾。

  如果大脑按部门划分,那么记忆在哪一科室储存?复杂的大脑以何种方式分摊工作?答案出乎意料。

  1888年,一位曾经谈吐流利、记忆灵敏的男人,慌恐不安地出现在朗道尔特博士的办公室,因为他说不出字母表里任何字母的名字了。在听写一条消息的时候,这位困惑的男人写得只字不差。然而,他却怎么也读不出所写的内容。即使写错了,也找不出错的地方。朗道尔特博士记录道:“请他看视力检查表,他一个字母也说不出。尽管他声称看得很清楚……他把A比做画架,把Z比做蛇,把P比做搭扣。”

  四年后这个男人死的时候,他的诵读困难变成彻底的读写失语症。不出所料,解剖尸体发现了两处损伤:老伤在枕叶(视力)附近地区,新伤可能在语言中枢附近。

  这是大脑官僚化(即按片分管)的有力证明。它暗示着,不同的大脑区域分管不同的功能。如果要说话,则由这个科室进行相应的字母处理;而如果要书写,则归那个科室管。要说出一个字母(输出),你还需要向另一个地方申请。数字由则另一幢楼里的另一个完全不同的部门处理。如果你想骂人,就要像滑稽短剧《巨蟒剧团之飞翔的马戏团》里提示的那样,必须下到大厅里去。

  早期的大脑研究员约翰?休林-杰克逊讲述了一个关于他的一名女病人的故事。这个病人在生活中完全失语。有一次,她所住的病房的街对面有一堆倾倒在那里的垃圾着火了,这位病人清晰地发出了一个字——也是休林-杰克逊所听到的她讲的绝无仅有的一个字——“火!”

  怎么会这样?他感到有点不可思议,难道“火”是她的语言中枢记得的唯一一个字?莫不成大脑有自己的“火”字部门?

  随着大脑研究的进一步深入,思维之谜向人们展示出其极具特定性的一面。在有关记忆的文献中,有一类人能正常地区分具体的名词——对他们说“肘部”,他们就会指着自己的肘部——但是非常奇怪的是,他们无力识别抽象名词——问他们“自由”或“天资”,他们会茫然地瞪着眼睛,耸耸肩。与此相反,另一类看上去很正常的人则失去了记住具体名词的能力,却能完全识别抽象的东西。以色列人罗森菲尔德在其精彩但却不引人注目的著作《记忆的发明》中写道:

  有这么一个病人,当让他给干草下定义时,他回答,“我忘了。”当请他给海报下定义时,他说,“不知道。”然而,给他“恳求”这个词时,他说,“真诚地请求帮助。”说到“协议”,则回答,“友好的协定。”

  认知行为的分散记忆(2)

  古代哲学家说,记忆是个宫殿,每个房间都停放着一个思想。随着临床上一个个很特别的健忘症被发现和研究,记忆房间的数量呈爆炸式增长,且无穷无尽。已经被划分为套间的记忆堡垒,又被分割为由极小的秘室组成的巨大迷宫。

  有一项研究的对象是四个病人,他们能辨明无生命的物体(雨伞、毛巾),却会混淆生物,包括食品!其中一个病人能毫不含糊地谈论无生命的物体,但对他来说,蜘蛛的定义却是“一个为国家工作的找东西的人。”还有许多记录,是关于受过去时态困扰的失语症病人的。我听说过另一个传闻(我不能证实,但毫不怀疑),说患某种疾病的患者能够分辨所有食物,但蔬菜除外。

  南美文学名家博尔赫斯在他的小说中杜撰了一部名为《天朝仁学广览》的古代中国百科全书。其中的分类体系恰如其分地代表了这种潜藏在记忆系统下的怪诞不经。

  在那本年代久远的百科全书中,动物被划分为:a)属于皇帝的,b)防腐处理的,c)驯养的,d)乳臭未干的小猪,e)半人半鱼的,f)赏心悦目的,g)离家的狗,h)归入此类的,i)发疯般抽搐的,j)不可胜数的,k)用驼毛细笔描绘的,l)除此之外的,m)刚刚打破花瓶的,n)远看如苍蝇的。

  任何分类过程都有其逻辑问题,就如天朝分类法那般牵强。除非每一个记忆都能有不同的地方存放,否则就一定会有令人困惑的重叠。举例来说,一只喋喋不休的、淘气的小猪,就可能被归为上述类别中的三个里面。尽管可以将一个想法插入到三个记忆槽里,但其效率则非常低。

  在计算机科学家试图创立人工智能的过程中,知识是如何存入大脑的已经不仅仅是个学术问题了。那么,蜂群思维中的记忆架构是什么样的呢?

  过去,多数研究人员倾向于认为,(记忆的存储)就如同人类管理其自制的文件柜一样,直观而自然:每个存档文件占用一个地方,彼此间有多重交叉引用,就像图书馆一样。活跃于1930年代的加拿大神经外科医生怀尔德?潘菲尔德通过一系列著名的精彩实验,将这种认为每条记忆都对应于大脑中一个单独位置的理论发展到了顶峰。潘菲尔德通过大胆的开颅术,在病人清醒的状态下利用电激探查其小脑活体,请他们讲述自己的感受。病人们能够回忆起非常生动的往事。电激的最微小移动能引发截然不同的想法。潘菲尔德在用探测器扫描小脑表面的同时,绘制出每个记忆在大脑中的对应位置。

  他的第一个意外发现是,那些往事是可以重播的,就如同在若干年后播放录音机一般——“摁下重播键”。潘菲尔德在描述一位二十六岁妇女癫痫发作后的幻觉时用了“回闪”这个词:“同样的回闪出现了几次,都与她表亲的家或去那里的旅行有关——她已经有十到十五年没有去那里了,但小时候常去。”

  潘菲尔德对活脑这块处女地的探索使得人们形成了根深蒂固的印象:脑半球就好比出色的记录装置,其精彩的回放功能似乎更胜过时下流行的留声机。我们的每个记忆都被精确地刻划在它自己的碟片上,由不偏不倚的大脑忠实地将其分类归档,并能像自动点唱机中的歌曲一样,摁动正确的按扭就能播放出来,除非受到暴力的损伤。

  然而仔细查看潘菲尔德实验的原始记录会发现,记忆并不是十分机械的过程。有一个例子,是一位二十九岁的妇女在潘菲尔德刺激其左颞叶时的反应:“有什么东西从某个地方朝我来了。是一个梦。”四分钟以后,当刺激完全相同的点时:“景色似乎和刚才的不一样……”而刺激附近的点:“等等,什么东西从我上面闪过去了,我梦到过的东西。”在第三个刺激点——在大脑的更深处,“我不停地做梦。”对同一点重复刺激:“我不停地看到东西——我不停地梦到东西。”

  认知行为的分散记忆(3)

  这些文字所谈及的,与其说是从记忆档案馆的底层文件架上翻出的杂乱无章的昨日重现,倒不如说是梦一般的模糊闪现。这些过往经历的主人把它们当作是零碎的半记忆片段。它们带有生硬的“拼凑”色彩,漫无目的地飘荡;梦境由此而生——那些关于过去的、星星点点的、没有中心的故事被重组成梦中的拼贴画。并没有所谓似曾相识的感觉,也没有“当时情形正是如此”的强烈意识。没有人会被这些重播所蒙蔽。

  人类的记忆的确会不管用。其不管用的方式十分特别,比如在杂货店里记不起购物清单中的蔬菜或是干脆就忘掉了蔬菜这码事。记忆的损伤往往和大脑的物理损伤有关,据此我们猜测,记忆在某种程度上是与时间和空间捆绑在一起的——与时间和空间捆绑在一起正是真实的一种定义。

  然而现代认知科学更倾向于一个新的观点:记忆好比由储存在脑中的许多离散的、非记忆似的碎片汇总起来而从中涌现出来的事件。这些半意识的碎片没有固定的位置,它们分散在大脑中。其储存方式在不同的意识之间有本质的不同——对洗牌技能的掌握与对玻利维亚首都的了解就是按完全不同的方式组织的——并且这种方式人与人之间会有所不同,上一次与下一次之间也会有所不同。

  由于可能存在的想法或经历要比大脑中神经元的组合方式多,因此,记忆必须以某种方式进行组织,以尽可能容纳超过其存储空间的想法。它不可能有一个架子来存放过去所有的念头,也无法为将来可能出现的每一个想法预留位置。

  记得二十年前在台湾的一个夜晚,我坐在敞篷卡车的后面,行进在满是灰尘的山路上。山上空气很冷,我穿上了夹克。我搭的是顺风车,要在黎明前到达山区一座高峰。卡车在陡峭黑暗的山路上一圈圈艰难地向上爬升,而我在清新的空气中仰望星空。天空如此清澈,我能看见接近地平线的小星星。突然,一颗流星嗖地滑落,因为我在山里的角度特别,所以看见它在大气层里跳动。它跳啊,跳啊,跳啊,像粒石子。

  现在,当我回忆起这一幕时,那颗跳动的流星已经不再是我记忆的重播——尽管它是如此的生动。它的影像并不存在于我记忆中任何特别的地方。当我重现这段经历时,实际上对其重新进行了组合,并且每次回忆起来都会重新进行组合。所用的材料是散布在我大脑中的细小的证据碎片:在寒风中瑟瑟发抖,在崎岖的山路上颠簸前进,在夜空中闪烁的无数星星,还有在路旁伸手拦车的场景。这些记录的颗粒甚至更细小:冷,颠簸,光点,等候。这些正是我们通过感官所接收到的原始印象,并由此组合成了我们当前的感知。

  我们的意识正是通过这许许多多散布在记忆中的线索创造了现在,如同它创造了过去一样。站在博物馆的一个展品面前,其所具有的平行直线让我在头脑中将它与“椅子”的概念联系起来,尽管这个展品只有三条腿。我的记忆中从未见过这样一把椅子,但它符合所有(与椅子)相关联的事物——它是直立的,有水平的座位,是稳定的,有若干条腿——并随之产生了视觉映像。这个过程非常快。事实上,在察觉其所特有的细节之前,我会首先注意到其所具备的一般“椅性”。

  认知行为的分散记忆(4)

  我们的记忆(以及我们的蜂群思维)是以同样模糊而偶然的方式创造出来的。要(在记忆中)找到那颗跳动的流星,我的意识首先抓住了一条移动的光的线索,然后收集一连串与星星、寒冷、颠簸有关的感觉。创造出什么样的记忆,有赖于最近我往记忆里塞入了什么,也包括上次重组这段记忆时所加进去的感觉或其他事情。这就是为什么每次回忆起来都有些微不同的原因,因为每次它都是真正意义上的完全不同的经历。感知的行为和记忆的行为是相同的。两者都是将许多分布的碎片组合成一个自然涌现出的整体。

  认知科学家道格拉斯?霍夫施塔特说道:“记忆,是高度重建的。在记忆中进行搜取,需要从数目庞大的事件中挑选出什么是重要的,什么是不重要的,强调重要的东西,忽略不重要的东西。”这种选择的过程实际上就是感知。“我非常非常相信,”霍夫施塔特告诉我,“认知的核心过程与感知的关系非常非常紧密。”

  在过去二十年里,一些认知科学家已经勾画出了创造分布式记忆的方法。1970年代,心理学家戴维?马尔提出一种人类小脑的新模型,在这个模型中,记忆是随机地存储在整个神经元网络中的。1974年,计算机科学家彭蒂?卡内尔瓦提出了类似的数学网络模型。借助这个模型,长字符串的数据能随机地储存在计算机内存中。卡内尔瓦的算法是一种将有限数量的数据点储存进非常巨大的潜在的内存空间的绝妙方法。换句话说,卡内尔瓦指出了一种能够将思维所拥有的任何感知存入有限记忆机制的方法。由于宇宙中可能存在的思想要比原子或粒子更多,人类思维所能接触到的只是其中非常稀疏的一部分,因此,卡内尔瓦称他的算法为“稀疏分布记忆”算法。

  在一个稀疏分布式网络中,记忆是感知的一种。回忆行为和感知行为都是在一个非常巨大的模式可选集中探查所需要的一种模式。我们在回忆的时候,实际上是重现了原来的感知行为,也就是说,我们按照原来感知这种模式的过程,重新定位了该模式。

  卡内尔瓦的算法是如此简洁清晰,以致于某个计算机高手用一个下午就能大致地实现它。1980年代中期,在美国宇航局艾姆斯研究中心,卡内尔瓦和同事们在一台计算机上设计出非常稳定的实用版本,对他的稀疏分布记忆结构进行了细调。卡内尔瓦的记忆算法能做一些可媲美于人类思维的不可思议的事情。研究者事先向稀疏内存中放入几个画在20x20格子里的低画质数字图像(1至9)。内存保存了这些图像。然后,他们拿一个比第一批样本画质更低的数字图像给内存,看它是否能“回忆”起这个数字是什么。结果它做到了!它意识到了隐藏在所有低画质图像背后的原型。从本质上来说,它记起的是以前从未见过的形象!

  这个突破不仅仅使找到或重现过去成为可能,更重要的是,当只给定最模糊的线索时,它也能够从无数的可能性中发掘出一些东西。对一个记忆体来说,仅仅能调出祖母的容貌是不够的,在不同的光线下以及从不同的角度去看祖母的样子时,它都应该能辨认出来。

  认知行为的分散记忆(5)

  蜂群思维是能同时进行感知和记忆的分布式内存。人类的思维多半也是分布式的,至少在人工思维中分布式思维肯定是占优势的。计算机科学家越是用蜂群思维的方式来思考分布式问题,就越发现其合理性。他们指出,大多数个人电脑在开机状态的绝大部分时间里并没有真正投入使用。当你在计算机上写信时,敲击键盘产生的短脉冲会打断计算机的休息,但当你构思下一句话的时候,它又会返回到无所事事的状态。总体而言,办公室里打开的计算机在一天的大部分时间里都处于闲置状态。大公司的信息系统管理人员眼见价值几百万美元的个人电脑设备晚上在工作人员的办公桌上闲着,很想知道是否能够充分利用这些设备的全部计算能力。他们所需要的正是一个在完全分布式的系统中协调工作和存储的办法。

  不过,仅仅解决闲置问题并不是分布式计算的主要意义。分布式系统和蜂群思维有其独特的优势,比如,对突然出现的故障具有极强的免疫力。在加利福尼亚州帕罗奥多市的数字设备公司的实验室里,一名工程师向我演示了分布式计算的优势:他打开装有公司内部计算机网络的机柜门,动作夸张地从里面拔掉了一条电缆。网络路由毫不迟疑地绕过了缺口。

  当然,任何蜂群思维都有失灵的时候。但是,因为网络的非线性特质,当它确实失灵的时候,其故障可能类似于除了蔬菜什么食物都记得的失语症。一个有损伤的网络智能也许能计算出圆周率的第十亿个数位,却不能向新地址转发邮件;它也许能查出为非洲斑马变种进行分类这样晦涩难懂的课本文字,却找不出任何有关一般动物的合乎情理的描述。对蔬菜的整体“健忘”不太像局部的储存器故障,它更像是系统层面上的故障,据其症状推断,有可能是与蔬菜相关的某种特殊关联出现了问题——就像计算机硬盘中的两个独立但又相互矛盾的程序有可能造成一个“漏洞”阻止你打印斜体字一样。斜体字的存储位置并没有被破坏,但是渲染斜体字的系统进程被破坏了。

  创建分布式计算机思维所遇到的一些障碍可以通过将计算机网络建立在一个箱体内的方法加以克服。这种经过刻意压缩的分布式计算也被称为并行计算,因为在超级计算机中的成千上万的计算机在并行运转。并行超级计算机不能解决“办公桌上闲置的计算机”问题,也不能将散布各处的计算能力聚合起来;并行运转是其本身和内部的一个优势,不过单就为了这一点,也值得花一百万美元来制造一个单机装置。

  并行分布式计算非常适用于感知、视觉和仿真领域。并行机制处理复杂性的能力要好于以体积庞大、运算速度超快的串行计算机为基础的传统超级计算机。在采用稀疏分布式内存的超级计算机里,记忆与数据处理之间的差异消失了。记忆成为了感知的再现,与最初的认知行为没有什么区别。两者都是从一大堆互相连接的部件中涌现出来的模式。

  从量变到质变

  满满一槽的水。当你拔去水槽的塞子,水就会开始搅动,形成涡流。涡流发展成为漩涡,像有生命一般成长。不一会儿,漩涡从水面扩展到槽底,带动了整个水槽里的水。不停变化的水分子瀑布在龙卷中旋转,时刻改变着漩涡的形状。而漩涡持续不变,就在崩溃的边缘舞动。“我们并非僵滞的死物,而是自我延续的模式,”诺伯特?维纳如是写道。

  水槽空了,所有的水都通过漩涡而流得一干二净。当满槽水都从槽里排入下水道后,漩涡的模式到哪去了呢?这模式又是从何而来呢?

  不管我们在何时拔掉塞子,漩涡都会无一例外地出现。漩涡是一种涌现的事物——如同群一样,它的能量及结构蕴涵于群体而非单个水分子的能量和特性之中。不论你多么确切地了解H2?(水的分子式)的化学特征,它都不会告诉你任何有关漩涡的特征。一如所有涌现的事物,漩涡的特性来源于大量共存的其他个体;在之前所举的例子中,是满满一槽的水分子。一滴水并不足以显现出漩涡,而一把沙子也不足以引发沙丘的崩塌。事物的涌现大都依赖于一定数量的个体,一个群体,一个集体,一个团伙,或是更多。

  数量能带来本质性的差异。一粒沙子不能引起沙丘的崩塌,但是一旦堆积了足够多的沙子,就会出现一个沙丘,进而也就能引发一场沙崩。一些物理属性,如温度,也取决于分子的集体行为。空间里的一个孤零零的分子并没有确切的温度。温度更应该被认为是一定数量分子所具有的群体性特征。尽管温度也是涌现出来的特征,但它仍然可以被精确无疑地测量出来,甚至是可以预测的。它是真实存在的。

  科学界早就认为大量个体和少量个体的行为存在重大差异。群聚的个体孕育出必要的复杂性,足以产生涌现的事物。随着成员数目的增加,两个或更多成员之间可能的相互作用呈指数级增长。当连接度高且成员数目大时,就产生了群体行为的动态特性。——量变引起质变。

评论