首页 / 资讯中心 / 趋势研究/深度长文:“自由能原理”或许是人工智能发展的正确方向

深度长文:“自由能原理”或许是人工智能发展的正确方向

发布时间:2018-12-28 分类:趋势研究

天才神经学家可能掌握着人工智能的关键。

编者按:神经学家卡尔·弗里斯顿最初将自由能原理用在神经科学,是为了治疗神经疾病以及合理的解释世界,却未想到数学化之后的自由能原理可以应用于人工智能领域,但对于许多人来说,自由能理论的解释难以理解,但不可否认这位人工智能领域带来了新的发展方向。ShaunRaviv(@ShaunRaviv)是一位生活在佐治亚州亚特兰大的作家,该篇文章发表在12月份期刊。

卡尔·弗里斯顿(Karl Friston)的自由能原理,可能是自查尔斯·达尔文自然选择理论以来最包罗万象的观点。但是想要理解它,你需要一探弗里斯顿的内心。


一.每周的“请教卡尔”会议


当英国国王乔治三世(George III)在其统治末期开始表现出强烈的急性躁狂症迹象时,关于王室疯狂的谣言在公众心中迅速增多。有一个传说是说国王乔治想和某棵树握手,而且坚信这棵树是普鲁士国王。另一个传说则讲述了他是如何被带到伦敦布卢姆斯伯里区皇后广场的一所房子里接受治疗的。传说中,当国王接受医生的治疗时,乔治的妻子夏洛特女王租用当地一家酒吧的地窖,为国王的晚餐储备食物。


 两个多世纪后,这个关于皇后广场的故事仍然在伦敦的旅游指南中流行,不管故事是不是真的,多年来这个社区一直在进化,好像是为了顺应这个故事。夏洛特女王的一座金属雕像矗立在广场的北端,而街角的酒吧被称为“女王的贮藏室”(The Queen’s Larder),广场安静的长方形花园,现在几乎被从事脑力劳动的人和大脑需要运转的人包围。国家神经病学和神经外科医院占据了皇后广场的一个角落,现代皇室都很可能来这里寻求治疗,而伦敦大学学院的著名神经科学研究设施就在它的外围。去年7月,在一周的完美天气中,数十名神经病患者和他们的家人在草地外缘的木制长凳上度过了安静的时光。


在某个典型的周一,卡尔·弗里斯顿于中午12:25抵达皇后广场,在夏洛特女王雕像旁的花园里抽着一支烟,他的身体微曲,身影孤独,白发浓密。弗里斯顿是伦敦大学学院著名的功能成像实验室的科学主任,在那里工作的每个人都知道这个叫FIL的实验室。抽完烟后,弗里斯顿走到广场的西边,走进一栋砖石建筑,来到四楼的一间会议室,那里可能会有二十到二十几个人面对着一堵空白的墙等着他。弗里斯顿喜欢迟到五分钟,所以其他人都已经到了。


对人群的问候很可能是他当天首次讲话,因为弗里斯顿不愿在中午前与其他人交谈。(在家里,他将通过一系列大家都理解的微笑和咕噜声,与妻子和三个儿子交谈。)他也很少单独与人见面,相反他更喜欢举行像这样的公开会议,学生、博士后以及那些渴望了解弗里斯顿专业知识的人都可以在那里寻求他的知识,近年来,这类人的数量几乎达到了可笑的程度。“他认为,如果某个人有个想法、问题或正在进行的项目,了解这个问题的最好方法就是让整个团队聚在一起,倾听这个人的意见,然后每个人都有机会提出问题和讨论。因此,一个人的学习变成了每个人的学习。”大卫·本里莫(David Benrimoh)说:“这是非常特别的,因为卡尔有很多事要去做。”


每次周一会议开始时,每个人都会先说出他们的问题。弗里斯顿一边听一边慢吞吞地转着圈子,他的眼镜停在鼻尖,所以他总是低下头来看说话的人。接下来的几个小时,他依次回答问题。“他是一位维多利亚时代的绅士,有着维多利亚时代的风度和品味。”正如一位朋友所描述的弗里斯顿那样,他以礼貌和迅速的方式回答最令人困惑的问题。我开始称之为“请教卡尔”会议的询问与回答环节,是耐力、记忆力、知识面和创造性思维的非凡壮举。当弗里斯顿退到悬在办公室外极小的金属阳台上再吸一支烟的时候,会议通常就结束了。


二.成名于革命性的统计参数图


弗里斯顿首次先成为学术界的英雄人物,是因为他设计了许多最重要的工具,使人类的大脑为科学所识别。1990年,他发明了统计参数图,这是一种计算技术,正如一位神经学家所说,可以把经过“挤压”的大脑图像形成一致的形状,这样研究人员就可以对不同颅骨内的活动进行同类比较。在统计参数图的基础上,出现了一种名为基于体素的形态计量学,这是一种成像技术,并且应用到了一项著名的研究,研究结果表明伦敦出租车司机在学习“知识”时,海马后部逐渐长大。①(①要获得伦敦出租车执照,司机必须记住320条路线和许多在查令十字路口6英里范围内的地标。这个艰苦的过程包括一次笔试,以及一系列与考官的一对一面试.)


2011年发表在《科学》杂志上的一项研究,使用了弗里斯顿发明的第三个名为“动态因果模型”的脑成像分析软件,来确定大脑损伤严重的人有轻微的意识,还是只是植物人。

当弗里斯顿在2006年被选入皇家研究员学会时,该学院称他对大脑研究的影响是“革命性的”,并说90%以上的发表在脑成像上的论文都使用了他的方法。两年前,艾伦人工智能研究所(Allen Institute for Artificial Intelligence),一个由人工智能先驱奥伦·埃齐奥尼(Oren Etzioni)领导的研究机构,计算出弗里斯顿是世界上最常被引用的神经学家,有很高的他引指数,这个指数是用来衡量研究人员出版物影响的指标,他的指数几乎是爱因斯坦的两倍。科睿唯安公司(Clarivate Analytics)在过去20多年的时间里成功预测了46位诺贝尔科学奖得主,去年,该公司将弗里斯顿列为生理学或医学界最有可能获得诺贝尔奖的三位获奖者之一。


三.自由能原理是突破人工智能研究的希望


然而,值得注意的是,这些天前来拜访弗里斯顿的研究人员中,很少有人来谈论大脑成像。在今年夏天的10天时间里,弗里斯顿分别为某位天体物理学家,几位哲学家,某位计算机工程师,Amazon Echo某位更有魅力的竞争对手,世界上最大的保险公司之一的人工智能主管,某位寻求制造更好助听器的神经学家,以及某家应用机器学习帮助治疗抑郁症的初创公司的精神病学家提供了建议,他们中的大多数人过来,是因为他们迫切地想要完全理解其他的东西。


在过去的十多年里,弗里斯顿花了大量的时间和精力来发展他称为自由能原理的想法。(弗里斯顿称他的神经影像学研究是一项日常工作,就像某位爵士音乐家可能在当地公共图书馆的轮班工作一样。)有了这个想法,弗里斯顿相信他已经确定了所有生命的组织原则,以及所有的智慧。“如果你还活着。”他开始回答,“你就必须表现出什么样的行为?”

首先是坏消息,即自由能原理令人难以理解。事实上,它是如此困难,整个房间的无比聪明的人都尝试过并且未能掌握它。一个拥有3000名粉丝的Twitter账户②的存在只是为了模仿它的难以理解,几乎每个与我交谈的人,包括致力于这方面的研究人员,告诉我他们没有完全理解它。(②该账户名为@FarlKriston。样本推文:“生命是拥有马尔可夫毯(Markov blanket)的任何(遍历)随机动力系统的必然和突发属性,别忘了这点!”)

但通常这些人都急忙补充说,自由能原理的核心是讲一个简单的故事,解决某个基本的难题。热力学第二定律告诉我们宇宙趋向于熵值增加,趋向于消融,但是生物会强烈抵制。我们每天早上醒来,几乎和昨天一样,我们的细胞和器官之间,我们和世界之间都有着明显的分离。那是怎么做到这一点?弗里斯顿的自由能原理说,所有的生命在组织的任意尺度上,从单个细胞到人脑,都有其数十亿个神经元,都是由同样的普遍要求驱动的,而这个指令可以简化为一个数学函数。他说,活着就是要减少你的期望和感官输入之间的鸿沟,或者,用弗里斯东的术语,就是将自由能降到最低。


为了了解这一理论的潜在影响,你所要做的就是看看周一早上拥挤在FIL门口的人群。有些人来这里是因为他们想利用自由能原理来统一思想理论,为生物学提供新的基础并解释我们所知道的生命,另一些人希望自由能原理能使精神病学的研究是基于对大脑的了解,还有一些人来这里是因为他们想利用弗里斯顿的想法来突破人工智能研究的障碍,但是他们都有一个共同的原因,那就是唯一真正理解卡尔·弗里斯顿的自由能原理的人可能只有卡尔·弗里斯顿本人。


弗里斯顿的办公室,一位朋友形容他为“维多利亚时代的绅士,有维多利亚时代的风度和品味。


四.高产学者的成长历程


弗里斯顿不仅是他领域中最有影响力的学者之一,他也是所有学科中最多产的学者之一。他今年59岁,每天晚上和周末都在工作,自世纪之交以来发表了1000多篇学术论文。仅在2017年,他就成为85篇文章的主要作者或合著者之一③,这相当于每四天就有一篇文章。(③《自然》杂志2018年的一篇文章分析了“超级多产”学者的现象,作者将这些学者定义为任何一年内拥有超过72篇论文的人。)


但如果你问他,这一成果不仅仅是一种雄心勃勃的职业道德的结果,它也是他倾向于严格逃避主义倾向的标志。


弗里斯顿在他的内心生活中划出了一个精心管理的界限,以防范入侵,其中许多似乎是关于“为他人担忧”。与私下交谈相比,他更喜欢在舞台上与其他人保持舒适的距离,他没有手机,他总是穿着深蓝色的西装,这是他某次在清仓店买的两套之一。他发现自己每周在皇后广场的例行会议被打乱了,这“相当伤脑筋”,因此他倾向于在国际会议上避开其他人,他不喜欢为自己的观点辩护。


同时,弗里斯顿对他作为学者的动力有着异常清晰和坦率的态度。他发现,在一个需要数周时间才能解决的难题中迷失自我是一件令人难以置信的令人宽慰的事情——就像为了一根烟而消失一样。他在书中雄辩地描述了自己的痴迷,这种痴迷可以追溯到童年时代,他一直在寻找融合、统一、简化这个世界表面喧嚣的方法。


弗里斯顿将他的自由能原则追溯到他8岁那年的一个炎热的夏天,他和他的家人住在利物浦附近有围墙的英国城市切斯特,他的母亲让他去花园里玩。他翻过一根旧原木,发现了几只木虱在移动,这是一种长着甲虫状外骨骼的小虫子,一开始他以为,它们是在疯狂地寻找庇护和黑暗。在盯着它们看了半个小时后,他推断出它们其实并不是在寻找阴影。“那是一种幻觉。”弗里斯顿说:“我带上桌面的幻想”


他意识到,木虱的移动没有更大的用途,至少和人类上车去办事时候的目的性不一样。这些生物的活动是随机的,它们在太阳温暖的时候移动得更快④。(④小弗里斯顿可能是对的,许多种类的木虱会在直射的阳光下晒干,有些则会对温度的上升产生运动反应,这是随机运动水平的提高。)


弗里斯顿称这是他的第一次科学洞察,“所有这些人为的、人格化的,对目标和它们生存的解释以及类似的解释,似乎都只是在脱离。”他说:“你刚才所观察到的就是,从某种意义上说,这是没有其它办法的事。”


弗里斯顿的父亲是一名土木工程师,在英格兰各地的桥梁项目上工作,家人和他一起搬来搬去。在弗里斯顿的第一个十年里,年轻的弗里斯顿就读于六所不同的学校,他的老师们常常不知道该对他做什么,他通过独自解决问题来挽救自己脆弱的自尊心。在10岁的时候,他设计了一个自动扶正机器人,理论上,它使用自校正反馈制动器和水银液位,可以在携带一杯水的同时穿越不平的地面。在学校,一位心理学家被引进来了解弗里斯顿是怎么想出来的。“你很聪明,卡尔。”弗里斯顿的母亲不止一次的安慰他说:“别让别人说你不够聪明。”弗里斯顿说自己并不相信她。


当弗里斯顿十几岁的时候,他又有了另一个木虱时刻。他刚看完电视走到卧室时,注意到窗外樱花盛开。从那以后,他突然被一种从未遗忘的念头迷住了,“必须有一种方法来理解一切,从零开始。”他想:“如果只允许我从整个宇宙中的一个点开始,我能从中得到我所需要的一切吗?”他在床上呆了几个小时,做了第一次尝试,“显然,我完全失败了。”他说。


在中学快要结束时,弗里斯顿和他的同学们参加了一个早期的计算机辅助咨询实验,他们回答了一系列的问题,答案被输入到卡片,然后通过机器来推断完美的职业选择。弗里斯顿曾描述过他如何喜欢电子设计以及自然的独处,所以电脑建议他成为一名电视天线安装工。这似乎不对,所以他拜访了学校的职业顾问,说他想从数学和物理学的角度研究大脑。咨询师告诉弗里斯顿,他应该成为一名精神病医生,这意味着他不得不学习医学,这让弗里斯顿感到恐怖。


弗里斯顿和顾问都把精神病学,和他作为未来研究人员应该追求的心理学混为一谈,但事实证明,这是一个幸运的错误,因为它使弗里斯顿走上了一条研究身心的道路⑤,并且走向了他生命中最成熟的经历之一,一次让弗里斯顿失去理智的经历。(⑤弗里斯顿也有时间做其他事情,19岁的时候,他花了整整一个假期试图把所有的物理都挤在一页纸上,他失败了,但他成功适应了所有的量子力学。)


五.精神病院的工作经历


在完成医学学习后,弗里斯顿搬到牛津,在维多利亚女王时代成立的利特尔莫尔(Littlemore)医院实习两年。根据1845年的“精神病法”建立的利特尔莫尔医院,最初是为了帮助把所有“穷苦的疯子”从济贫院转移到真正的医院。到了20世纪80年代中期,当弗里斯顿到达时,它是英格兰市郊最后的几所旧精神病院之一。


弗里斯顿被分配到一组32名慢性精神分裂症患者中,他们是利特尔莫尔市(Littlemore)最贫困的居民,对他们来说,治疗主要意味着遏制。弗里斯顿以明显的怀旧情绪回忆起他以前的病人,是他们使得弗里斯顿了解大脑中的连接很容易被破坏的方式。“这是一个很好的工作场所。”他说:“这个小小的社区充满了强烈的精神病理学。”


每周他带领小组进行两次90分钟的治疗,病人们一起探索他们的疾病,让人想起今天的“问卡尔”会议。这个小组包括了30多年后仍然激励弗里斯顿思考的五颜六色的人物,希拉里⑥看起来能够饰演“唐顿庄园”里的高级厨师,但在来到利特尔莫尔医院之前,她用一把菜刀砍掉了邻居的头,因为她确信邻居已经变成了一只邪恶的、人形大小的乌鸦。(⑥在这个故事中,弗里斯顿在利特尔莫尔医院的病人的名字已经做了改变)


还有欧内斯特(Ernest),他喜欢玛莎百货(Marks & Spencer)柔和的开衫,和与之相配的橡皮底帆布鞋,“像你能想象的那样,他是一个猖獗而不可救药的恋童癖。”弗里斯顿说。

还有罗伯特,一个能言善辩的年轻人,如果他没有患上严重的精神分裂症,他可能是一名大学生。在罗伯特所有思考的事情中,他很沉迷于思考天使的大便,他思考这些东西是祝福还是诅咒,它是否可以被眼睛看到,他似乎很困惑,因为没有其他人想过这些问题。对弗里斯顿来说,天使大便的概念本身就是一个奇迹,它说明了精神分裂症患者的能力,他们可以将大脑功能更加正常的人很难接触到的概念组合起来。“想出一些像天使大便这样的东西是非常困难的。” 弗里斯顿说:“我绝对想不出来。”


在利特尔莫尔之后,弗里斯顿在上世纪90年代初使用了一种名为PET扫描的相对较新的技术,试图了解精神分裂症患者大脑中发生了什么,他一路发明了统计参数图,不寻常的是,弗里斯顿坚持认为这项技术应该自由分享,而不是专利和商业化,这在很大程度上解释了为什么它变得如此广泛。弗里斯顿飞往世界各地,比如美国马里兰州贝塞斯达的国立卫生研究院,把它教给其他研究人员。“实际上,我只是带着四分之一的生物识别磁带,上了飞机,把它带到那边,然后下载,花一天时间去工作,教别人如何使用它,然后回家休息。”弗里斯顿说:“这就是开放源码软件在那个时代的运作方式。”


六.辛顿给弗里斯顿带来启发


弗里斯顿于1994年来到皇后广场,几年来他在FIL的办公室,离盖茨比计算神经科学小组(Gatsby Computational Neuroscience Unit)只有几扇门的距离。盖茨比的研究人员从生活系统和机器系统中研究感知以及学习理论,它由创始人、认知心理学家和计算机科学家杰弗里·辛顿(Geoffrey Hinton)管理,盖茨比正日益成为神经成像的主要实验室之一,也逐渐成为有兴趣将数学模型应用于神经系统的神经科学家们的训练场所。


弗里斯顿和其他许多人一样,被辛顿对严肃的统计模型展现“孩子般的热情”所迷住,这两个人成了朋友⑦。⑦当时,辛顿住在卡姆登(Camden)一座特别嘈杂的建筑里,邻居家的水管很吵,于是他用橡胶和¾英寸厚的干墙在地下室的卧室里建了一个隔音箱,这样他和他的妻子就可以在那里睡觉。)


随着时间的推移,辛顿说服了弗里斯顿,认为思考大脑的最好方法是把大脑想象成一台贝叶斯概率机器。这个思想可以追溯到19世纪赫尔曼·冯·赫尔姆霍兹的作品,即大脑以一种概率的方式计算和感知,不断地根据感官的贡献做出预测和调整信念,根据最流行的现代贝叶斯解释,大脑是一个“推理机”,它寻求最小化“预测误差”。


2001年,辛顿离开伦敦前往多伦多大学,在那里他成为人工智能领域最重要的人物之一,他奠定了如今大部分深度学习研究的基础⑧。(⑧2012年,辛顿赢得了ImageNet挑战赛,这是一项在建立的1500万图像数据库中识别物体的竞赛,由Fei-Fei Li建立。ImageNet有助于将神经网络以及辛顿推向人工智能的最前沿。)


在辛顿离开之前,弗里斯顿最后一次拜访了这位盖茨比的朋友。辛顿描述了他设计的一种新技术,使计算机程序能够更有效地模拟人类的决策,这是一个集成许多不同概率模型输入的过程,现在机器学习中称之为“专家产品”。


这次会面使弗里斯顿及时转弯,受辛顿思想的启发,本着智力上的互惠精神,弗里斯顿给辛顿发了一套笔记,说明他把几个看似“无关的大脑的解剖、生理和心理物理属性”联系起来的想法。弗里斯顿在2005年发表了这些笔记,这是他之后将持续研究的关于自由能原理的几十篇论文中的第一篇。


卡尔·弗里斯顿办公室里使用的马尔可夫毯子——“让你的内心自1856年以后保持温暖”。


七.数学公式实现自由能原理


甚至弗里斯顿在描述自由能原理时也很难决定从哪里开始,他经常把其他人送上维基百科,但就我而言,从弗里斯顿办公室坐垫上覆盖的那层毛毯开始研究,似乎合情合理。


这是一件白色的羊毛毯子,上面印着一幅黑白人物肖像,画的是名为安德烈·安德烈耶维奇·马尔科夫(Andrei Andreyevich Markov)的俄罗斯数学家,他留着络腮胡子,表情严肃,死于1922年。这是一种长毛绒的涤纶面料,是弗里斯顿的儿子送给他的恶作剧礼物,里面却藏着已经成为自由能原理核心的一个想法。马尔可夫是这个被称为“马尔可夫毯”(Markov blanket)的概念的同义词,在机器学习中,“马尔科夫毯”本质上是一个手段,可以将一组变量与分层系统中的其他变量区分开来。与弗里斯顿h指数相当的心理学家克里斯托弗·弗里斯特(Christopher frith),曾将马尔科夫毯描述为“细胞膜的认知形式,将毯内的状态与外界的状态隔离开来。”


在弗里斯顿看来,宇宙是由马尔可夫毛毯内的马尔可夫毛毯构成的,我们每个人都有一个马尔科夫毯,它将我们与非我们的事物区分开来,在我们体内有毯分离器官,器官中有毯分离细胞,细胞中有毯分离细胞器。这些毯定义了生物是如何随着时间的推移而存在的,它们之间的行为也各不相同。没有它们,我们只是消散到太空中的热气。


“这就是你们读过的马尔科夫毯子,这是它,你们能感受一下。”当我第一次看到他办公室的毯子时,弗里斯顿冷冷地说。情不自禁,我确实短暂地伸出手去触摸了一下。自从我第一次读到马尔可夫毛毯时,就能到处见到。马尔可夫毯出现在一片树叶、一棵树和一只蚊子上,在伦敦,我看到他们围绕着FIL的博士后,围绕着反法西斯集会上身穿黑衣的抗议者,围绕着住在运河里小船上的人们。每个人都有一个隐形斗篷,每个人都有一个不同的生命系统,这个系统可以最大限度地减少自己的自由能。


自由能本身的概念来源于物理学,这意味着如果不深入到数学公式中,就很难精确地解释。从某种意义上说,这就是它之所以强大的原因,因为它不仅仅是一个修辞概念,而是一个可以被模拟的可测量的数量,使用的数学方法,与弗里斯顿用来解释大脑图像到这种改变世界的效果相同。但是,如果你把这个概念从数学翻译成英语,你大概会得到以下结论,即自由能是你所期望的状态和传感器告诉你的状态之间的差异。或者,换句话说,当你最小化自由能时,你最小化了意外。


八.自由能原理的普适性


据弗里斯顿说,任何具有抵制无序和解体倾向的生物系统⑨都遵循自由能原则,无论是原生动物还是职业篮球队。(⑨ 2013年,弗里斯顿运行了一个模型,模拟原始汤中充满漂浮的分子,他编程使它既符合基本物理原理,又符合自由能原理,这个模型产生的结果看起来像有组织的生活。)


单细胞有机体具有与大脑相同的减少意外的必要性。


唯一的区别是,随着自组织生物系统的发展,人类的大脑极其复杂,它吸收了来自数十亿个感受器的信息,并且需要有效地将这些信息组织成一个精确的世界模型。弗里斯顿说:“从某种意义上说,大脑是一个奇妙的器官,它产生的假设或幻想适合于解释这些无数的模式,也就是它所接收到的一系列感官信息。”为了预测下波、下下波甚至下下下波感觉会告诉它什么,大脑不断地根据感官传递回来的信息进行推理和更新信念,并试图将预测错误的信号降到最低。


到目前为止,你可能已经注意到,这听起来很像辛顿在上世纪90年代告诉弗里斯顿的,贝叶斯关于大脑作为一个“推理机”的想法。事实上,辛顿认为贝叶斯模型是自由能原理的基础(“自由能”甚至是“预测误差”的一个粗略的同义词)。但是对于弗里斯顿来说,贝叶斯模型的局限性是因为它只解释了信念和感知之间的相互作用,而并不能解释身体或行动,它不能把你从椅子上弄下来。


这对弗里斯顿来说是不够的,他用“主动推理”这个词来描述生物体在世界上游走时尽量减少意外的方式。弗里斯顿认为,当大脑做出的预测没有立即被感官反馈所证实时,它可以通过两种方式之一将自由能降到最低,一是它可以修正预测并吸收意外,承认错误,更新世界模型。或者它能采取行动,使预测成为现实。如果我推断我正用左手食指触摸我的鼻子,但我的本体感受器告诉我,我的手臂挂在身边,这时我可以把我大脑愤怒的错误预测信号降到最低,方法是举起那只手臂,把一只手指压到我的脸中间。


事实上,这就是自由能原理解释了我们所做的一切,即感知,行动,计划,解决问题。当我上车去办事的时候,我就是通过行动来确认我的假设(也是幻想)来最小化自由能。

对于弗里斯顿来说,将动作和运动合并到等式中是非常重要的。他说,甚至知觉本身是“行动的奴隶”,因为为收集信息,眼睛的投射,隔膜把空气吸入鼻子,手指对表面产生摩擦,所有这些精细的运动都存在于一个更大的计划、探索⑩、和行动的连续统一体中。(⑩弗里斯顿对这种探索的称呼是“认知觅食”。弗里斯顿在同事中因他的术语而“饱受诟病”,这些词被统称为弗里斯顿语(Fristonese)。)


“我们以世界为样本。”弗里斯顿写道:“以确保我们的预测成为自我实现的预言。”


九.自由能原理解释精神疾病


那么,当我们的预言无法自我实现时,会发生什么呢?一个系统被意外所淹没会是什么样子?自由能原理,它不仅是一个统一行动、感知和计划的理论,也是一个精神疾病的理论,当大脑对感官反映的证据作出错误判断时,麻烦就会发生。例如,患有精神分裂症的人可能无法更新他们的世界模型来解释眼睛的感官输入。在其他人可能会看到一个友好的邻居,希拉里可能会看到一只巨大的、邪恶的乌鸦。弗里斯顿说:“如果你想一想精神疾病,实际上是大多数神经疾病,那就是信仰破裂或错误推理的幻觉和妄想。”


在过去的几年里,弗里斯顿和其他一些科学家利用自由能原理帮助解释焦虑、抑郁和精神病,以及孤独症、帕金森病和精神病的某些症状。在许多情况下,多亏了弗里斯顿的神经成像方法,科学家已经知道大脑的哪些区域会在不同的疾病中发生故障,哪些信号会被破坏,但这还不够继续后面的研究。“仅仅知道是哪些突触、哪些大脑连接不正常是不够的。”他说:“你需要有一个关于信念的微积分。”


因此,自由能原理提供了统一的关于思维如何运作,以及精神如何故障的解释。因此,也有理由认为它有可能使我们走上从头开始构建思想的道路。


几年前,一组英国研究人员决定用一种新的分析工具重新审视乔治三世疯癫的事实。他们将国王写的大约500封信装入机器学习引擎,并费力地训练该系统识别各种文本特征,即单词重复、句子长度、句法复杂性等等。在训练过程结束时,系统能够预测这封皇家信件,是在狂躁状态写的,或是在神智正常时写的。


十.自由能原理较“强化学习”技术的优势


这种类型匹配技术,与过去几年来,计算机识别人脸、猫以及语音类型的技术大致相似,推动了计算技术的巨大进步,但它需要大量的预先数据和人力监督,而且可能很脆弱。另一种人工智能方法,被称为强化学习,在游戏取胜中显现出难以置信的成功,包括围棋、国际象棋、雅达利的打砖块游戏等。强化学习不需要人类对大量的训练数据进行标注,它只需要告诉神经网络去寻求某种奖励,通常是在游戏中获取胜利,神经网络通过一遍又一遍的玩这个游戏来学习,优化任何可能会让它进入最后胜利的动作,就像狗学会执行某些任务以获得奖励一样。


但强化学习也有相当大的局限性。在现实世界中,大多数情况都不是围绕一个简单的目标来组织的,有时你必须停止玩“打砖块”游戏,比如你需要去上个厕所,需要去灭个火,或者需要去和你的老板说话。而且大多数环境并不像游戏那样稳定和规则约束,神经网络背后的重点在于它们应该像人类一样思考,但强化学习并不能真正达到目的。


对弗里斯顿和他的狂热者来说,这种失败是完全合理的。毕竟根据自由能原理,人类思维的根本动力不是寻求某种武断的外在回报,而是为了最小化预测误差,显然,神经网络也应该这样做。自由能原理背后的贝叶斯公式,那些很难翻译成英语的公式,已经用机器学习的语言写出来了,这一点很有帮助。


2014年,Netflix机器学习基础设施主管朱莉·皮特(Julie Pitt)发现了弗里斯顿和自由能原理,这改变了她的想法。(皮特的推特简历上写道:“我通过积极推理推断自己的行为。”)除了在Netflix的工作之外,她还在探索一个业余项目,即将这个原理应用在一个名为“数量级实验室”中。皮特说,自由能模型的美妙之处在于,它允许人工主体(artificial agent)在任何环境中活动,即使是新的和未知的环境。在旧的强化学习模式下,你必须不断制定新的规则和分部奖励,让你的主体应对一个复杂的世界。但自由能主体总是产生自己固有的回报,将意外降到最低程度。皮特说,这种奖励包括了外出探索的必要性。


2017年末,由伦敦国王学院(King‘s College London)神经学家兼工程师罗莎琳·莫兰(Rosalyn Moran)领导的一个小组,在3D射击游戏“末日”(Doom)的一个版本中,让两名人工智能玩家对决,目的是将主动推理驱动的主体与报酬最大化驱动的主体进行比较。


以奖励为基础的主体的目标是在游戏中杀死一个怪物,但是自由能驱动的主体只需要尽量减少意外。这位弗里斯顿的主体慢慢地出发了,但最终它开始表现得好像有了游戏的模型,它似乎开始有意识,例如,当怪物有向右移动的倾向时,主体会向左移动。


过了一段时间,很明显即使在游戏的训练环境中,奖励最大化主体“显然不那么健壮”,自由能主体已经能更好地了解自己的环境。莫兰说:“它的表现超过了强化学习主体,因为它是在探索。”在另一种模拟中,自由能最小化主体与真正的人类玩家对抗,故事也是相似的。在迅速取得类似人类的表现之前,弗里斯顿主体都在开始缓慢、积极地探索,就是弗里斯顿所说的“认知觅食”。


莫兰告诉我,“主动推理”模式正开始扩展到更主流的深度学习研究,尽管进展缓慢。弗里斯顿的一些学生继续在DeepMind和GoogleBrain工作,其中一人创建了华为的人工智能理论实验室。“它正从皇后广场扩散。”莫兰说,但它仍然没有强化学习那么普遍,因为后者即使是大学生也能学习,“还没有教大学生自由能原理。”


十一.前景无限却又难以理解


当我第一次问弗里斯顿自由能原理和人工智能之间的联系时,他预测,在5到10年内,大多数机器学习都会吸收自由能最小化。第二次,他的回答却是滑稽的,他说:“想想为什么这被称为积极推理。”当他等待我接上他的文字游戏时,他洁白的牙齿随着微笑显露出来。“嗯,这是人工智能。”弗里斯顿说:“那么主动推理是新人工智能吗?当然,主动推理的首字母缩写就是AI。”这不是弗里斯东式笑话第一次从我耳边掠过。


我在伦敦的时候,弗里斯顿在某家贸易公司做过一次报告。大约有60名娃娃脸面容的股票交易员在结束了他们一天的工作后出席了会议,弗里斯顿描述了自由能原理如何模拟人工主体的好奇心。大约15分钟后,他要求听懂的观众举手,却只看到三只手,于是他倒过来问:“如果你觉得这完全是胡说八道,你不知道我在说什么,你能把手举起来吗?”这一次,很多人举手,我觉得没举手的人都很有礼貌。还有45分钟,弗里斯顿转向演讲组织者,看着他,好像在说,到底是怎么回事?经理结结巴巴地说:“这里的每个人都很聪明。”弗里斯顿亲切地表示同意,并结束了他的演讲。


第二天早上,我问弗里斯顿,他是否认为谈话进行得很顺利,因为那些聪明的年轻人似乎很少能理解他。“对于很大一部分观众,这个理论跟他们毫无关系。”他说:“有时候他们很生气,因为他们听说这件事很重要,但他们不明白。他们不得不告诉自己这是垃圾,然后离开,你慢慢就会习惯的。”


2010年,哥伦比亚大学(Columbia University)的精神病学家彼得·弗里德(Peter Freed)召集了15名大脑研究人员,讨论弗里斯顿的一篇论文。弗里德在《神经精神分析》杂志上描述了所发生的事情:“房间里有很多数学相关人员,包括三名统计学家、两名物理学家、一名物理化学家、一名核物理学家和一大群神经成像专家,但显然我们并没理解这篇论文。我和普林斯顿的物理学家,斯坦福大学的神经生理学家,冷泉港的神经生物学家都见过面,来讨论这篇论文,结果又一次空白,因为太多的方程式,太多的假设,太多的移动部分,太全球化的理论,而且也没有机会提问,所以人们放弃了。”


但对于所有对弗里斯顿的不可理解感到愤怒的人来说,却也有很多人认为他已经打开了一个巨大的宝藏,这个想法可能会和达尔文的自然选择理论一样广泛。2014年,加拿大哲学家麦克斯韦·拉姆斯特德(Maxwell Ramsted)第一次阅读弗里斯顿的著作时,他已经在努力寻找方法,以期将存在于不同规模的复杂生物系统联系起来,从细胞到大脑,再到个人,再到文化。2016年,他遇到了弗里斯顿,弗里斯顿告诉他,适用于细胞分化的数学(即未分化的细胞分化的过程)也可以应用于文化动态。“这对我来说是一次改变生活的谈话。”拉姆斯特德说:“我差点流鼻血。”


“这在历史上绝对是新奇的。”拉姆斯特德对我说,当时我们正坐在皇后广场的长凳上,周围都是病人和周围医院的工作人员,在弗里斯顿出现之前,“我们注定永远在这个没有共识的多学科空间里徘徊。”他继续说:“自由能原理提供了这种共识。”


2017年,拉姆斯特德和弗里斯顿与墨尔本大学的保罗·巴德科克合著了一篇论文,他们用马尔可夫毯描述了所有的生命。如同细胞是一个被马尔可夫毯覆盖的系统,为了生存而最小化自由能一样,部落、宗教和物种也是如此。


在拉姆斯特德的论文发表后,当时的认知神经学家米迦·艾伦写道,自由能原理已经演变成艾萨克·阿西莫夫的精神史的真实版本⑪,这是一种虚构的系统,可以把所有的心理学、历史和物理学归结为一门统计科学。(⑪在1951年出版的《基地》一书中,阿西莫夫笔下一个人物将心理历史定义为“数学的一个分支,它处理人类综合体对固定社会和经济刺激的反应”。)


确实,自由能原理似乎已经扩展到这样一种地步,即使它不能解释一切,其实也几乎差不多可以了。(弗里斯顿告诉我,当细胞被迷惑时,癌症和肿瘤可能是错误推断的结果。)正如艾伦所问的:一个可以解释一切的理论,是不是其实什么都没有解释?


十二.自私的研究动机


在我旅行的最后一天,我在里克曼斯沃思(Rickmansworth)拜访了弗里斯顿,他住在一个装满动物标本的房子里,这是他妻子的爱好。


碰巧,里克曼斯沃思镇出现在《银河系漫游指南》(Hitchhiker‘s Guide to the Galaxy)的第一页,在这个小镇上,“一个独自坐在一家小咖啡馆里的女孩”突然发现了让世界变得“美好而幸福”的秘密,但命运会介入,“她还没来得及打电话告诉任何人这件事,就发生了一场可怕而愚蠢的灾难,这个想法永远消失了。”


目前还不清楚,是否正如它的一些信徒所认为的那样,自由能原理是让世界变得美好而幸福的秘诀。弗里斯顿本人在我们的谈话中倾向于采取一种更加谨慎的语气,只是暗示了积极的推论及其推论是相当有希望的。甚至有几次,他承认自己可能只是在“胡说八道”。在我参加的上一次小组会议上,他告诉与会者,自由能原理是一个“似乎”的概念,它不要求生物或事物是为了生存而最小化自由能,它仅仅是对生物自组织的一种解释。


弗里斯顿的母亲几年前去世了,但最近他回想起她在他童年时的一再保证:你很聪明,卡尔。“我从来不太相信她。”他说:“可是现在我发现自己突然被她的论点所诱惑了,现在我确实相信我是相当聪明的。“但他说,这种新的自尊心也促使他重新审视自己的自信。


弗里斯顿说,他的工作有两个主要动机。他说,有朝一日,自由能原理带来真正的人工意识当然是最好的,但这并不是他的首要任务之一。相反,他的第一大愿望是推进精神分裂症的研究,帮助修复病人的大脑,就像他在旧精神病院认识的那样。他说,他的第二个主要动机是“更自私”的。回到那个晚上,在十几岁的时候,他在卧室里看着樱花想:“我能用最简单的方法解决这一切吗?


“这是一件很放纵自己的事,背后没有无私的临床同情心。这只是一种自私的愿望,想要尽可能彻底、严格和简单地理解事物。”他说:“我经常回想人们对我讲的笑话,有时是恶意的,有时是非常有趣的,但我始终无法沟通。我想,我不是为你写的,我是为自己而写。”

弗里斯顿告诉我,他偶尔会错过最后一班开往里克曼斯沃思回家的火车,他沉迷在某个问题上好几个星期。因此他将睡在办公室,蜷缩在他坐垫的马尔可夫毛毯下,安全和安全地脱离外部世界。