Dr. 魏聊聊人的智能 | 魏坤琳北大演讲实录

2016-04-25 魏坤琳、凌云 Xtecher Xtecher


在讨论人工智能之前,让我们先了解什么是人的智能。


2016年4月15日晚,北京大学研究生会、北京大学燕新社联合Xtecher共同主办“未名对话”系列讲座之一——“对话人工智能”。作为嘉宾之一,最强大脑科学判官Dr.魏发表演讲,主题为《人的智能》


演讲嘉宾魏坤琳,北京大学心理学教授、运动控制实验室负责人、最强大脑科学判官。

本文整理:Xtecher特稿记者 凌云





 以下为魏坤琳教授演讲实录: 



人的智能


(潇洒地把大衣脱了)我起了一个非常大的title,有一个非常大的野心,要在20分钟里把人的智能讲清楚。




大家都在谈人工智能,那你们猜:什么是智能?什么给我们智能?什么时候你会认为一个机器人享有智能?


(女同学甲:有情感)

OK,有情感,哺乳动物就开始有情感了,就有所谓的“情绪脑”。


(女同学乙:会思考)

会思考,thinking,thinking太复杂了,是不是包括太多?


(女同学丙:认知)

认知这个词也太复杂了。


智能不等于智力。


智力是人的能力,可以划分为推理能力、短时记忆、长时记忆、读写能力、理解能力、视觉加工能力、听觉加工能力等等。这是在《最强大脑》上讲的东西,智力是对人的能力的衡量。



那到底什么是智能


我认可的定义是:面对障碍的时候,能够根据理性的规则,遵循事实作出决策,从而达到目标。




按照这样的定义,现在的人工智能都是非常专业化的智能,能够下象棋、下围棋、做语音识别的,但人的智能就比较通用。面对障碍,人能够认清楚什么是事实,能够把知识给抽象化,能认识到规则,然后做出决策,从而达到目标。


举个例子。假设你以一个上帝视角来看这个世界,有个外星人来到地球,你发现他喜欢抱着大树。你会觉得外星人在犯傻吗?他有智能吗?没准大树有提供他需要的养分,是他们需要活下去的根基,他可以依靠大树形成自己的文明。那他就是有智能,因为他根据他的规则达成了他的目标,我们不会说他傻,OK?



Part 1: 心智运算




在我看来,智能就是做运算。这点跟人工智能很像。为了说清这件事,我举几个例子。


▼运动


人脑怎么控制运动?比如要做一个伸手够物体的动作。幼儿大约在七八月的时候,就可以伸出手去准确地够到一个物体。


我们来分析一下人的胳膊。




粗的黑线全部是你的肌肉。有些肌肉是单关节的,有些肌肉是双关节的。那个动作的目标是控制两个肢节,从一点到另一点,越快越准越好。


但当你要控制这么多肌肉的时候,你会发现,啊哦,我该怎么控制这么多条肌肉?我大脑要同时发出多少指令?这些指令是什么样子?




上图的每一行是一条肌肉的激活信号,每一列是手往不同方向运动的要求。向前运动和向后运动的肌肉激活完全不一样,因此,每做一次最简单的动作,都需要发出大量的运算指令,来告诉每一条肌肉应该怎么激活?怎么协调?相互大小多少?相互时间关系多少?这都需要大脑当场把这计算出来。


那你会意识到你的大脑在做这些运算吗?


没有意识。以前心理学研究认为这并不重要,但当我们去做机器人的时候才发现这很重要。人类几个月大的时候就能完成智能的表现,但机器人到今天都不能很好地完成。因为我们并不了解大脑是如何进行运算的。


在人工智能刚刚兴起的时候,大家提出了质疑,觉得人类的骄傲是操控符号的抽象思维能力,所以我们拼命往那个方向走。结果,计算机已经是操控符号的佼佼者了。


但是,人工智能还不知道如何像人一样很好地控制运动,连运动这样的“低级”智能都搞不定。我们人类还生怕运动的挑战不够难,发明出各种各样的体育运动,挑战自己,简直是赤裸裸的炫耀啊,向机器人炫耀这个智能。


不过,最近,在神经运动学方面,科学家大概找到了人脑如何控制运动的算法。




我知道每次把公式亮出来的时候,观众会走掉一半。


(小X:男神看到没有人起身,一脸傲娇,好啦,谁叫你是集美貌与才华于一身的男子呢⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄)

(此处Dr.魏进行视频演示)我们可以根据上面的公式进行模拟实验,模拟出一个虚拟的人形肢体,输入一个刺激,把它的重量突然变成一倍,它会跪倒在地,然后试图慢慢地爬起来,是不是很像智能的行为?这就是对付扰动时应该做出的反应。拉他一下,你看!已经很像人了,对不对?


(此处Dr.魏进行视频演示)还可以教一个机器人怎么拍乒乓球。我的博士论文就是学习人类怎么拍球(害羞又得意地笑)拍球是一个不稳定的行为,球的高度、角度、落地都不稳定。我们需要知道人是怎么通过视觉感知乒乓球的运动从而做出智能判断的。机器人能实时地立刻学会。骗他一下哈,用手抓一下,OK,它马上克服了,你看,聪明!



(此处男神正在各种调戏这个机器人……

小X只想说,别动机器人,冲我来!)


那人到底是怎么控制运动的呢?(一秒变正经




大脑有一项功能叫做
运动指令拷贝(Efferent Copy):当运动指令发到肌肉之前,会进行一个备份。这个备份会在大脑里做一些模拟,它可以预测这个运动的行为是什么。肌肉对指令的感觉回馈有一些延时,但是运动指令拷贝的预测没有延时。预测和反馈的信息融合在一起,就能估算出当前的状态,从而做出最优的反应。因此,人的运动控制实际上是个优化过程。


根据什么优化呢?就是运动指令的大小,运动指令要越小越好,也就说越偷懒越好,运动指令太大了会消耗能量。


基于上述框架,人脑进行了最优运算,算出了一个最优的控制指令,发给肌肉,人就表现出了各种各样的行为。


这个公式很简单,但并不是所有的认知系统都能找到大脑的实际算法并写出公式来。我们希望看到这样的算法用到机器人上面。


▼知觉


你是不是觉得知觉特别地简单?


比如,我站在这里,这个房间大概多深,你们离我多远,我的眼睛能识别出每一个人的面孔。这是不是对我们人类来说毫不费力?


是的,毫不费力,但是这背后的运算是非常大的。




举个例子。一堆煤球在太阳光下面晒。太阳光直射的时候,煤球反光。还有一堆雪球在室内,也会反光。但是,煤球反光的强度大小其实是高过雪球的,也就是说,煤球的反射光比雪球的反射光更亮一些。好,那大脑就得到了这样两个信号。按理说,信号越强就应该越白,但是你的大脑却认为煤球是黑的,而雪球是白的。


为什么大脑做出了一个相反但聪明的翻译?人的知觉的这种翻译是毫不费力的,跟运动系统一样,同样的刺激信号会有不同的答案、不同的翻译。你的知觉实际上是你对这个世界的翻译。


再举个例子。





不同距离的树在视网膜上的投影都是一样大的。但你能毫不费力地判断这些树的远近。




每一条线的形状都不一样,倾斜角度也不一样,但是在视网膜上的投影也是一模一样的,可你还是能判断得出来。


这说明了什么?当你只有非常模糊、模棱两可的信息时,你的大脑依旧能能识别出来,这是因为你的知觉系统做了很多的运算,只是你不知道而已。




▼情感


推理、记忆也都是运算,大家比较好理解,那情感呢?情感也是运算。




人类有六种最基本的情绪:高兴(happiness)、悲伤(sadness)、惊讶(surprise)、厌恶(disgust)、害怕(fear)和愤怒(anger)。


在这个世界上,好像理性的人会更占便宜一点,他们能做出更加理性的判断。总有些人说,情绪会让人变得不理性,情绪泛滥会有什么坏结果。


那人为什么要有情绪?情绪在进化上要起到什么样的作用?


我把情绪看作是一种判断、一种感知其实,人所有的记忆都有情绪的色彩。你的人生发生的任何事情实际上都有一些情绪的色彩在上面,我们因为情绪有了一些偏好,有自己喜爱的东西。


那情绪在运算上起什么作用呢?我觉得它是一个动力源,人可以通过情绪调动认知资源。


比如说愤怒。要激起一个人的愤怒特别简单。我走到一个人面前,他不知道我要做什么,“啪”的一巴掌,三秒钟之内,他的火就腾起来了。愤怒,是自动的,来得非常快。你当时还在平静地听我讲座,突然一下你就进入了战斗状态,它让你从一个状态跳到另一个状态。这在计算机里面叫做中断,直接把你原先的状态切断,跳到另外一个状态,情绪可以干到这种事情。


情绪可以切换模式,这是非常有用的。比如悲伤让我们有决心去改变生活的轨迹,害怕让我们逃跑,欢乐让我们追求某种愉快的事物。我觉得情绪像中断信号、强度信号。


我们还有更复杂的情感:骄傲(pride)、内疚(guilt)、尴尬(embarrassment)、羞耻(shame)……这些情感是社会化的情感。因为我们是社会化动物,情感能让他人判别你处在一个什么样的状态,这是非常重要的。换言之,社会化行为是要社会化运算(social computing)的。


比如说,孤单可以让你去寻找别人的安慰陪伴,亲情让你更有动力去抚养儿孙,这在进化上非常有意义。必须爱你的子孙,才能够抚养他,才能够将基因延续下去。这份爱好像是天生的,无条件的巨大付出,这是人类通过情感做出的运算决定。


讲了这么多例子,就是想告诉大家,无论是你有意识还是无意识,大脑一直在做各种运算。


关注本公众号(ID:Xtecher),后台回复  “魏坤琳” ,可获得演讲PPT。



Part 2: 意识




下面讲一个更大的topic——意识。


意识是什么东西?


(女同学A:人觉醒时的一种状态)

OK,就像早上把电源打开一样,咚,起床,然后look around……还有什么?我们要“给电脑以意识”,要“给人工智能以意识”,到底什么意思?


(女同学B:对固定和流动的东西都有很强烈的觉察

哇,在心理学我就把你这句话解构成注意,这是一个很好的回答,还有什么?


(第一位男同学上线:对周边环境产生的想法)

OK,看到一个东西,对它进行更多的处理,还有什么?


(女同学C:对自己和他人的关系有独特的解读)

对自己和他人的关系,对,其实最关键的一个就恰恰是她说的。


▼自我意识


首先认识到自己,这就是自我意识。




不是所有动物都有自我意识。心理学有一个著名的镜子测验:把动物放在镜子面前,看它能不能意识到镜子里面是自己的影像。


比方猴子在额头中间点个红点,猴子过去一看,诶,有个红点,我把它擦一下,你也会做这样的行为,ok?(小X:男神,你说就好了,没必要真的去摸自己的额头……)


有些动物可以通过测验,比如,猴子、大象、海豚、某些鲸类、喜鹊等。


很多人会问,人工智能会不会有自我意识?首先我们要知道,自我意识只是意识中的一部分,但恰恰是最简单的一部分。


每个人的心智(mind)中都有一个关于自己所有表征的条目。自我意识的判断就是去匹配这个条目是否符合。


我知道我自己好多特征,我一看那镜子,诶,这个特征和我的条目刚好match上了,我当然可以去抹我自己的东西了,对不对?抹这个红点,是最容易的。当然,进化有一个自己的条目很难,大脑必须足够发达才行。


▼信息访问


大脑有两种信息的访问:一种是有意识的信息,另一种是无意识的信息


有意识的信息很多是视觉信息,也有听觉信息,它们一般都存储在短时记忆中间。


比如,我现在闭上眼睛,没有了视觉输入;你们没人说话,也没有了听觉输入;但我在想一个数学问题,3+2等于几,这还是有意识的访问。我从长时记忆中将“3+2”调入短时记忆(也叫“工作记忆”)中,进行处理。


大脑还进行了很多无意识的处理。


比如说,视觉背后的很多运算。视网膜上统一投影的影像来自不同的物体,我们一下子就将它们分离开来,你说不出个所以然来解释,因为这个运算是在意识层面以下,直接自动地就完成了。


运动也是如此,我在这晃来晃去跟你们做了这么多手势,从来没有想过这些手势应该怎么做,从来没有想过要对肱二头肌说,喂,拜托,你多用力一点。


语言也是,声音听到你们耳朵里,大脑就自动翻译成语义了。


还有阅读的时候,文字是个视觉的输入,但是你不会注重那些文字的视觉细节,你直接看的是语义,不然你怎么看得下去,对不对?


意识的研究核心是有意识处理的信息。


有意识的信息处理叫做信息访问的意识。信息访问是在工作记忆中。工作记忆相当于一个公告板,对一个信息进行多个系统的处理。


比如,我看到了一瓶水,这瓶水出现在了“公告板”上。我的语言系统可以描述它,我想告诉你,这水我刚喝了一口,就下去了一丁点;我想这个瓶子到底有多少水,估重多少,这直接传到我的运动控制系统,想让我用手去抓它,虽然我现在没动,但是我想去抓这件事情已经让我的运动系统触碰这个信息了;你可以推断,盖子是打开的,那肯定是被喝过的;你可以对它进行进一步的运算,你可以仔细地分析它,比如说,因为我老上电视,嗨,我没有老上电视,就上了那一个……但我特别敏感,我们经常会把瓶子上的包装给撕掉,怕给人做广告,所以你会仔细地分析当时的场景适不适合把这个广告给它露出来。


由此可以看出,工作记忆临时存储的有意识信息可以被大脑中多个系统访问,这是个并行系统。



我们的大脑同时大概可以处理四个信息。按理说,工作记忆越广,人的智商越高。但是为什么人类只能同时处理四个信息?因为大脑是有算计成本的。


第一,空间的成本。象棋有N个下法,大脑试图记住所有的格局和路线是不现实的,大脑的空间是用来存储算法而不是内容,不需要占用太多的空间。


第二,时间的成本。假如工作记忆塞了很多东西,假设你是个超级外星人(小X:男神真的好喜欢外星人这个梗啊~),不是四个items而是四万个items,从中间建立一些联系,找到所有的可能的话, 需要花费很长的时间。而我们需要快速地决策,必须要在决策差不多的时候在说,OK,let's make a decision.


第三,能量的成本。这其实相当一个处理器,我们都不希望处理器太耗能。


综上所述,人类的工作记忆就只有这么大。





那信息访问的意识有几个特征?


第一特征:有意识的信息恰巧是大脑的中间层信息。




比如说,我站在这里看着你们的脸。在分析一个东西的图像时,
视觉中枢是从底层往高层一级级处理的。


最底层的是线条、明暗、质地等最低级的视觉特征。再往上面走,立体视觉开始自动处理,我看到了你们脸的轮廓和你们的表情,这是我能意识到的,不会再注意到下面的底层细节。再往上面走就是更高级的信息——长时记忆。第二天回忆今天的经历,那个房子是个什么样子?我把这个记忆调出来以后,再用视觉系统扫一下,诶,有一个摄像机,然后我甚至可以调出你们的面孔(哇!),呃,只有部分人的面孔(……),但这个时候信息又被压缩了一遍,就是将深度压缩的信息抽调出来。




由此可以发现,你的意识总是中间的这些表象。所以,识能碰到的信息是特定的信息,因为这个信息最有用,是帮助我们实时地掌控这个世界的,就像现在你们的面部表情就很有用,听懂了我就继续讲,没听懂那我就换种说法,这些信息有利于我的下一步行为,所以意识是中间级的。


第二特征:注意力的聚光灯


下面做一个实验,大家从图中找到绿色圆圈。


大家一看到绿色的圆圈就马上把手举起来哈!举起来!预备……开始!



找到了吧?很快对不对?还可以,一秒之内。


再来,还是找这个绿色的圆圈,准备啊,你们要快啊,1,2,3,找绿色的圆圈!






很快是不是,是不是比上次还快一点?


好,最后一次,还是找绿色的圆圈:





(焦急)找到没有?快一点!找到没有?好,举手了,找到了!


你看前两次的时候,绿色圆圈是不是蹦出来的?第三次找的时候,是不是你的目光一个个扫过来的?对不对?你的眼球开始动了,你开始有意识地搜索,你开始调整你的注意力了。这就是意识的第二个特征:注意力是个聚光灯



首先,对信息的处理有一个无意识的平行阶段。前两次,当视网膜信息全都知道的时候,只要判断一个特征,那玩意儿就像跳出来一样,这是无意识的加工。


但第三次的时候,变成两个特征才能把它区分开来,就从平行处理变成了扫描序列处理了,并且是有意识的序列阶段,进行一次又一次地信息粘连。粘连的时候需要使用注意力。


为什么我们要这样处理?


因为平行处理是有代价的如果视网膜上有100万个识别器进行平行处理,那还能够做到。但是如果这100万个识别器包括颜色的、形状的、轮廓的、深度的移动方向的,进行同时处理,则是做100万×100万×100万的逻辑运算。你试试看你的大脑有这么强大吗?没这么强大。所以要用意识去粘连这些不相干的特征。这是在你的工作记忆中完成的。


第三特征:意识信息的情感着色



很多信息都是带情感的


比如说,愉快的信息有水、食物、性、钱、美景等等。有些信息则是带另外一种情感,比如痛苦,人会尽可能地避免这类情感。所以意识信息有情感着色。


第四特征:汇集信息,“我”执行控制



“我”到底是什么?在哲学上,曾经认为大脑中有一个小人存在,他是最后的的命令官,作出决策。但实际上心理学家认为,我们极可能是很多信息的循环处理,某个信息到一定程度,处理完了以后,传递到下一个去。所谓的“我”,只是将运算不断地交付到下一节。


如果一个人的前额叶受损,特别是前扣带回受了损伤,那地方恰恰是做决策的脑区,会发生什么样的情况呢?他可能洗澡洗了四个小时,就是不出来。因为他一直在做决策,出还是不出。他的其他脑功能都是健全的,但信息从感知系统传到运动系统的那一下,这个决定断了。


▼感知

意识的第三部分是感知力。这恰恰是让人最疑惑的部分。



现在问一个听起来很哲学的问题,为什么你认为这个颜色是


我确定它是红色,是因为红色的刺激在我大脑中间造成了某种神经活动。但是,在我脑中的这种活动,在你脑中可能是造成绿色的那种活动,但你还是说是红色,有这种可能吗?有,只是你不知道而已。


红色是后天学习得到的,但无法判断大脑的对这种颜色的活动都是一样的,这就是感知的主观性。


台下有没有僵尸或者机器人?你别假装是人,给我站出来!


可能表现出所有像人一样的行为,但其实没有感知力,感知不到外界的存在,只是根据一套设定的程序表现得像人一样。有这种可能,不能否定它的存在,这就是主观的厉害。


再问一个问题:如果计算机复制了大脑的所有信息运算,它会有意识吗?有没有感知力?


(一群同学:有……)

(一群同学:没有……)


所以你们一定要问Dr. 魏才知道答案!!!我告诉你最后的答案,好不好?


(所有同学:好!)


好,那我告诉你(一本正经脸)——这是一个没有意义的问题。



【小X:男神,不带这么玩儿的……】


你根本就不能回答这个问题,因为那是计算机的主观感受。


它看到红色的时候,表现得跟你一样,耶,红色耶!但是你不知道它的主观行为是什么样子,你怎么知道它有没有感知力,它复制了你所有的运算。


这就是逻辑实证主义:如果一个陈述不能被证实,那它实际上是没有意义的。


Steven Pinker说,所有感知力的表现(神经的、运算的)都被解释完以后,没有什么剩下了。他说的感知力的表现就是主观感受。我们能够测的是运算,比如行为的表达、神经的活动,当这些能被客观观测的东西全被解释之后,就没有其他可以解释的话了,剩下的就是主观。


关注本公众号(ID:Xtecher),后台回复  “魏坤琳” ,可获得演讲PPT。


Part 3: 人工智能的未来



预测是很危险的。


热学和电力学的先驱Lord Kelvin在1885年说,比空气重的机器是不可能飞起来的。后来有了飞机,他的预测是不是错得离谱?早期计算机真空管的发明人Lee Deforest说,不管将来科学怎么样发达,人类永远不会去月球。他也错了。




很多聪明的人包括科学家预测的时候都是不靠谱的,所以我下面,哈哈哈,不好意思,就大胆预测一下。


我做的预测是这样的:




鸟可以飞,它是生物化的存在,它是自主的,它可以感知这个世界,跟人一样。但一个人造飞机也可以飞,跟鸟做一模一样的事情。


既然我们人类可以思考,机器也可以思考,可以做一模一样的事情,甚至机器更厉害,比如,飞机比鸟飞得更高更远。


但是你需要说,一个就代替了另外一个吗?你需要说,一个就威胁了另外一个吗?


这是肯定会发生的。


我们是人,占领了这个星球,用人的智能占领了这个星球。但去外星球呢?未必如此。因为我们是碳基生物,我们有这样的硬件,他们可能是硅基,硅基可能更加不朽一点,也可能运算能力更强大一点,能够跨越时空。


好,谢谢大家!


关注本公众号(ID:Xtecher),后台回复  “魏坤琳” ,可获得演讲PPT。





对谈环节,从左至右依次为:Xtecher COO张一甲、Dr. 魏、谭营教授、赵建业教授


讲座之后全场大合影,小X能和男神同框,好激动啊~~~


| 推荐阅读 | 点击文字直接跳转

精品文章

佳格数据张弓:从NASA走出的“理性疯子”,他志在耕耘天地间

Ping++金亦冶:所有你走过的捷径,总有一天都会再绕回来

李甫:人生很奇妙,莫名的奇妙

孔淼:在我还不知道代码是什么的时候,我只想写诗

冯一村:此时此刻,给大数据一个注视

姜文一:一半是海水,一半是火焰

赵勇:把未来一个齿轮一个齿轮地变成现实

王淮:冒险者的幸运牌

宋嘉伟:一个从容的创业者是如何思考

高欣欣:送创业项目一个里程碑事件

张诚:十年的北大研发路,只为这一款千兆芯片

袁行远:无论晴雨,步履不停

宋斯纯:历历万乡,不负每一场

戴若犁:越来越好奇,越来越好奇

如果你拥有高精尖科技创业项目,Xtecher将为你提供:

1.专业的科技人物特稿和视频拍摄

2.在Xtecher官网、APP、微信的全方位展示

3.最专业的科技圈投资人、政府资源、产业资源

4.创业企业品牌管家与PR服务

请关注本微信公众号:Xtecher,即可联系我们。