2023年8月24日,科普中国·星空讲坛以“通用人工智能的赛道到底在哪里?”为主题,邀请4位人工智能研究领域的专家,聚焦在理论范式、目标、实现途径、应用等方面,讲述未来通用人工智能技术如何影响整个人类社会。
北京工商大学教授、发展中世界工程技术科学院院士韩力群教授带来演讲:《类脑智能是通用人工智能的有效实现途径吗?》一、寻求“类脑”之路
一、寻求“类脑”之路
现在很多人研究人工智能,都很自然地想到要向大脑学习,要向大脑请教,从中获得灵感,获得启发,获得借鉴。
为什么大家都想寻求类脑之路?因为在地球上已经已知的所有生物群体中,人为万物之灵,灵在哪儿呢?灵就灵在人类的大脑,人类具有最发达的大脑。
图库版权图片,转载使用可能引发版权纠纷
大脑是我们物质世界进化的一个最高的产物,现在还没有发现什么样的生物脑能超过它,所以我们说人脑也是世界上最复杂的信息处理系统,也因此大家特别是人工智能领域的专家们,都希望能够在人脑找到灵感,找到可以借鉴的、可以模拟的东西,把它作为一种原型。
既然大家都想从人脑中找答案,我们先简单地说两句人脑。如果从信息处理的角度看,我们可以把人脑看成是一种生物信息处理系统。
它的生物学基础是什么?实际上我们生物学和神经学、解剖学的原理非常明确说了就是神经元。人脑中的神经元是脑组织的基本单位,它也是神经系统的功能,结构也好,功能也好,它是一个最小的单元。
图库版权图片,转载使用可能引发版权纠纷
我们人脑有多少神经元呢?应该说是海量的。从数量级来看,人脑的神经元是数亿千亿计,就是10的10亿次数量级,而且每一个神经元又和其他的神经元进行联结。
一个神经元和其他的神经元是成千上万的联结,数量级上来说就是10的3次方和10的5次方联结,就会形成一个极为庞大,极为复杂的生物神经网络系统,系统当中的每一个神经元和神经元之间的联结,靠的是轴突和树突。
轴突和树突联结的接口,我们有一个专用名词叫突触——轴突和树突联结的接触的地方。突触有多大的量呢,它的数量级是10的14次方到10的16次方,也就是百万亿到一亿亿,我们认为突触是随着不同的刺激不断变化的,所以在机器学习里面,经常仿突触的这一部分的概念,往往给它另起一个名字叫参数(过去叫神经元的)。
大家知道ChatGPT3.0当初号称1750亿个参数,跟人脑的神经元比,它的参数是百万亿到一亿亿,那就是小巫见大巫了,所以这是它的生物学基础。我们用一句话来概括,由于巨量的神经元之间,它的突触联结方式和联结强度都是不同的,而且具有时空可塑性,随着外部的激励在不断动态地变化。宏观上看,整个神经网络在宏观上就呈现出极为复杂的千变万化的信息处理能力,就是我们说的所谓智能,特别是高级智能,或者叫认知智能,这是我们为什么大家都想在人脑、类脑中寻找答案,因为它有生物学基础,天然地可以做人工智能去模仿,去受启发的对象。
二、脑科学对大脑的解读
现在脑科学对大脑理解到什么程度?我们说它的脑的解读水平达到一个什么样的程度?在微观层面有一定的突破。
神经科学的起点大家知道,神经解剖学和组织学,它对神经系统结构的认识和分析,主要是在分子和细胞的层面上,在微观层面上已经取得了突破,那么问题是什么呢?就是我们要揭示人脑一个极为复杂的系统它的认知能力是什么样的机理,它的脑的高级功能、它的神经机制是什么?我们要想把秘密揭开,显然不可能完全依赖分子和细胞的水平的研究成果,远远不够的,为什么这么说?
我们知道很多分子组成神经细胞之后,就不再是原来意义上的分子,多个神经细胞又组成了神经回路,也不是原来意义上的神经回路,然后又有很多神经回路组成了复杂的神经网络,乃至组成了我们整个的生物脑,它也不再是原来意义上的神经回路,所以我们说必须要把微观层次与系统层次或者叫宏观层次把这两个层次的研究结合起来,研究脑的认知功能,也就是高级功能,必须要结合起来。我们下面看脑科学对脑的解读水平,在宏观层次达到什么样的成果,能不能支撑我们的人工智能研究。
图库版权图片,转载使用可能引发版权纠纷
我们把时间放长看,几十年以来,我们取得的,在宏观层面取得的成果,实际上非常有限,现在知道大脑的语言区的定位,有了比较清晰的认识,还有脑区的组织学的分割,还有有人绘制了大脑运动皮层和感觉皮层对应身体的哪些部位,绘制了一个图谱,特别是最近这些年,随着功能核磁共振的成像技术的发展和普遍应用,一些研究做脑学科研究的人员,包括一些研究人工智能的人,就想从这里边找答案,比如说很多,我看很多论文,很多研究团队他是让活体执行他规定的一些特定的活动,然后他去观察,这时候脑类在大脑内部基于电活动的这些血流信号这些信息是什么样子,因为核磁可以把这些东西做到可视化。
再从这里面去找到我们大脑的各个脑区可能参与某种脑的功能,可能我们在这一方面有了一定的了解,但是我觉得这一些成果,这些系统层面,宏观层面的对脑的解读,这些成果恐怕远远不够,因为到目前为止,我们说脑科学对神经信息如何产生感觉、知觉、情绪、思维、意识、语言等等吧,就是这些各种脑的认知功能,在理解上应该说一知半解,非常肤浅,所以我们到现在为止,还没有看到这方面有突破性的成果。
这就是我们人工智能想借鉴脑的时候,我们所面对的现实,换句话说,我们现在脑科学对大脑高级功能的解读水平,是一个很低的天花板,我们在一个很低的天花板下,我们人工智能的类脑仿制这条路,该怎么走?怎么开展?能不能做?该怎么走?又有哪些成果?做了哪些工作?
图库版权图片,转载使用可能引发版权纠纷
我想可以跟大家分享一下,这方面的工作非常多,这几十年,40年代,大家一直在做,都基本上从不同的角度,从脑里边大脑中找答案,我觉得粗分是不是可以分成两大类,比较科普的方法,我们一个叫软类脑,一个叫硬类脑。
三、软类脑:基于模型和算法的类脑研究
什么是软类脑,就是说我们用模型和算法来模拟脑,通过模型和算法来模拟脑,它是一种软实现,这种方法,这种途径实际上也有不同的具体的途径,比如说我觉得可以分成这么两三种途径,一种途径我认为它是属于仿生学的途径,就是仿什么呢?
类脑的哪一部分,类脑的微观结构,脑科学的成果可以利用起来,我们着重模仿生物脑的结构和神经机制,我们这些年一直在做,我们通过实验技术,获取脑组织的动态生物学的数据,然后我们再利用信息处理技术,我们研究这些数据序列当中蕴含着什么样的神经基础和信息加工机制,然后我们是不是根据这些理解我们给出一些解读,给出一些某种脑模型的假设,这是大家很多人都在做的。
这种途径的类脑研究,类脑仿制研究,实际上在人工智能发展的历史上,原来号称三大学术流派,听说最多的就是现在这个深度神经网络,它是从这么多模型逐渐发展过来的,现在是深度神经网络,这个是一种类脑模式。
第二种用模型和算法来实现类脑的途径,它是仿什么?它是仿人脑的功能,叫仿功能途径,人脑的功能很多,它是仿哪一部分呢?它就来仿人脑逻辑推理的功能,因为逻辑推理这部分功能比较容易实现形式化,能变成形式化就可以用算法,用编程去实现,生物脑也好,你还是什么传统的这种计算机的架构也好,在这个流派看来,你都是一个物理符号系统,就可以基于物理符号系统的概念,我用计算机来模拟脑的功能,至于你的结构,什么联结不联结,这些不管,我就看你的功能,就从脱离出来了,它研究开发各种类脑智能信息系统,早期的人工智能就是采用这种方式。
图库版权图片,转载使用可能引发版权纠纷
有一个流派叫符号主义,或者叫功能主义,它早期也有很多成果,而且还曾经排挤过前面这个联结主义,现在它的这个突破口在哪儿呢?有什么新的成果呢?实际上我觉得归类的话,知识图谱,知识图谱可以算到这里面,原来是反对联结主义,现在把知识也联结起来了,变成了知识图谱,这个也是一种。
在这个基于模型和算法的这个类脑研究当中,这些年又有一个比较新的一个途径,我们把它叫仿心智途径,它的这个仿的是什么?是人脑的认知。
它的理论基础的依据是什么?就是以认知心理学为基础,以认知心理学取得的一些成果来支撑它,来探索这个心智建模,这个也是一条路,现在我们还没有看到,就是说非常印象深刻的有这种突破性的成果,特别是应用成果,还没有看到很多,但是呢,这也是一条路,这也是一条路,它的这个认知体系结构,就是仿心智,仿人的心智,也是一种方法,我觉得因为它最后都需要建模,虽然建模的理论支撑不一样,都需要建模,然后创造出一系列的算法,最后变成实现,所以都把它归到软类脑里面。
四、硬类脑:基于物理实现的类脑研究
还有一类就是**基于物理实现的类脑研究,可以通俗一点叫硬类脑,现在很多研究人员致力于使计算机的运作更具备神经形态,什么意思呢?就是说我先追求形似,先追求形似,再考虑神似。**这一类就是基于物理实现的这一类类脑研究现在也比较火,应该说在三个层次都有了进展,三个层次一个是人工突触、类脑芯片、类脑网络,人工突触主要是有一些物理效应的器件,比如说什么忆阻器,突触晶体管等等,我们用一个器件大家来感受一下,就是说我们人类大脑中,信息处理基本单元,刚才跟大家说的叫神经突触,神经突触最独特的特点是什么?就是它既可以存储也可以计算,所谓叫存算一体化,而不是一个CPU管计算,一个存储器管存储,它是存算一体化,这是它最大的特点,是人脑在信息处理机制方面不同于计算机的最大优势所在。
图库版权图片,转载使用可能引发版权纠纷
研究人员就发现,这个忆阻器的电阻跟通过的电荷量,电压电流,通过的电荷量是相关的,电荷量变化,电阻也变化,这就相当于计算,相当于对信息进行计算的处理,记忆体现在哪儿?关掉电源了,没有电荷通过了,这个忆阻器仍然能够记忆先前通过的那个电荷量,这就是记忆,所以就是说它的特性和这个神经突触其实非常相似,非常相似。所以可以把它看成一个电子突触,用它来做这个存算一体化,刚才看到的其他那几个,也是类似的功能,这个是硬类脑的一个层次,就是做人工突触。
再一个层次就是类脑芯片,我们知道CPU的耗能,运算效率都有问题,怎么降低能耗提升运算效率呢?
大家想了很多办法,两条发展路线,大家可能比较熟的就是这个,还是冯诺依曼那个架构的芯片,比较有名的三个芯片,这个不是学电子可能不太熟悉这个缩写,就是这些芯片,我们不去管它,还有一类芯片就是所谓的类脑架构的芯片,我们说它是类脑芯片,现在大家看就是国际上一些非常著名的大厂,都推出了自己的产品,我看了一下我们国内浙江大学也推出了一款叫达尔文,这都是类脑芯片,类脑芯片它的目标是什么呢?它就是以模拟人脑的神经突触传递结构这是它的目标,就是完全是拟脑的,它追求在这个芯片架构上,尽量逼近人脑,所以才管它叫类脑芯片。
图库版权图片,转载使用可能引发版权纠纷
类脑芯片有什么特点呢?类脑芯片架构当中有非常多的处理器,这些处理器就相当于神经元,这些处理器之间的那个通信系统就相当于神经纤维,什么轴突、树突,从整体上看,各个神经元的计算,都是在本地分布式进行,这种模式使得它在处理海量数据的时候,这个优势是非常突出的,我们这个类脑芯片。
我们说硬类脑从突触上去仿人工突触,从芯片上去仿,然后还有整个网络去仿,当然这个是应该是还是属于概念层面,我们还没有见到很好的效果,属于概念层面,那应该可能学术界对它有好多观点,我们找到几个比较典型的就是什么呢?
就是大家觉得互联网的架构和人脑的架构有很多相似之处,是不是可以把整个互联网看成是一个大脑,基本上是基于这一思路,比如说中国科学院有一个团队,在他的论文里说了这么一段话,它说互联网正在向着与人类大脑高度相似的方向进化,人脑至少在数万年前就已经进化出了所有互联网功能,不断发展的互联网将帮助神经学科学家揭开大脑的秘密,这是一个非常有代表性的一个观点。
图库版权图片,转载使用可能引发版权纠纷
美国南加州大学有一个神经系统科学家,他这么说,他是用那个互联网路由机制来解释这个老鼠大脑的信号如何绕过破坏区域达到目标区域,他做了这样的实验,然后用互联网机制去解释,得出了一个结果,他认为他证明了人脑中确实存在着类互联网的应用,这个是他做了一些实验,美国还有一些加州大学的教授他发现,比如互联网,社交网都与脑神经网络有高度相似性,所以基于这样的认识,虽然还在概念层,很多企业,互联网企业都开始布局了,2012年,11年前谷歌就开始了谷歌大脑计划,它是全球第一个用大脑这个概念来命名的互联网智能系统项目,接着2014年百度提出来,百度大脑,讯飞提出来讯飞超脑,然后京东提出来京东大脑,2017年阿里巴巴、华为都提出来了大脑或者什么城市神经系统,到了2018年一下冒出来五六家大厂,都提出来各种各样的大脑,也包括上海市政府提出的城市大脑等等,就是说大家都感觉到这个脑这么复杂,这么海量的数据,这么复杂联结,觉得互联网很像大脑,或者说大脑也很像互联网,这是很多人一个感觉,而且我觉得这个概念虽然模模糊糊,但是很多人心中都有。
同时呢,这十多年就是国际上国家政府也好,国际组织也好,也包括很多著名的企业也好,都提出了脑研究计划,而且这些脑研究计划,它是把脑科学的项目跟这个人工智能的项目它是融合起来了,不是纯粹从脑学科神经科学搞的,它是类脑科学和脑科学,实际上是两个学科,它把这两个学科融合起来,这样的脑科学研究计划非常多,很多,不展开了,非常受重视,但是呢,我们到现在为止,在全球范围内,我们还没有看到突破性的这个成果公布出来,但是呢,这些项目都在进行,所有这些我觉得它都是从软的方面也好,硬的方面也好,还是试图做出一个脑来,还是一个类脑的概念。
五、类脑仿智研究途径的局限性
我自己的看法,就是类脑仿制这个研究途径,是不是前景光明,是不是可以一直做下去,就是对搞人工智能的人来说,我们首先要清醒地看到,类脑仿制这个研究途径,目前存在的局限性,它的局限在哪儿?
图库版权图片,转载使用可能引发版权纠纷
到目前为止,脑科学对人脑的思维、认知、决策、学习等等,对这些高级认知功能的了解远远不够,所以我们现在是在对人脑智能的生物学机制知之甚少这一个情况下,就是认知的天花板很低,在这一个情况下,我们去开展类脑仿制,那怎么做?
我们只好以盲人摸象的形式去局部突破,一部分一部分突破,我们最后是不是集成起来,合起来就可以,可能有个说法,无数的相对真理合起来会逼近绝对真理,但是我觉得在这儿不是这个问题,不是这样一个问题。
所以在我们对人脑的认知功能的了解非常有限的情况下,在一个很低的天花板下,各路人马,各方面的力量,已经尽了全力,从各种途径去试图通过仿脑,不管仿结构、仿功能还是仿什么,不管是用模型算法实现还是用芯片实现,用尽了各种办法,它的目标都是想通过类脑来实现智能,但是它们各有明显的局限性。
大家是有共识的,所以我认为显然目前来看显然无法成为通用人工智能的有限途径,我们今天的主题通用人工智能的赛道在哪里?我想类脑仿制的个人观点,理由就是在脑科学无法解读人脑高级功能的情况下,我们通用人工智能的实现不能一味追求类脑仿制这样的技术路线。
图库版权图片,转载使用可能引发版权纠纷
现在中国的人工智能领域的顶级专家们,都在做什么?
我们现在不缺攻关卡脖子问题的人才,最缺的就是敢闯无人区的,能够自己开辟新赛道,引领新竞赛的这样的人才、学者。
我的感觉就是在人工智能特别是通用人工智能领域要开辟出一个新的赛道,能够有新的理论和新的方向,我觉得机制生成,智能生成机制这个理论是可以担当这样一个角色的,而且我们也特别缺乏由中国人原创的这样的这个基础理论创新。
我为什么觉得智能生成机制理论,有可能开辟通用人工智能新赛?我发现它有这么两个特点,比较明显:
第一个是它不涉及人脑的神经活动机制,把这个绕开了,我们不用等着脑科学家把这个都研究明白了,我们再去拿他的成功做工程实现,再去建模,因为智能生成机制它不涉及,所以它不受脑科学发展滞后的影响,这是一个特点。
第二个特点就是它是从各类智能生成过程当中,长期的实践当中提炼出来了一个普遍规律。什么是普遍规律,就是具有通用性,它天然具有通用的特点,而不是把多种方法集成起来弄一个拼盘,那个东西就很难真正做到通用。
策划制作
责编丨金禹奋(实习生)