2024年,诺贝尔物理学和化学奖授予做人工智能相关研究的学者,引起科学界热议。近日,中国科协的学术会刊《科技导报》刊发了李国杰院士的《诺贝尔物理学和化学奖为何偏爱人工智能?》,我们特此摘录,以飨读者。
李国杰
李国杰,计算机专家,中国工程院院士、发展中国家科学院(TWAS)院士,中国科学院计算技术研究所首席科学家。研究方向为计算机体系结构、并行算法、人工智能、计算机网络、信息技术发展战略等。
诺贝尔物理学和化学奖为何偏爱人工智能
李国杰
2024年10月8日,诺贝尔物理学奖授予约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton),表彰他们使用人工神经网络进行机器学习的基础性发现和发明。次日,2024年诺贝尔化学奖授予大卫·贝克(David Baker)、戴米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M. Jumper),表彰他们在计算蛋白质设计和用机器学习方法预测蛋白质结构方面的贡献。**这两项基础科学的大奖都颁给了做人工智能相关研究的学者,引起科学界的热议和争论。**诺贝尔奖委员会解释为什么将诺贝尔物理学奖授予研究人工神经网络的学者,是因为人工神经网络是用物理学工具训练的。也就是说,目前红遍全世界的人工智能的原始基础是基于物理学的发现和知识,机器学习模型是基于物理原理实现的,其实就是告诉世人:物理学是人工智能的源头。
霍普菲尔德1982年在《美国科学院院刊》(《PNAS》)发表的论文中,提出了一种人工神经网络模型(Hopfield Network),终结了从1974年开始的AI寒冬,标志着以人工神经网络为新方向的人工智能学科的复兴。**如今机器学习领域的顶级会议NeurIPS,其起源可以追溯到1984年以Hopfield名字直接命名的Hopfests会议,彰显了他的早期工作在神经网络研究中的核心地位。**Hopfield网络是按物理学上能量函数最小化来构建的,可以看作是物理学中“自旋玻璃模型”的扩展。Hopfield以跨学科的视角解释了人工神经网络与物理学之间的联系,Hopfield Network对统计物理学、人工智能和神经科学三大学科都产生了巨大的影响。Hopfield教授曾为中国智能计算机的发展做出过贡献。1990年5月,国家智能计算机研究开发中心在北京召开了一次高规格的战略研讨会,Hopfield教授是被邀请的著名学者之一,会后国务委员宋健在人民大会堂接见了参会嘉宾。
辛顿的研究曾以Hopfield网络为基础,创建了一个使用不同方法的新网络:玻尔兹曼机。辛顿使用的是统计物理学的工具,用来学习和识别数据中的模式。**Hopfield Network和玻尔兹曼机都是基于能量的模型,统计力学原理是这两者的核心。**它们都使用源自统计力学的能量函数,解决与模式识别和数据分类等应用相关的人工智能问题。
诺贝尔奖只是一个奖项,诺贝尔奖委员会也只吸纳了部分科学家,也许我们不必过于在意诺贝尔奖授予谁。但是这次诺贝尔奖某种意义的“跨界”,不但说明了诺贝尔奖委员会在与时俱进,更重要的是,唤醒了人们对人工智能超预期发展和广泛渗透性的重视。现在人工智能,特别是机器学习,已成为物理、化学、生物等基础研究的重要工具,“AI for Science”正在引起一场科研范式的大变革。**这次诺贝尔奖的“出圈”不是物理学界和化学界的“悲哀”,也许在科学史上会翻开新一页。**人工智能确实是当今最活跃的领域,诺贝尔物理学奖、化学奖颁给人工智能学者,寄托了广大科技工作者对人工智能推动人类社会跨越式发展的期望。
近百年来,学科越分越细。1900年只有约500门学科,2000年发展到5000门以上,100年增加10倍。按照这个趋势,2100年可能要扩展到50000门。中国教育部门设置的学科也是越来越多,有些学者在为新增某个一级学科而上下奔波,这与学科融合发展的趋势背道而驰。辛顿教授获得诺贝尔奖后接受采访时说:“我觉得我是一个不知道自己在哪个研究领域的人,但想弄清楚大脑工作原理,然后在研究中协助发明了一项效果惊人的技术。”**不经意的回答透露了获得重大科学突破的奥秘:不要在自己头上戴上哪个学科的“帽子”,做不知道属于哪个领域的交叉科学研究。**这次“诺奖风波”后,许多学者对长期以来禁锢我们思维的学科和专业茧房,可能会有全新的思考,会更加重视跨学科的研究。
**非物理专业的科研人员理解这次诺贝尔奖拥抱人工智能,不是关注物理是人工智能的源头,而是更重视人工智能对物理等基础研究的推动。**人工智能为什么能推动物理、化学、生物等基础研究,涉及深层次的哲学问题。物理与计算都致力于描述自然界如何运作,都试图建立通用的世界模型。有些乐观的学者认为,现在的人工神经网络模型逐步演化,相互融合,最终会形成通用的世界模型。信息论与物理学中的热力学也有着深层次的联系,信息论中的熵与物理学中的熵具有类似的概念,均涉及系统的无序性和不确定性。一些激进的物理学家和哲学家提出,信息是物理世界的基础,宇宙的基本构成单元是信息(bit),而物理实体(如粒子和能量)只是信息的表现形式,物理过程在某种意义上就是计算过程。**当然,更多的学者认为,虽然计算可以模拟和理解物理过程,但并不意味着物理过程本身就是计算。**物理过程本质上可能不是离散的,而是连续的,用离散的图灵机计算模型不能解释全部客观世界,需要发明和构建更通用的计算模型和物理模型。这种深层次的理论绝不是靠某个科学家灵机一动的思想火花就可以建立起来,而是需要做长期艰苦的努力。2006年,辛顿团队先后在《Neural Computation》期刊和《Science》杂志上发表了两篇关于深度神经网络的奠基性论文,现在被认为是深度学习领域的里程碑之作,但发表后几年内关注者寥寥无几。辛顿团队在2012年的ImageNet竞赛中一鸣惊人,之前一直坐冷板凳,但他们对人工神经网络的信仰一直没有动摇。不管人工智能和物理学实现深度融合还要经过多少年努力,但大家已经看到,“AI for Physics (Science)” 和“Physics (Science) for AI”的道路都会越走越宽广。
人工智能和物理等基础科学能走到一起,还有另一方面的原因。英国哲学家波普尔1964年出版的《客观知识》一书中,区别两种知识:“钟”和“云”。牛顿方程、拉普拉斯方程是精确、干净、光滑的,属于“钟”的知识;“云”的知识写不出任何的方程来,是关于复杂性的知识。长期以来,人们习惯的数学语言,大多都是刻画“钟”的。人们经常使用“钟”的语言讲述“云”的故事。量子力学的奠基人之一玻尔曾用“抹布”比喻科学语言和科学方法的局限性和相对性。他说:“你无法要求存在一块绝对干净的抹布。”干净的问题用干净的方法可以解决,但“脏”(不规则)的问题要用“脏”的方法才能解决。人工智能类似于不太干净的抹布,适合处理类似“云”的难以精确描述的问题。华裔数学家陶哲轩将人工智能比喻为“猜测机器”,可以迅速提供大量候选答案。传统科学就像能产生一定量清洁饮用水的水龙头,而AI则是一个大消防水管,可以输出超过100倍的不可直接饮用的水。如果用一个过滤装置帮助我们过滤掉那些杂质,就可以得到干净的水(科学)了。如果物理学一直坚持只研究类似“钟”的知识,就和以深度学习为代表的人工智能是两股道上的车,走不到一起。但是,简单的物理学问题都已经解决了,现在留下的物理学问题,都是复杂性很高的问题,包含随机性和不确定性,也属于不太“干净”的问题,需要用到类似“云”的知识,就和人工智能走到一起了。以前只有一种“合法的”科学,即确定论的、还原论的科学观,现在可以有第2种科学观,即非确定的、进化的、基于数据和概率统计的科学观,这两种科学观不是相互对立,而是相互补充,应彼此尊重对方。
复杂性不是对传统科学范式的“扩容”,不是更加复杂的还原论,而是对还原论假设系统的解构和挑战,挑战了还原论的“信仰”。**从这个意义上讲,是复杂性挑战逼迫人工智能和所有的传统科学形成了“统一战线”。**冯·诺依曼早在60年前就提出:“20世纪应该着力解决的焦点问题是复杂性问题,就像19世纪的核心是对熵、对能量的理解一样。”1956年的达特茅斯会议上,西蒙(Simon)建议用“复杂信息处理”这一术语取代“人工智能”,这说明人工智能除了模仿人的目标外,从诞生之初就还有一个目标:认识和驾驭“复杂系统”。1998年,斯蒂芬·霍金发表了题为“信息与变革:下一个千年的科学”的演讲。他认为下一个千年(从21世纪开始)是“复杂性的千年”,或者说是复杂性主导的千年。按照前辈大科学家的指引,目前我们找到对付复杂性的一条出路是机器学习。 **近几年科研范式正在发生重大的变化,我把这种新的范式称为智能化科研(AI for Research,AI4R),其主要的动力来自驾驭复杂性。**物理、化学、生物学研究都要靠人工智能来对付指数爆炸。目前对付维数灾难只有两条出路,一是机器学习,二是复杂性科学。复杂性科学采用粗粒度的理解范式,关注大规模宏观模式和趋势。机器学习采用细粒度的预测范式,通过学习大量数据中的细微模式来进行预测。圣塔菲研究所所长大卫·克拉考尔最近撰文,尝试从理论层面实现复杂性科学与机器学习的统一。中国这两个领域的学者联系不多,今后应加强沟通合作。
2009年,中国科学院组织一批学者做《至2050年科学技术发展路线图》战略研究,我牵头做的信息科技发展路线图认为:“信息技术不会变成以增量改进为主的传统产业技术,而是面临一次新的信息科学革命。信息技术的基础理论大部分是在1960年代以前完成的,近40年信息科学没有取得重大突破。上一次基本创新(即基于科学突破的重大发明)的高峰期是在20世纪40年代,现在已有大量的知识积累,按照长波规律的推测,21世纪20—30年代可能出现基本创新的高峰。2020年以后什么技术将成为新的主流技术就会逐步明朗;2020—2035年将是信息技术改天换地的大变革期。预计21世纪上半叶将兴起一场以高性能计算和仿真、网络科学、智能科学、计算思维为特征的信息科学革命。在网络科学和智能科学取得重大突破以后,21世纪下半叶基于信息科学的新的信息技术将取得比20世纪下半叶更大的发展。”近几年人工智能的大发展似乎检验了15年前的战略预见,人工智能就是当时期盼的21世纪20—30年代可能会出现的基本创新。
20世纪40—60年代,发明计算机和集成电路以后,人类就进入了信息时代。近几年人工智能突飞猛进,既有重大的技术发明,如transformer深度学习框架,也是辛顿等科学家关于神经网络模型的基础研究理论突破。深度学习的黑盒模型为人工智能科学研究提出了急需解决的科学问题,需求的牵引必将引发科学的突破。**人工智能技术的大发展,预示人类已经处在进入智能时代的前夜。**目前的技术离实现真正的通用人工智能还有一定的距离,再经过10—20年的努力,大概率会出现基于重大科学突破的基础发明,为人类进入智能时代打下坚实的基础。诺贝尔物理学奖、化学奖颁给人工智能学者本身不是一件大事,但这次颁奖可能会在科技发展史留下痕迹,我们的后代会记住这些为人类迈进智能时代做出重大贡献的伟大科学家。
参考文献:《科技导报》2024年第19期发表,标题为《诺贝尔物理学和化学奖为何偏爱人工智能》,有删节。来源:科技导报社