CAAI名誉理事长李德毅院士：薛定谔+图灵 +维纳 = ？-

2022 年8 月18 日，由中国人工智能学会、北京工业大学主办的中国人工智能学院院长与名师论坛暨中国人工智能学会教育工作委员会换届会议以线上形式举行。李德毅院士在《薛定谔+维纳+图灵=？》主题报告中，对图灵机模型、生命赖负熵为生、交互认知和机器思维等方面进行了深入思考，提出了“机器赖序为生，赖交互为生”的观点，建议加强智能科学“认知物理学”这一新领域研究。

李德毅院士的报告分为五个主要部分，分别是《第一部分：再读五篇经典论文新体会》《第二部分：从薛定谔谈开去，为什么机器可被视为生命，如何应对熵增？》《第三部分：从图灵谈开去，从机器认知看图灵机的贡献与局限》《第四部分：从维纳谈开去，通过交互认知实现机器行为的控制与实现》《第五部分：薛定谔 + 图灵 + 维纳 = 认知物理学》。

为了促进学术交流，征得李德毅院士同意，现将李德毅院士报告中关键ppt内容发布，以便共同思考人工智能下一步理论突破方向、途径和手段。

李德毅院士

CAAI名誉理事长

中国工程院院士、欧亚科学院院士

军事科学院系统工程研究院研究员，中国人工智能学会名誉理事长，中国指挥控制学会名誉理事长。是中国改革开放以来第一位人工智能相关专业博士学位获得者，指挥自动化和人工智能专家，长期致力于信息化和智能化工作，是不确定性人工智能领域的主要开拓者，中国无人驾驶的积极引领者，人工智能产学研发展的重要推动者，吴文俊人工智能最高成就奖获得者。

李德毅院士作《薛定谔+图灵+维纳=？》报告

第一部分：再读五篇经典论文的新体会

19世纪末到20世纪中叶，控制论之父维纳（1894年-1964年）、量子力学之父薛定谔（1887年-1961年）和人工智能之父图灵（1912年-1954年）共同生活在一个时代，三位学者为人类留下了如下五篇经典之作。再读这五篇经典之作，又有新体会，如果要对每一篇用一句话概括新的收获，归纳如下：

1、Turing A. M. On computable numbers with an application to the Entscheldungs problems. Proc. London Math, Soc. Ser.2, 42, 230-265,1936

新体会：论文提出图灵机模型，图灵可计算和一般递归函数等价，通过暴力计算，可以用足够大去逼近无限。

2、Erwin Schrodinger, What is Life? The Physical Aspect of the Living Cell, Cambridge of the University Press， 1943

新体会：生命赖负熵为生，如果机器赖秩序为生，机器可作为认知的载体

3、Wiener Norbert，Cybernetics, or Control and communication in the animal and the machine. Cambridge, Massachusetts, The Technology Press; New York: John Wiley & Sons, Inc., 1948

新体会：论文标题中的communication翻译为“沟通”、“交互”更恰当，控制和交互可实现机器的具身行为智能

4、Turing A. M. Computing Machinery and Intelligence. Mind, 59: 433-460, 1950

新体会：机器学习可从教育“儿童程序”开始，用对话做图灵测试，然后可用图灵测试其智能

5、Wiener Norbert，The Human Use of Human Beings: Cybernetics and Society, 1950

新体会：人有人的智慧，机器有机器的智能，可通过交互认知实现。

第二部分：从薛定谔谈开去

如果机器可被视为生命，如何应对熵增？

埃尔温.薛定谔在《生命是什么》（what is life）书籍中探讨生命的意义时，曾经写道：生命是很多种能够决定个体未来发展完整模式的密码本(code-script)，人活着就是在对抗熵增规律，生命以负熵为生。那么如果机器可被视为生命，机器如何应对熵增？

本质上而言，生命和机器同样都遵循物理定律。农耕时代的工具中，生命和机器所遵循的物理定律体现在两个要素里，即工具里有物质和结构，结构寄生在物质上；工业时代的机器体现在三个要素里，即机器里有物质、能量和结构，结构寄生在物质和能量上；智能时代的机器体现在四个要素中，即机器里有物质、能量、结构和时间，结构和时间寄生在物质和能量上，构成硬构体，软构体可以寄生在硬构体或者软构体之上，如虚拟细胞，可自我复用，机器的秩序显示出维持自身和产生有序事件的能力。

依靠软构体实现的机器里，对物质和思维进行了统一。生命科学里有结构生物学，结构可寄生在原子、分子、大分子、蛋白质、细胞之上，构成硬构体，蛋白质折叠三维结构预测就是结构生物学史上突破。智能机器四要素说，机器里包括物质、能量、结构和时间。因为能量，所以有了时钟，因为时钟，所以有了时间，因为时间，所以有了秩序，智能可以自动化，认知就活了；负反馈即负熵，让机器具身行为稳定了。机器显示出维持自身和产生有序事件的能力，赖负熵为生，这就是机器的生命观。软构体寄生在硬构体或者软构体之上，用软构体表达信息。

机器赖能量和时间为生，在最小的机器时钟周期之上，可以组构成许多复杂的软构体，甚至可以建立在“想象的现实”之上。如同算法可以通过编译让高级语言编写的程序递归到机器硬指令的执行，算法就是一种软构体，语言中的单词是软构体，短语、句子是软构体，思想也是软构体，语法是构造软构体的规则，这样一来，表达语境、语用、语义和语法的语言就诞生了。语言承载思维、认知和智能，数学是人类认知的最抽象语言，这些寄生在硬构体之上的软构体（概念）就形成了。用软构体表达信息，物质和思维就在机器里统一了，心智趋于一元了。

生命赖负熵为生。机器里有物质、能量、结构和时间，时钟依赖能量，时间依赖时钟，秩序依赖时间，时间是人类认知的奠基石，软构体寄生在硬构体上，机器自举实现思维自动化；交互和自我复用实现认知自成长；时钟不停，思维和认知不息，机器赖序为生，赖交互为生。因此，机器可以作为思维的载体。

诺贝尔奖获得者薛定谔的《生命是什么》启发了大家：生命和机器都可以作为认知的载体。

我们可以用机器的生命观，展示认知成长中软构体的作用：受精卵在子宫里发育，精子的作用体现在基因的遗传，作为一种软构体，寄生在硬构体（合子）上，依靠母体的新陈代谢维持胎儿生命；出生后儿童与外界交互，幼儿认知核进一步发育成长，神经元和神经元之间的连接迅速增长，机器里的儿童程序就寄生在幼儿认知核上，也是一种软构体，这和结构生物学的观点是一致的。于是生命体里面的物质、能量、信息、知识、智能就统一了，物质和精神就统一了，科学技术和人文艺术就统一了，身心不再二元，更不三元。

图灵在1950年发表的历史文献《计算机械与智能》中，开宗明义地要大家考虑机器能否思维，他分析并驳斥了9种对思维机器的反对意见，主张只要机器在语言行为（对话）上和人没有明显差别，就应该算是能思维或有智能了，这就是后来所称的“图灵测试”。他认为可以编制一个“儿童程序”，然后对其进行教育以达到成人的智力水平。但如何理解这里的“儿童程序”？如何理解“教育”？

思维的本质是抽象和联想，更多的是软构体的创立和连接。如果机器植入了学习的本能——幼儿认知核，机器可以作为认知的载体，关键是教机器如何能学读第一本书，学做第一道题，亦或学第一个字、发第一个音，机器学习时的瞬时记忆和工作记忆很快就被覆盖了，学习的结果是去微调机器里的长期记忆，即微调人工智痕细胞的网络拓扑。

当然我们为了教机器读百本书、做万道题，可以专门去编写适合机器读的这些书和这些题。机器可以不分昼夜地读，更不必“寒窗十年”。婴儿生下来头脑里的知识几乎是空白，本能乃原本之能，能哭会睡，人类的本能和其它高等生物的本能比可以说并没有优势，本能都是千万年自然进化的结果。但是进化给了婴儿学习的本能，语言是后天习得的，认知是后天习得的，人类进化的结果使得大脑皮层在后天有极大地可重塑性，是学习和认知成就了人类。

第三部分从图灵谈开去

从机器认知看图灵机的贡献与局限

图灵用一生研究计算机械化，其于1936年发表的论文“论可计算数及其在判定问题中的应用” 中，对可计算本质进行了严格数学定义，提出图灵机模型是一种十分简单但运算能力极强的计算装置，用来计算所有能想象得到的可计算数，后来著名的“邱奇—图灵论题” 说明了 “ λ演算、递归函数和图灵可计算是等价的”，即：所有可计算或是机械程序可计算的函数，恰好就是用一般递归函数去逼近无限。可以认为“图灵可计算”是软构体自我复用来逼近无限的过程。

人类认知革命的起点是发明语言、文字和符号，从而开创了文化和文明，这些认知是“想象的现实”，使得智能可以脱离生命体而独立存在，进而发明了教育，并与时俱进改革教育，群体智能形成的知识通过有指导的学习，被吸收为个体智能，然后再发展成为新的群体智能，代代传承，才得以让人类站到了生物链的顶端。

人类第二次认知革命是探究客观世界、探究物质和能量，发明各种各样的动力工具、传感工具和智力工具。当前人类正进入到人工智能时代，即第三次认知革命，到本世纪中叶，运用脑科学研究成果，研发无意识的类脑智能，形成可交互、会学习、能进化的新一代人工智能，按照人类赋予的意图，一以贯之的服务人类。人类未来也许还会有第四次认知革命，那将是认知生命，涉及到生命伦理，把人工智能反作用到自然界各类生命体之中，进而重新塑造生命，包括人类自身。

图灵在1950年发表的历史文献《计算机械与智能》中，开宗明义地要大家考虑机器能否思维，他分析并驳斥了9种对思维机器的反对意见，主张只要机器在语言行为（对话）上和人没有明显差别，就应该算是能思维或有智能了，这就是后来所称的“图灵测试”。他还认为可以编制一个“儿童程序”，然后对其进行教育以达到成人的智力水平。

通常，虚拟数字人都是同人的外部形状，而实体机器人主要是功能类似人，如商汤的下象棋机器人和农田作业机器人，应该是有感知、有认知、有行为、可交互、会学习、自成长的机器智能。元萝卜可不可以自己成长，我们还不得而知。

随着人工智能向各式各样动力机器的渗透，越来越多的机器能听会说，有问有答，人类社会更多的生产和服务岗位（家电、银行、商店、物流、农场、港口、海关、医院、写字楼、工厂、超市、娱乐、值班、秘书、配音、主持、演员等）终将由虚拟数字人和实体机器群替代。那么问题是：如何教机器在线学习？

第四部分从维纳谈开去

交互认知：机器行为的控制与实现

控制就是追求熵减，通过负反馈来确保机器具身行为智能的稳定性。维纳认为：“如果我们使用一台机器来实现我们的目标，但又不能有效地干预其运作方式 ...... 那么我们最好能确定输入给机器的目标是我们真正所预期的。”

机器的使命和行为是由人赋予的。机器有感知、有认知、有行为，可交互、会学习、自成长，为了提升机器这种能力，就是在交互的环境里，由软构体里的算法规定的一组带有奖励和惩罚函数在内的、周而复始的复杂动作，通过交互完成在瞬时记忆区、工作记忆区和长期记忆区状态的改变。

深度学习存在如下七个局限，归根到底是针对先天的不可解释性，求得改进。

局限一：机器学习的结果是记忆，记忆智能优于计算智能，深度学习打破了“算法长期被困在程序里” 的封闭局面，打破了需要预写程序通过编译才能获得智能的传统方法，用标注代替记忆，从大数据中直接获得分类知识，用数据修改算法中的参数，开辟了机器学习的新纪元。所有训练样本都是第三、第四等多方视角发散提供的，不具有时间序贯性，不是从机器本体的 “我” 出发、同一视角的主动感知，没有体现因环境变化注意力随之变化

局限二：鲜有多通道跨模态感知，尤其是视觉、语言和肢体行为的跨模态感知

局限三：标注不可或缺，标注成本太高，被戏说为 “有多少人工，才有多少智能 ”

局限四：瞬时记忆没有体现注意力选择机制，没有得到当前工作记忆和长期记忆对新观察的指导

局限五：鲁棒性差，存在数据偏见，容易受到对抗样本的欺骗

局限六：采用超大模型、超大参数进行预训练，训练大型神经网络，计算成本昂贵

局限七：深度学习一旦部署于应用，就无法在运行时在线学习新知识，如果要求机器视觉识别额外的图像对象，必须重新开始离线的预训练

深度学习要取得更大进展，一定需要让深度学习在递归中完成！

机器有感知、有认知、有行为，可交互、会学习、自成长，教机器读书做题，以丫丫识字为例，就是在交互的环境里，由软构体里的算法规定的一组带有奖励和惩罚函数在内的、周而复始的复杂动作，通过交互完成在瞬时记忆区、工作记忆区和长期记忆区状态的改变。

机器尤其擅长深度递归，不担心指数爆炸、排列组合试错，暴力计算是机器长项。当前由人赋予机器特定的语境和语用，让机器写作，生成三字经、百家姓、千字文、开幕词闭幕词、新闻稿、贺词悼词、客服对话、论文摘要、论文致谢、短小散文、诗词等已经屡见不鲜，甚至机器写作的专业论文已经有被会议收录发表，机器批改作业、试卷，在线评估、指导学生学外语等日趋常态。如果专门组织图灵测试，有可能区分不出来哪些是出自机器所为。

第五部分薛定谔 + 图灵 + 维纳 = ？

机器认知：从学习到创造

如同曾经的天文学家用望远镜、生命科学家用显微镜完成认知和发现，随着新一代人工智能的发展，教机器读书、学习，和机器一同读书、学习，可能成为人们生活和工作的常态，和机器一同做题、解惑、解决智力问题的趋势已然形成，智能机器成为人类智能的体外延伸，成为不可或缺的思维工具，成为私人智能代理，个人认知因与机器认知同在而迭代提升，人类将更加智慧、更加尊严、更加优雅地生活！

机器扩大了人的记忆智能和计算智能，帮助解决指数爆炸的智力问题，提高了工作效率，把人从繁重的、重复性劳动中解脱出来，人机交互协同创新，不但可以更好地符合相应工作岗位规范要求，甚至帮助科学家、工程师一同作出发明、发现和创造。创造是否一定要区分机器为主还是人为主，也许已经不再重要，倒是交互认知被提上重要议事日程。

本报告认为，在以“机器生物”为核心的“生物机器”、以“智能自动”为核心的“行为控制”和以“交互认知”为核心的“具身智能”交叉融合下，一个新的研究领域，即“认知物理学”正在悄然出现。

所谓“认知物理学”指用物理学的知识、工具和方法，以物质、能量、结构和时间为基础，用软构体表达信息，自我复用产生有序事件，构造赖负熵为生、赖交互为生的智能机器，维持不确定性中的基本确定性，在物理空间和认知空间形成交替认知的螺旋，会学习，自纠错，自组织、自成长，显示出解释、解决问题的自身认知能力。

随着有感知、有认知、有行为、可交互、会学习、自成长的机器大量被复制生产和升级，随着大量的虚拟数字人和实体机器人的产生，人机共生、交互认知的时代一定会到来,也许会有一天从人教机器学习转而机器教人学习，机器标杆驾驶员教青年人开车、机器人教儿童下棋、学画…… 总之，机器教人和人教机器会同时存在。

人工智能已经做过了70年，上一代、新一代和下一代的发展走向，如下图：

附录：

李幼平院士（中国工程院院士，核武器电子学专家，曾任中国工程物理研究院科技委主任）全程参加了8月18日“中国人工智能学院院长与名师论坛”。李幼平院士事后讲了一个故事：我曾请教朱光亚先生，为什么九院称工程物理研究院，朱光亚先生回答：物理是深度，工程是规模，没有规模，做不成国家大事。我想整合今天潘云鹤院士、李德毅院士和朱松纯教授三位专家的报告创意，形成中国认知工程，践行钱学森先生的 meta synthetics engineering（大成智慧工程）。

会务组事后查找资料得知，1992年8月，钱老在给王寿云将军的信件中最早提出“大成智慧工程”的概念，英文是“Meta synthetic Engineering”。同年10月10日，钱老致信钱学敏先生：“大成智慧工程”是利用现代科学技术体系的思想，综合古今中外上万亿个人类头脑的智慧。同年10月19日，钱老致信戴汝为院士，“我们的事业是伟大的，我们是要把古今中外千亿人的头脑组织成一个伟大的思维体系，复杂超巨型系统。可否称之为‘大成智慧工程’？”

CAAI原创丨作者李德毅院士

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会