多智能体控制：从简单规则到复杂行为-

多智能体控制产生于21世纪初。到如今已经发展了二十余年。积累了大量的论文，常出现各类研究方向的介绍上，但多智能体控制究竟是做什么的，回望这二十余年的研究历程，我们又得到了哪些启示，未来又有哪些方向可以进一步努力，都是比较直接但又需要说明的问题，在这里就啰嗦一下个人的感受，供各位批评指正。

1. 概念的演进

控制理论的一个基础和核心是对系统的研究，因此我们先从系统的概念开始梳理，按照时间线讨论各个名词的兴起。从最早的大规模系统研究到现在的CPS研究，粗略分的话，与网络相关的概念有五个。大规模系统或者叫网络化系统、网络化控制、多智能体系统、复杂网络、信息物理系统。这五个的联系与区别，可以看到，这五个各自产生了许多文章。

首先要清楚的是，这五个的发源地都是图论。对于图论的研究始于柯尼斯堡七桥问题。随着技术进步，在工业上，我们遇到了需要将多个个体之间使用网络通信相连的问题，既然是多个体相连，我们首先注意到的是它们之间的通信方式与通信效果，比如：

拥塞控制是在网络中使用反馈的早期例子。在保持高吞吐量的同时，对向网络中注入数据包的速率进行调节以避免拥塞（Jacobson，1988年）。事实上，TCP（后来的TCP/IP协议）正是互联网的核心，也是互联网迅速发展的原因之一。一般来说，网络的运行需要多个层次的控制原则和控制回路。

进而关注点聚焦于：

从网络传输数据包角度来看，具有三个重要特征：网络处理传入数据包的速度、由于网络上的流量负载，数据包在到达预定目的地之前可能遇到的延迟，以及网络可能遇到丢弃数据包的概率或可能性。

通信是网络化控制的一个重要研究角度。这里就到了第一个区分点，大规模系统或者叫网络化系统是多个个体，而中文表达上较为相似的网络化控制则是偏向于控制器与被控对象通过网络相连，也可以是单体系统。

90年代末，兴起了两件新事物，一个多智能体、一个复杂网络。多智能体系统走入了人们的视野：

相对于网络化系统对于通信速率的关注，多智能体系统则源于对“简单规则产生复杂行为”的好奇与模仿，并且将这一问题抽象简化为所有状态收敛到同一数值的一致性问题展开初步研究。当然，随着研究深入，这两个方向也变得越来越融合了，但拿最新文献对比，我们仍然可以看出一下研究思路上的细微区别：

比如，我们以可控性研究为例，多智能体系统可控性的文献中，比如Chao Sun, Guoqiang Hu, and Lihua Xie. Controllability of Multiagent Networks With Antagonistic Interactions.IEEE TRANSACTIONS ON AUTOMATIC CONTROL, VOL. 62, NO. 10 ，会利用到拉普拉斯矩阵，换句话说，要想写出这个矩阵需要提前知道网络结构是怎样的。

而在同样研究可控性的网络化系统文献中，Yuyu Zhou and Tong Zhou, A Revisit to the Controllability and Observability of Networked Dynamic Systems，IEEE Transactions on Control of Network Systems ，DOI 10.1109/TCNS.2021.3078070. 则用抽象的耦合矩阵代替了图，而不需要提前知道网络结构是什么样子。反映了建模思路上的差异。

随着考虑节点的增多，无论是画图分析还是给出耦合矩阵都变的力不从心，统计物理此时进入了人们的视野，小世界网络、无标度网络相继诞生，每一个进入网络科学学习的新人首先接受的也是各种统计量。复杂网络的研究就这样展开了。

随着时间的推移，这几个的界限是越来越模糊了，但从研究主流来看，如果搜索关键词，大规模系统的研究高潮已经逐渐过去，复杂网络还是统计特色和社会类研究为主，多智能体和部分网络化系统则更聚焦于一致性，网络化控制则倾向于通信的具体实现。

我们暂停一下，仔细想一想这么一个问题，刚才的介绍里是不是不由自主的使用了某几种假设？比如，复杂网络使用统计物理的前提是什么？是网络天生存在，只是我们不知道网络具体结构。网络化控制呢？控制器与被控对象通过网络相连，该网络也是类似于天生的。但到了多智能体系统，本来一个个个体是独立的，是我们设计了通信网络将其连接在一起，也就是网络人工设计。这里的区别是，天生网络的研究成果往往需要所开发的方法适用于多么一般的网络，而人工网络的研究则需要实现目的即可，更多的可能要讨论带有某种最优指标的拓扑设计问题。

那么，有没有既有天生又有人工的呢？进一步，如果我们将天生网络定义为物理耦合关系，即物理层。而人工网络则称为信息层。我们就得到了一个这几年的热词：信息物理系统。

一个概念的引入自然会带来新问题，比如网络攻击问题。以往的网络化系统，很少有人考虑攻击的问题，因为其属于局域网，且不与外界相连，攻击的可能性很低，而随着技术进步，尤其是工业互联网的发展、数据分析技术的引入，在带来方便的同时，也给了攻击的机会，为理论分析提供了可行性。有了这个可行性作保证，无论是网络化系统、多智能体还是复杂网络都引入了安全的因素，相关文章成了这几年的一个热点。

又比如“将调整通信边作为一种控制手段”，CPS系统结构带来了调整拓扑联系的可能性，这一点在2020年的TAC文章中有体现：

In our paper, instead, we deal with the open problem of modifying the structure of the network of interaction in a multi-agent systems such that to obtain arbitrarily selected clusters.........by implementing a cyber-layer of controllers operating in parallel with the physical connections of the multi-agent system and providing the further inputs generated by the coupling terms of the control layer..........
(Lucia Valentina Gambuzza, Mattia Frasca,Distributed control of multi-consensus ,IEEE TAC,DOI 10.1109/TAC.2020.3006820)

从事多智能体系统研究的同行们可能觉得加边、减边这类操作比较新，但我们将视角转向网络科学，则会发现，在网络科学中的网络性能分析中，像某种指标比如可控性在节点失效、边失效、增加边等变化下的鲁棒性能问题工作还是不少的，可以参考香港城市大学陈关荣教授的工作。同样的，节点失效、边失效、增加边等变化对其他复杂行为又有什么影响？进一步，如果把“节点失效、边失效、增加边”这类操作如果放在多智能体系统控制里去考虑，一个能贴近的场景是应变能力。我们以往考虑的系统往往都是固定的拓扑或者是按照一定规律切换的拓扑。问题在于，如果我们遇到一种突发情况，被动的改变拓扑的时候，怎么去处理这种情况？等等，这类工作与控制设计结合，最终都会归为**最优拓扑设计问题。**这些都是近年来概念演进带来的一些新思路。

2.从基本一致性出发

关于多智能体系统协同控制目前主要研究在于一致性。一致性，简单理解，就是网络当中的每一个个体都达到了同一个状态。**一个经典结论在于有向生成树的存在与一致性的强相关关系。**如果我们转化一下，就可以归结成微分方程的稳定性问题。关于稳定性问题，控制理论体系里有很多的研究工具。特别对于多智能体系统而言，针对拉普拉斯矩阵的性质。也有一些比较成熟的处理工具，大家如果看这方面论文认为比较多的话，相信都会有这样一个感觉：场景虽然不同，但是核心方法都是类似的。

单看一致性，从被控对象上看：线性一致性、非线性一致性、时滞的一致性、异构的一致性、切换拓扑的一致性、从通信上，丢包的一致性，事件触发的一致性、网络攻击条件下的一致性和弹性一致性，隐私保护的一致性，从应用上，编队、合围等。基本所有控制理论的经典成果都可以用到多智能体一致性研究上。我们这里统称是应用场景上的新东西。

我们这里并不打算念名词，那样就丧失了图解的意义，但可以用几条线串起来，比如一个很容易会产生的问题：**多智能体仅仅是一致就行了吗？**首先我们来看这个一致性的定义。网络中的每一个个体都达到同一个状态。比如说这个状态是位置信息的话，那么说。全部的个体从四面八方而来，都汇集到了一个位置。那么一个很自然的拓展就是，如果我们设计的目的是：要求一部分个体去A点会合，一部分个体去B点会合。或者说类似的这类情况。那么这种情况又该如何处理呢？这里就引出了一个有关键词。叫分组一致或者聚类一致（group consensus or cluster consensus or multi consensus）。这方面的研究基础是讨论矩阵的零特征值的重数，结合比较特殊的网络结构（比如Eqiutable partition or Acyclic partition）或者满足一定条件的组间耦合关系。这里多提几句：group consensus 和 cluster consensus 还是有些区别的，group consensus不要求各个组之间状态严格不同，做仿真有可能会出现不同组的曲线汇合现象，而cluster consensus往往会要求。

又比如近几年的研究当中，出现了对于一致性的进一步限定。比如positive consensus:

The positive systems mean that the states of the systems can be always nonnegative for any nonnegative initial conditions. Some significant conclusions have been acquired for the positive consensus of integer-order multiagent systems (IOMASs).

再比如搞研究时经常想到的“有何必要”疑问，如何我们按这个角度来看，让所有个体都精确达到一个相同的状态，是永远必要的吗？比如我们需要驱赶群体越过某条线，大于某个值算个体通过，而不去管它究竟大了多少，或者对于投票模型，设定个体状态超过某个数即为同意，只关心是不是同意票，而不关心个体同意的程度。这个目标在2018年被拿出来单独研究，至今也产生了那么几篇文章吧，称作Herdability，属于刚开始的研究阶段。诸如此类有意思的概念，等等。

回到Consensus，有读者就问了，以上是consensus的扩展，那对于consensus，有没有一条线能串起来，让大家清楚大部分工作在什么地方。在重新审视图的时候，确实发现了这条线。就是权重形式的变化。

最早的工作其实并不讨论权重，只看是否连接，连接了就标为1。后来引入了权重的概念，使用数值为正的数来表示通信强度。从数学上，有正就有负，最为广泛和成功的改造讨论当属符号网络，考虑到符号网络是对社会网络的某种简化，我们放在这里起到承上启下的作用。所谓符号网络，是指权重引入了负数，用来模拟个体之间的对抗关系，像历史上的诸多概念一样，也是被不同学科的多人独立发现，最早考虑符号网络的一致性问题的是Claudio Altafini 在2013年的文章，首次建立了结构平衡与一种特殊的状态：二分一致性的关系。揭示出当网络满足结构平衡特性时，可以收敛到绝对值相等、符号相反的两个状态，而对于结构不平衡网络则一般收敛到零。用通俗的话解释结构平衡，就是这里有两帮人，帮内团结、对外斗争、达到了实力均衡。需要注意的是，二分一致的达成使用了针对符号网络专门设计的协议。

有了有正到负的先例，2016年的一篇硕士论文里，讨论了复权多智能体网络的模一致性问题，但并未引起多少关注，这方面的一些理论成果尚待挖掘。以上都是权重为标量的情况，2018年受基于刚性图编队的启发，矩阵权重网络重新得到关注，目前仍然出于非常初步的阶段，现有研究大部分集中于对称矩阵，一个值得一提的发现是，当研究者使用对称正定和负定矩阵来将符号网络二分一致性的结论推广到矩阵权重图时，很快发现按照Altafini 协议，即使在结构不平衡的情况，二分一致仍可达到。这个问题在上海交通大学Chongzhi Wang、Haibin Duan 的新工作得到了进一步揭示，这个结果也暗示我们，结构平衡只是某种更为深刻的机理的表面反映，仍然尚待挖掘。而已经开始兴起的矢量权重、非对称矩阵权重、包括理论上的复矩阵权重等各类权重形式，很多情况下仍然是一片未知海洋。

3.生物、团队与社会网络的启发

第二部分提到了目前对于基本一致性概念的一些改进和拓展。提到了几个算是比较新的但也是能够归为一致性一类的概念。还以权重为主线梳理了目前的一致性研究。这部分就把思维稍微的发散一下。考虑一下场景问题。当然，这里所提到的场景，不是指之前提到的罗列关键词的列表式场景，也不是将理论用到工程应用比如编队的场景，这两部分上边这张图已经展示的比较详细了。本片还是主要以理论视角为主。

其实在第二部分的研究的一些成果当中已经有所提醒，**我们所追求的协同控制，它的关键点应该落在哪里？**或者说多智能体领域最初的研究动机是？我们这里来回顾一下多智能体系统研究的起源：

匈牙利Vicsek等人1995年发表在物理杂志PRL上的一篇文章，考虑在平面上运动的多个粒子，采用nearest neighbor rule相互局部协调，最终达到整体一致运动。这篇以仿真为主的文章在刚发表的几年里没有引起多大的关注，也没有多少文章引用。Vicsek, T., Czirók, A., Ben-Jacob, E., Cohen, I., & Shochet, O. (1995). Novel type of phase transition in a system of self-driven particles. Physical Review Letters, 75(6), 1226.

我们可以很清晰的看到，虽然我们现在看到的大多数文章都是在研究一致性，但是，一开始的研究并不是为了追求一致性，而是重点放在了基于邻居的规则。也就是代表了这样的一个科学问题：通过局部的邻居之间的简单交互，如何去产生全局性的复杂的行为？

站在现在这个角度上。我们已经知道的是，人们从控制协议的角度上针对不同场景提出了多种的方案设计。理论证明都能够达到一致和预期的设计目标。但是这仅仅是问题的第一步。也就是说我们利用了已有的控制理论。实现了这一效果。但是达成各种一致这就够了吗？显然不是。而如果我们继续走，比如观察鸟群的行为，有时候不是简单的飞到一块或者分成几群就完事了，形状的变化千奇百怪。这一点可以去看一下相关的纪录片。那么它们呈现的复杂集体行为属于什么机理？因此研究者们从生物学的角度也进行了进一步的探索，提出了一些仿生机理的方法，比如华中科技大学的Haitao Zhang课题组等。这些代表性的工作是从局部规则与群体行为的关系入手去考虑的，它代表着人们对于生物界中存在的群体行为的理解。这个问题到目前为止仍然没有得到很好的解决。

鸟群、鱼群等群体的集体行为引人关注，但我们要注意，有一个更大的群体就摆在眼前，那就是我们自己。

比如团队合作里有很多问题其实值得进一步思考。举个例子，有些时候谈多智能体必说协同控制，那么我们来想象一下协同控制的流程，而不仅仅限于一致性，首先一个工程上的群体，我们需要给他安排一个任务。这个任务是需要共同完成的，那么这里就出现了一个问题：也就是谁去完成这个任务？是所有的人都去，还是一部分一部分的对任务进行分解之后，再去完成子任务，最后汇总成目标。第二个，如果是分解成子任务，那么分配就是一个关键问题，谁去比较合适？去多少人比较合适？这是都是问题。但是这些问题很少出现在控制理论的研究当中，但是在多机器人领域的研究还是比较多的，详情可以参考：Cooperative Heterogeneous MRS_2019_ACM。

不妨再大些，多智能体系统，不仅可以用来建模工程系统，还可以用来建模社会系统。一旦有了这么一个认识，那么很自然的就可以去考虑比如观点动力学（Opinion Dynamic）问题，疾病传播动力学问题。比如拿观点动力学问题来说，虽然模型与工程系统不一样，但是仍然存在着如何通过调控，使得最终群体达到一致意见的需求。而对于疾病传播动力学模型，这几年的热度就不多说了。

虽然无论是观点动力学还是疾病传播动力学问题，以往都在其他领域都得到了大量的关注。但在这几年，相关的研究在控制领域逐渐开始兴起。人们开始利用控制理论的视角去分析了这些问题，相关的工作，**可以关注一下Ming Cao、Mengbin Ye、Ji Liu等相关课题组的工作。**利用已经有的研究基础，无论是控制系统的指标还是控制系统的设计方法，在这样一个新背景下，能否得到新的结论，挖掘新的特性，都是一个未知的内容。这也是交叉学科的独特魅力之一。

在提及的观点动力学和疾病传播动力学仅仅是两个例子。在近些年的控制领域顶刊上，我们还可以看到对社会系统进行建模的，比如决策系统、投票系统都是属于这一类，在这些理论的新背景下相关的研究，将推进我们对于一致性机制的理解。

顺带一提，既然讨论社会网络，那么智能因素是肯定要考虑的，虽然一开始的比如观点动力学模型、传播模型也是微分方程模型。但智能时代可以更进一步了，比如说，

①对于每个个体引入合作-竞争、或者博弈的因素。这在观念传播动力学模型近期研究文章当中是比较常见的方法。也就是说，如果赋予每个个体一定自主性（选择权利），那么又是如何变化的？

②近几年，计算机界风起云涌，机器学习这个概念从课本走向大众。而在众多的机器学习的概念当中，多智能体强化学习，同样带有多智能体这四个字。那么这就启发我们。如果给每个个体引入记忆-学习的能力，放在我们所熟知的网络里面，比如考虑网络结构的多智能体强化学习，去探讨我们上面提到的问题。又会得到怎样的一种新的启示？

③数据驱动的观念可以引入处理社会网络的复杂性，以便进行更好的调控。

我们可以关注到，很多长期从事多智能体研究的课题组，近几年也在转向这个方向。一方面，虽然社会网络也属于经典学科了，但带着控制观点去处理分析社会网络确实是新兴产物，尤其是这几年大背景下，另一方面，大家也都在寻找未来的着手点。

当然，这种问题跨度大，难度高。是多个学科共同关注的问题，并且多次入选了自然杂志年度科学问题表里面。值得一提的是，2021年诺贝尔物理学奖获得者乔治帕里西也研究过这个问题（可以参考科普著作《随椋鸟飞行》）。无论是数学界、生物界、物理界还是计算机界等，都有大量的学者在探索这个问题，但是每个学科都有其独特的方法论。对于我们而言，虽然不能一下子就全部跳到这个领域进行攻关，但是相关成果我们是可以借鉴的。原因正如上边所说。**对于控制学科来说，我们不仅期望的是探索新场景的机理，我们更期望的是受到启发设计调控的方式。**比如考虑博弈或者学习的系统，理论分析存在很高的价值，也出现了很多可以称为经典的分析工作，但实际应用上怎么说服设计人员去采用？这一点需要深入挖掘，尤其是跟传统方法对比，有什么传统方法解决不了的问题。这将是控制科学框架下的研究重点。

4.网络主干剖析：图论

从控制理论诞生那天起，系统分析与控制就形影不离了。系统特性为我们设计控制器提供了很多方便，更有很多时候系统性能直接否定了控制的可能性。因此，即使在专注于控制器设计的工作，也会在最开头列出使用几条假设。因此，专门研究系统性能的工作是值得单独一个单元来讨论的。

说到群体的性能研究，除了上部分提到的生物集群，我们也会想到上个世纪末诞生的网络科学，网络科学目前也发展出了许多经典成果，由于处理节点比较多，大部分使用统计概念和统计工具去描述网络，侧重于网络行为揭示和性能分析。而在阅读相关文章中，我们很多时候能够看到作者对于网络的结构进行的一些假设，比如包含一棵有向生成树，图是连通的等等，这些假设是为了后续结论的讨论和证明方便而设立的。如果我们把多智能体系统不断简化提炼，那么我们得到的就是一张图。因此，虽然侧重点和工具不同，网络科学和多智能体系统仍然具有天生的可结合点。

网络科学里有很多结论指向了网络的特殊结构。严格来说，特殊结构这个对于控制领域的研究人员也不算陌生，在上个世纪发展出的“系统的图表示”理论中我们已经见识过了。对于网络尤其是特殊网络结构的研究，能够产生帮助我们理解、辅助我们设计的有效工具。这里我们简单举一个例子：

在图论里面有一个概念叫做Equitable partition，为了讨论方便，我们这里讨论最为简单的图。即无向无权重无符号图。我们将具有相同邻居节点的个体称为等价节点，这种节点的重要标志是它接收的和传出的信息是完全一样的。因此在全过程里，它们状态始终一致，在不引入新的控制信号条件下，无法使得它们之间达到不一样的状态。也就是控制理论当中所描述的不可控情况。当然这里描述的比较简单，具体证明就不展开了。受这个现象启发，对于任何一个网络化系统，只要根据该网络化系统的特点，找到接收和发出信号完全一样的节点，并给出针对性的寻找方法，那么我们就可以在可控性上得到相关的结论。正如第二节所提到，这种节点间状态始终一致的现象，在研究分组一致时获得了高度重视。我们今天去搜索这个关键词时，除了从图论角度讨论数学问题的文章，基本都是在各个领域应用这一特性讨论分组一致的文章，大多发表于物理学期刊，有些文章也发表在了控制领域的顶级期刊上。目前这种工具已经成为分组一致研究领域一种常用的工具。

更多的，对于网络特殊结构的研究，可以大体分为以下几个角度：

第一就是某种网络结构对于系统性能的影响，这里面涉及的内容比较多。像路图、树图，环图等，图论当中的扩张、匹配等，还有一些图的工具，比如独立强连通分量、等价划分、零迫集等。研究的性能指标也相当的多，像可控性、可观性、鲁棒性、可镇定性、结构可控性、结构可观性等等等等。

第二是在第一基础上，什么时候 我们构造 什么样的网络结构 来完成什么样的指标 是最好的，或者对处理问题是方便的。

第三是新型网络的建模。借鉴了图论的一些新成果，比如矢量、矩阵权重网络，再比如超图。也诞生了一些比较不错的交叉工作。

对系统性能的研究进一步丰富了设计控制器时需要注意的原则和可以优化的思路。我们举例子时经常说，这种控制方法处理一万个节点的网络怎么办？这里我们就看一下如果一个网络中有一万个节点会对系统分析与控制有什么影响？

①对分布式的严格要求：尽管我们使用了分布式协议，但不少协议的设计过程相较于集中控制优势并不明显，仍然需要精确知道全局信息，假设都一万个节点了，如果还是整体设计，单纯算矩阵就费劲，如果其中几个节点失效了呢，又该怎么处理，是不是还得再对万维大矩阵下手？完全分布式或者分散设计的作用在此时体现出来，相较于完全分布式控制（可参考Zhongkui Li课题组的工作），使用完全分布式的判据去分析系统性能，大多数时候还是一个开放问题。

②未知带来的挑战：一万个节点情况，未知的情况很多，比如这堆节点内部怎么连接？即使知道了全部结构，每条边上的权重呢？或者节点动力学是什么情况？都是问题。对于未知，人们一方面开发了数据驱动的方式去控制，这点跟网络科学使用统计工具去处理很相似。进一步，针对具体未知的情况分别讨论：针对内部连接不知道的情况，网络科学有社团发现的相关研究，控制里面也有工作尝试从输出观察网络结构（可观性）的研究。针对权重不知道的情况，人们想起来了结构化系统理论的概念，放到网络上就是研究一类系统，它们网络结构一样，边权重不一样，这类系统的共同性质。可以参考An overview of structural systems theory。

5.未来在特色问题上

几千字无法穷尽多智能体的研究，就在写文章的这个上午，几篇新工作可能已经悄然上线，我们无法精确预料到五年后的多智能体系统研究会有什么新因素出现，新权重、新网络，网络科学交叉等谁会抢先出现突破、占据主流，更不用说有可能一种崭新的理论会产生并席卷控制理论了。但是，如果我们从脉络上把握，而非纠结具体名词，那预测显而易见：特色问题。

谈到控制学科，它的目的是实现对系统的调控，那么它的核心基础就是对系统的认识和剖析，所以需要抓住所研究系统的特性进行进一步的讨论。以上这句话大概是每一个接触过控制学科的人都知道的，但是这里面仍然有一些值得思索的内容，比方说，拿到一个研究成果，它真的符合这句话吗？

我们可以在控制理论结构图当中任选一个名词，并且把它加上多智能体的前缀，放到任何一种文献库，里面都能搜到很多篇文章。我们这时候回头再来看开头的一句话，就是这些文章的特色究竟是在什么地方？或者说的更清楚一点，就是这些处理方法，**有没有抓住多智能体系统的特色？**我们这里不再多言前面四个部分具体提到的特色。但我们回过头来去看前四部分的这些开创性的工作，就可以很简单的得到一个道理，所有的开创性都是根据这个系统自身的特色而来，这对于控制研究来说就是一个启发，如果说你深刻的了解了系统的特色，抓住了这个系统的一些小小的特性，你就能够出一些开创的工作，进而去解决别人没有解决甚至没有意识的问题。

特色不是一成不变的，而是随着概念演进会不断出现，因此不必担心特色被挖掘清楚的情况，有些读者可能会问，新特色传统控制方法解决不了，那是不是非得转行啊。对于这个问题，有这么一段话说的很好，

在一个更大的问题框架下利用控制理论的思想和技术，也能探索实现更加符合时代的“系统”的可行性。1950年的飞机大炮工业生产需要维纳控制论，2050年的无人驾驶、无人工厂、联网基础设施、灾难救援动物保护等等也需要新的“控制论”，方法和技术手段不断在迭代适应新的基础设施和硬件条件，但归根结底还是对系统加以研究和分析以及实现，并没有脱离控制理论本身，兼收并蓄博取众长可能会是一个好的心态。

控制理论这个词，如果要准确的来说，应该叫做系统调控理论，控制理论每个时期都应该有不同的内涵，这是需要突破的，至少在认识上要突破，如果我们从已有的控制理论框架去思考问题，我们的思维就有可能局限于这个框架，心里往往想的是如何去继续做，然后产生一个好摘的果子都摘完的感觉，但是如过从研究初心出发，奔着解决问题去，不要排斥任何东西，强化学习也好，博弈论也罢，这些东西在他们各自领域闪闪发光，把他们搬过来，能不能用到我们这里？

6.结语

经历二十余年，多智能体控制领域即使“单纯罗列概念得用一张A4纸”，这条拥挤的赛道有人退出，有人泛化，有人继续，也有新人在门外张望，又是一年毕业季和申博读研择校招生季，祝好吧。