[科普中国]-自适应最优控制-

背景

为了有效地控制液压非线性系统，提出基于RYF神经网络的自适应最优控制系统，应用于机器人液压驱动器。首先，建立了液压系统的动力学模型;然后，输入幅值和频率连续变化的信号，应用卡尔曼滤波器估计液压系统状态，进而计算出模型参数，对模型参数进行分组用于训练RYF神经网络；接着，对不同组参数求平均作为参考点，用RYF神经网络学习最优控制器反馈增益随系统参数的变化规律;最后，训练完成的神经网络根据卡尔曼滤波器参数估计值在线预测并调节控制器增益.经实验验证，该控制系统调节时间和跟踪误差仅为普通线性二次型最优控制器的1 /2和1/3左右。

自适应控制在日常生活中，所谓自适应是指生物能改变自己的习性以适应新的环境的一种特征。因此，直观地说，自适应控制器应当是这样一种控制器，它能修正自己的特性以适应对象和扰动的动态特性的变化。

自适应控制系统，指的是根据控制对象本身参数或周围环境的变化, 自动调整控制器参数以获得满意性能的自动控制系统。

定义1、不论外界发生巨大变化或系统产生不确定性，控制系统能自行调整参数或产生控制作用，使系统仍能按某一性能指标运行在最佳状态的一种控制方法。

所属学科：航空科技(一级学科) ；飞行控制、导航、显示、控制和记录系统(二级学科)

2、采用自动方法改变或影响控制参数，以改善控制系统性能的控制。

所属学科：机械工程(一级学科) ；工业自动化仪表与系统(二级学科) ；自动控制器及系统-自动控制器及系统一般名词(三级学科)

简介自适应控制的研究对象是具有一定程度不确定性的系统，这里所谓的“不确定性”是指描述被控对象及其环境的数学模型不是完全确定的，其中包含一些未知因素和随机因素。

任何一个实际系统都具有不同程度的不确定性，这些不确定性有时表现在系统内部，有时表现在系统的外部。从系统内部来讲，描述被控对象的数学模型的结构和参数，设计者事先并不一定能准确知道。作为外部环境对系统的影响，可以等效地用许多扰动来表示。这些扰动通常是不可预测的。此外，还有一些测量时产生的不确定因素进入系统。面对这些客观存在的各式各样的不确定性，如何设计适当的控制作用，使得某一指定的性能指标达到并保持最优或者近似最优，这就是自适应控制所要研究解决的问题。

自适应控制和常规的反馈控制和最优控制一样，也是一种基于数学模型的控制方法，所不同的只是自适应控制所依据的关于模型和扰动的先验知识比较少，需要在系统的运行过程中去不断提取有关模型的信息，使模型逐步完善。具体地说，可以依据对象的输入输出数据，不断地辨识模型参数，这个过程称为系统的在线辩识。随着生产过程的不断进行，通过在线辩识，模型会变得越来越准确，越来越接近于实际。既然模型在不断的改进，显然，基于这种模型综合出来的控制作用也将随之不断的改进。在这个意义下，控制系统具有一定的适应能力。比如说，当系统在设计阶段，由于对象特性的初始信息比较缺乏，系统在刚开始投入运行时可能性能不理想，但是只要经过一段时间的运行，通过在线辩识和控制以后，控制系统逐渐适应，最终将自身调整到一个满意的工作状态。再比如某些控制对象，其特性可能在运行过程中要发生较大的变化，但通过在线辩识和改变控制器参数，系统也能逐渐适应。

常规的反馈控制系统对于系统内部特性的变化和外部扰动的影响都具有一定的抑制能力，但是由于控制器参数是固定的，所以当系统内部特性变化或者外部扰动的变化幅度很大时，系统的性能常常会大幅度下降，甚至是不稳定。所以对那些对象特性或扰动特性变化范围很大，同时又要求经常保持高性能指标的一类系统，采取自适应控制是合适的。但是同时也应当指出，自适应控制比常规反馈控制要复杂的多，成本也高的多，因此只是在用常规反馈达不到所期望的性能时，才会考虑采用。

最优控制理论最优控制理论（optimal control theory），是现代控制理论的一个主要分支，着重于研究使控制系统的性能指标实现最优化的基本条件和综合方法。最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。它是现代控制理论的重要组成部分。1

简介这方面的开创性工作主要是由贝尔曼（R.E.Bellman）提出的动态规划和庞特里亚金等人提出的最大值原理。这方面的先期工作应该追溯到维纳（N.Wiener）等人奠基的控制论（Cybernetics）。1948年维纳发表了题为《控制论—关于动物和机器中控制与通讯的科学》的论文，第一次科学的提出了信息、反馈和控制的概念，为最优控制理论的诞生和发展奠定了基础。

研究内容最优控制理论所研究的问题可以概括为：对一个受控的动力学系统或运动过程，从一类允许的控制方案中找出一个最优的控制方案，使系统的运动在由某个初始状态转移到指定的目标状态的同时，其性能指标值为最优。这类问题广泛存在于技术领域或社会问题中。

例如，确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少，选择一个温度的调节规律和相应的原料配比使化工反应过程的产量最多，制定一项最合理的人口政策使人口发展过程中老化指数、抚养指数和劳动力指数等为最优等，都是一些典型的最优控制问题。最优控制理论是50年代中期在空间技术的推动下开始形成和发展起来的。苏联学者Л.С.庞特里亚金1958年提出的极大值原理和美国学者R.贝尔曼1956年提出的动态规划，对最优控制理论的形成和发展起了重要的作用。线性系统在二次型性能指标下的最优控制问题则是R.E.卡尔曼在60年代初提出和解决的。

自适应最优控制自适应最优控制（Adaptive optimal control）是指根据控制对象本身参数或周围环境的变化，自动调整控制器参数以使控制系统的性能指标实现最优化的基本条件和综合方法，满意性能的自动控制系统。不论外界发生巨大变化或系统产生不确定性，控制系统能自行调整参数或产生控制作用，使系统仍能按某一性能指标运行在最佳状态的一种控制方法。

主要方法为了解决自适应最优控制问题，必须建立描述受控运动过程的运动方程，给出控制变量的允许取值范围，指定运动过程的初始状态和目标状态，并且规定一个评价运动过程品质优劣的性能指标。通常，性能指标的好坏取决于所选择的控制函数和相应的运动状态。系统的运动状态受到运动方程的约束，而控制函数只能在允许的范围内选取。因此，从数学上看，确定最优控制问题可以表述为：在运动方程和允许控制范围的约束下，对以控制函数和运动状态为变量的性能指标函数（称为泛函）求取极值（极大值或极小值）。解决自适应最优控制问题的主要方法有古典变分法、极大值原理和动态规划。

古典变分法研究对泛函求极值的一种数学方法。古典变分法只能用在控制变量的取值范围不受限制的情况。在许多实际控制问题中，控制函数的取值常常受到封闭性的边界限制，如方向舵只能在两个极限值范围内转动，电动机的力矩只能在正负的最大值范围内产生等。因此，古典变分法对于解决许多重要的实际最优控制问题，是无能为力的。2

极大值原理极大值原理，是分析力学中哈密顿方法的推广。极大值原理的突出优点是可用于控制变量受限制的情况，能给出问题中最优控制所必须满足的条件。

动态规划动态规划是数学规划的一种，同样可用于控制变量受限制的情况，是一种很适合于在计算机上进行计算的比较有效的方法。

最优控制理论已被应用于最省燃料控制系统、最小能耗控制系统、线性调节器等。

优化技术自适应最优控制的实现离不开最优化技术，自适应最优化技术是研究和解决最优化问题的一门学科，它研究和解决如何从一切可能的方案中寻找最优的方案。也就是说，最优化技术是研究和解决如何将最优化问题表示为数学模型以及如何根据数学模型尽快求出其最优解这两大问题。一般而言，用最优化方法解决实际工程问题可分为三步进行：

①根据所提出的最优化问题，建立最优化问题的数学模型，确定变量，列出约束条件和目标函数；

②对所建立的数学模型进行具体分析和研究，选择合适的最优化方法；

③根据最优化方法的算法列出程序框图和编写程序，用计算机求出最优解，并对算法的收敛性、通用性、简便性、计算效率及误差等作出评价。

求解方法所谓自适应最优化问题，就是寻找一个最优控制方案或最优控制规律，使系统能最优地达到预期的目标。在最优化问题的数学模型建立后，主要问题是如何通过不同的求解方法解决寻优问题。一般而言，最优化方式有离线静态优化方式和在线动态优化方式，而自适应最优化问题的求解方法大致可分为四类：3

解析法对于目标函数及约束条件具有简单而明确的数学表达式的最优化问题，通常可采用解析法来解决。其求解方法是先按照函数极值的必要条件，用数学分析方法求出其解析解，然后按照充分条件或问题的实际物理意义间接地确定最优解。

这种方法适用于性能指标及约束有明显解析表达式的情况。其一般步是先用求导方法或变分法求出最优控制的必要条件，得到一组方程或不等式，然后求解这组方程或不等式，得到最优控制的解析解即为所求的最优控制。解析法大致可分为两大类。第一类，无约束时，采用微分法或变分法。第二类，有约束时，采用极大值原理或动态规划。

（1）变分法：当控制向量不受约束时，引入哈密顿函数，应用变分法可以导出最优控制的必要条件，即正则方程、控制方程、边界条件、横截条件。

（2）极大值原理：在用变分法求解最优控制问题时，是假定控制向量u(O)不受任何限制，即容许控制集合可以看成是整个P维控制空间开集，控制变分u是任意的，同时还要求哈密顿出数H对u连续可微，但在实际工程上，控制变量往往受到一定的限制，这时可以用极大值原理来求解最优控制问题，这种方法其实是由变分法引申而来的，但由于它能应用于控制变量u(t)受边界限制的情况，并且不要求哈密顿出数H对u连续可微，因此获得了广泛的应用。

（3）动态规划：极大值原理一样，是处理控制向量限制在一定闭集内的最优控制问题的有效数学方法，它把复杂的最优控制间题变为多级决策过程的递推函数关系，其基础和核心时最优性原理即在一个多级决策问题中无论初始状态和初始决策如何，当把其中的任何一级和状态再作为初始级和初始状态时，如下的决定对与这一级开始往后的多级决策过程的一部分必定仍然是一个最优决策。因此，利用这一最优性原理必然可把一个多级决策问题化为最优的单级决策问题并且本级决策与本级以前的任何决策无关，只与本级的初始位置和初始决策有关。对于连续系统用动态规划法求最优控制问题时，可以先把连续系统离散化，用有限差分方程近似代替连续方程，然后用离散动态规划法求解。

数值解法（直接法）对于目标函数较为复杂或无明确的数学表达式或无法用解析法求解的最优化问题，通常可采用直接法来解决。直接法的基本思想，就是用直接搜索方法经过一系列的迭代以产生点的序列，使之逐步接近到最优点。直接法常常是根据经验或实验而得到的。

性能指标比较复杂或不能用变量显函数表示时，可以采用直接搜索法，经过若干次迭代搜索到最优点，数值计算法可以分为两大类：

（1）区间消去法，又称为一维搜索法，适用于求解单变量极值问题。主要有黄金分割法、多项式插值法等。

（2）爬山法，又称多维搜索法，适用于求解多变量极值问题。主要有坐标轮转法、步长加速法等。

解析与数值相结合的寻优方法（梯度型法）是一种解析与数值计算相结合的方法。主要包括两大类：一种是无约束梯度法，如陡降法、拟牛顿法等。第二类是有约束梯度法，如可行方向法、梯度投影法。

网络最优化方法这种方法以网络图作为数学模型，用图论方法进行搜索的寻优方法。

最新进展在线优化方法基于对象数学模型的离线优化方法是一种理想化方法。这是因为尽管工业过程（对象）被设计得按一定的正常工况连续运行，但是环境的变动、触媒和设备的老化以及原料成分的变动等因素形成了对工业过程的扰动，因此原来设计的工况条件就不是最优的。

解决此类问题的常见方法。

(1)局部参数最优化和整体最优化设计方法

局部参数最优化方法的基本思想是：按照参考模型和被控过程输出之差来调整控制器可调参数，使输出误差平方的积分达到最小。这样可使被控过程和参考模型尽快地精确一致。

此外，静态最优与动态最优相结合，可变局部最优为整体最优。整体最优由总体目标函数体现。整体最优由两部分组成：一种是静态最优（或离线最优），它的目标函数在一段时间或一定范围内是不变的；另一种是动态最优（或在线最优），它是指整个工业过程的最优化。工业过程是一个动态过程，要让一个系统始终处于最优化状态，必须随时排除各种干扰，协调好各局部优化参数或各现场控制器，从而达到整个系统最优。

(2)预测控制中的滚动优化算法

预测控制，又称基于模型的控制（Model-based Control），是70年代后期兴起的一种新型优化控制算法。但它与通常的离散最优控制算法不同，不是采用一个不变的全局优化目标，而是采用滚动式的有限时域优化策略。这意味着优化过程不是一次离线进行，而是反复在线进行的。这种有限化目标的局部性使其在理想情况下只能得到全局的次优解，但其滚动实施，却能顾及由于模型失配、时变、干扰等引起的不确定性，及时进行弥补，始终把新的优化建立在实际的基础之上，使控制保持实际上的最优。这种启发式的滚动优化策略，兼顾了对未来充分长时间内的理想优化和实际存在的不确定性的影响。在复杂的工业环境中，这比建立在理想条件下的最优控制更加实际有效。

预测控制的优化模式具有鲜明的特点：它的离散形式的有限优化目标及滚动推进的实施过程，使得在控制的全过程中实现动态优化，而在控制的每一步实现静态参数优化。用这种思路，可以处理更复杂的情况，例如有约束、多目标、非线性乃至非参数等。吸取规划中的分层思想，还可把目标按其重要性及类型分层，实施不同层次的优化。显然，可把大系统控制中分层决策的思想和人工智能方法引入预测控制，形成多层智能预测控制的模式。这种多层智能预测控制方法的，将克服单一模型的预测控制算法的不足，是当前研究的重要方向之一。

(3)稳态递阶控制

对复杂的大工业过程（对象）的控制常采用集散控制模式。这时计算机在线稳态优化常采用递阶控制结构。这种结构既有控制层又有优化层，而优化层是一个两级结构，由局部决策单元级和协调器组成。其优化进程是：各决策单元并行响应子过程优化，由上一级决策单元（协调器）协调各优化进程，各决策单元和协调器通过相互迭代找到最优解。这里必须提到波兰学者Findeisen等所作出的重要贡献。

由于工业过程较精确的数学模型不易求得，而且工业过程（对象）往往呈非线性及慢时变性，因此波兰学者Findesien提出：优化算法中采用模型求得的解是开环优化解。在大工业过程在线稳态控制的设计阶段，开环解可以用来决定最优工作点。但在实际使用上，这个解未必能使工业过程处于最优工况，相反还会违反约束。他们提出的全新思想是：从实际过程提取关联变量的稳态信息，并反馈至上一层协调器（全局反馈）或局部决策单元（局部反馈），并用它修正基于模型求出的的最优解，使之接近真实最优解。

(4)系统优化和参数估计的集成研究方法

稳态递阶控制的难点是，实际过程的输入输出特性是未知的。波兰学者提出的反馈校正机制，得到的只能是一个次优解。但其主要缺点在于一般很难准确估计次优解偏离最优解的程度，而且次优解的次优程度往往依赖于初始点的选取。一个自然的想法是将优化和参数估计分开处理并交替进行，直到迭代收敛到一个解。这样计算机的在线优化控制就包括两部分任务：在粗模型（粗模型通常是能够得到的）基础上的优化和设定点下的修正模型。这种方法称为系统优化和参数估计的集成研究方法。 (Integrated System Optimizationand Parameter Estimation)

智能优化方法对于越来越多的复杂控制对象，一方面，人们所要求的控制性能不再单纯的局限于一两个指标；另一方面，上述各种优化方法，都是基于优化问题具有精确的数学模型基础之上的。但是许多实际工程问题是很难或不可能得到其精确的数学模型的。这就限制了上述经典优化方法的实际应用。随着模糊理论、神经网络等智能技术和计算机技术的发展。

智能式的优化方法得到了重视和发展。

(1)神经网络优化方法

人工神经网络的研究起源于1943年和Mc Culloch和Pitts的工作。在优化方面，1982年Hopfield首先引入Lyapuov能量函数用于判断网络的稳定性，提出了Hopfield单层离散模型；Hopfield和Tank又发展了Hopfield单层连续模型。1986年，Hopfield和Tank将电子电路与Hopfield模型直接对应，实现了硬件模拟；Kennedy和Chua基于非线性电路理论提出了模拟电路模型，并使用系统微分方程的Lyapuov函数研究了电子电路的稳定性。这些工作都有力地促进了对神经网络优化方法的研究。

根据神经网络理论，神经网络能量函数的极小点对应于系统的稳定平衡点，这样能量函数极小点的求解就转换为求解系统的稳定平衡点。随着时间的演化，网络的运动轨道在空间中总是朝着能量函数减小的方向运动，最终到达系统的平衡点——即能量函数的极小点。因此如果把神经网络动力系统的稳定吸引子考虑为适当的能量函数（或增广能量函数）的极小点，优化计算就从一初始点随着系统流到达某一极小点。如果将全局优化的概念用于控制系统，则控制系统的目标函数最终将达到希望的最小点。这就是神经优化计算的基本原理。

与一般的数学规划一样，神经网络方法也存在着重分析次数较多的弱点，如何与结构的近似重分析等结构优化技术结合，减少迭代次数是今后进一步研究的方向之一。

由于Hopfield模型能同时适用于离散问题和连续问题，因此可望有效地解决控制工程中普遍存在的混合离散变量非线性优化问题。

(2)遗传算法

遗传算法和遗传规划是一种新兴的搜索寻优技术。它仿效生物的进化和遗传，根据“优胜劣汰”原则，使所要求解决的问题从初始解逐步地逼近最优解。在许多情况下，遗传算法明显优于传统的优化方法。该算法允许所求解的问题是非线性的和不连续的，并能从整个可行解空间寻找全局最优解和次优解，避免只得到局部最优解。这样可以为我们提供更多有用的参考信息，以便更好地进行系统控制。同时其搜索最优解的过程是有指导性的，避免了一般优化算法的维数灾难问题。遗传算法的这些优点随着计算机技术的发展，在控制领域中将发挥越来越大的作用。

研究表明，遗传算法是一种具有很大潜力的结构优化方法。它用于解决非线性结构优化、动力结构优化、形状优化、拓扑优化等复杂优化问题，具有较大的优势。

(3)模糊优化方法

最优化问题一直是模糊理论应用最为广泛的领域之一。

自从Bellman和Zadeh在 70年代初期对这一研究作出开创性工作以来，其主要研究集中在一般意义下的理论研究、模糊线性规划、多目标模糊规划、以及模糊规划理论在随机规划及许多实际问题中的应用。主要的研究方法是利用模糊集的a截集或确定模糊集的隶属函数将模糊规划问题转化为经典的规划问题来解决。

模糊优化方法与普通优化方法的要求相同，仍然是寻求一个控制方案（即一组设计变量），满足给定的约束条件，并使目标函数为最优值，区别仅在于其中包含有模糊因素。普通优化可以归结为求解一个普通数学规划问题，模糊规划则可归结为求解一个模糊数学规划(fuzzymathematicalprogramming)问题。包含控制变量、目标函数和约束条件，但其中控制变量、目标函数和约束条件可能都是模糊的，也可能某一方面是模糊的而其它方面是清晰的。例如模糊约束的优化设计问题中模糊因素是包含在约束条件（如几何约束、性能约束和人文约束等）中的。求解模糊数学规划问题的基本思想是把模糊优化转化为非模糊优化即普通优化问题。方法可分为两类：一类是给出模糊解（fuzzysolution）；另一类是给出一个特定的清晰解（crispsolution）。必须指出，上述解法都是对于模糊线性规划（fuzzylinearprogramming）提出的。然而大多数实际工程问题是由非线形模糊规划（fuzzynonlinearprogramming）加以描述的。于是有人提出了水平截集法、限界搜索法和最大水平法等，并取得了一些可喜的成果。

在控制领域中，模糊控制与自学习算法、模糊控制与遗传算法相融合，通过改进学习算法、遗传算法，按给定优化性能指标，对被控对象进行逐步寻优学习，从而能够有效地确定模糊控制器的结构和参数。