20世纪60年代初,由于空间技术的迅猛发展和计算机的广泛应用,使得动态系统的优化理论得到了迅速发展,形成了最优控制这一重要的学科分支。最优控制是现代控制理论的一个重要组成部分。最优控制问题大都是从具体工程实践中归纳和提炼出来的,随着最优控制理论的不断完善,其在航空、航天、工业过程控制、经济管理与决策以及人口控制等领域得到了成功的应用,并取得了显著的成就。
最优控制是使被控系统的性能指标实现最优化的一种综合策略,可概括为,对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制策略,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。最优控制问题广泛存在实际的生产中,可以说最优控制问题无处不在。例如,对于吊车系统的吊运控制问题,希望在吊运过程中,摆角越小越好,同时吊运时间越短越好;对于机械臂系统的控制问题,期望机械臂系统的跟踪误差越小越好;对于行星着陆器的动力下降段的控制问题,期望对参考轨迹的跟踪效果好以及燃料消耗最少。
简介为了解决最优控制问题,必须建立描述受控运动过程的运动方程,给出控制变量的允许取值范围,指定运动过程的初始状态和目标状态,并且规定一个评价运动过程品质优劣的性能指标。通常,性能指标的好坏取决于所选择的控制函数和相应的运动状态。系统的运动状态受到运动方程的约束,而控制函数只能在允许的范围内选取。因此,从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制范围的约束下,对以控制函数和运动状态为变量的性能指标函数(称为泛函)求取极值(极大值或极小值)。解决最优控制问题的主要方法有古典变分法、极大值原理和动态规划。
对于非线性系统,其最优控制的解一般是不存在的再加上非线性系统的复杂性和多样性,这方面的研究成果还很少,尚待解决的问题还很多,本文对非线性最优控制理论现有研究成果对比进行了详细的阐述,并对其优缺点进行了客观的对比,为非线性最优控制理论的进一步研究提供参考。
近年来,最优控制理论的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支例如鲁棒最优控制、随机最优控制、分布参数系统的最优控制、大系统的次优控制网、离散系统的最优控制及最优滑模变结构控制nxi等而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情祝外,这两个问题都无法得到解析。因此,许多学者都致力于寻求近似的求解方法,通过近似解得到近似的最优控,即次优控制。
最优控制算法简介解决最优控制问题最大的难点在于HJB方程的求解,只有当系统模型是低阶线性模型时,才有可能给出具有显式表达式的最优控制解。在实际系统里,乃至自然界中,几乎绝大多数系统都是非线性的系统,想得到具有显式表达式的控制量几乎不可能,这就需要借助计算机,以及选择合适的最优的数值解法,以得到最优解。一般的,最优控制问题的求解方法为数值算法。极大值原理和动态规划从理论方面研究了最优控制所应遵循的方程和条件,而最优控制的数值算法则是从计算方面来确定最优控制量的具体方法和步骤。1
评价最优控制数值算法优劣的三个主要方面是算法的收敛性、计算复杂性以及数值稳定性。算法的收敛性是保证计算过程能达到正确结果的前提。算法的计算复杂性也尤其重要,这对实时控制具有特别重要的意义。一个好的算法应使计算量和存储量尽可能小,以便能由尽可能简单的计算机来实现计算。好的算法还应具有较好的数值稳定性,即计算的结果对初始数据和运算过程的误差不能过于敏感,同时具有处理病态问题的能力。典型的最优控制数值算法包括:求解由极大值原理导出的微分或差分方程的两点边值问题的各种算法,对动态规划中的贝尔曼方程进行数值求解_的算法,求解线性二次型最优控制问题的黎卡提方程的各种算法,处理控制或状态受约束问题的惩罚函数法,在控制策略的函数空间中利用搜索寻优或梯度寻优技术和牛顿一拉夫森方法等直接求解非线性系统最优控制问题的算法等。其中,针对非线性系统的开环最优控制问题和线性二次型最优控制问题展开的数值算法研究尤多。
最优问题间接求解法在间接法中,我们依靠最小值原理和其它一些必要条件得到一个两点边值问题,然后通过数值求解该问题得到相应的最优轨迹。在几种基于打靶法求解两点边值问题的方法中,多重打靶法是最引人瞩目的。而其它的一些间接数值求解法,比如伴随方程的向前一向后积分法、函数空间梯度法等,在过去的几年中应用并不十分广泛。间接法的主要优点是解的精度高,同时方法保证了求解满足最优条件。然而间接法常常会遇到比较严重的解的收敛性问题。如果在求解中,没有关于系统初始值的一个好的选取,或是没有关于约束和非约束下系统运动轨迹的先验知识,收敛过程可能需要花费很长的计算时间,甚至可能根本无法找到最优解。
最优问题直接求解法在直接法中,连续性的最优控制问题通过参数化的过程被转化为了一个有限维的优化问题。转化后的问题可以通过一些已有的比较成熟的约束优化算法进行数值求解。相对于间接法而言,直接法无需考虑最优化条件,而是直接求解问题本身。直接法不易受到收敛问题的影响,但估计的精度不如间接法。最优的必要条件不是直接满足的,而且伴随量的估计精度有时也会很差。现在比较常用的几种直接求解方法包括最优参数控制法,有限差分方法,配点法,微分包含方法和伪谱方法。在最优参数控制法中,控制量被单独参数化,同时数值积分方法被用来求解微分方程;在有限差分方法中,原微分方程和边界条件被近似为有限差分方程组:在配点法中,状态量和控制量同时被参数化,在各个节点处,局部分段多项式被用来近似微分方程;微分包含方法只是将状态量参数化,并使用由速端曲线定义的状态变化率;在伪谱方法中,通过全局多项式将状态量和控制量同时参数化,积分方程和微分方程通过求积法被近似。配点法和伪谱方法的一个重要的特点就是伴随量的相合估计。
非线性最优控制理论研究成果分类目前,较为流行的近似最优控制求解方法主要有以下几类:2
幂级数展开法幂级数展开方法通过一个幂级数来构造控制律,得到序列形式的近似最优解,或者将系统中的非线性项以幂级数形式分解,或者通过引进一个临时变量并围绕它展开。
将上式代入HJB方程求得级数近似解,也可利用Adomian分解将非线性项进行分解。由此寻求非线性HJB方程级数的近似解。
Galcrkin逐次逼近方法由动态规划得到的一般性偏微分HJB方引入一个迭代过程来求解一般非线性HJB方程的一个近似解序列
广义正交多项式级数展开法其主要思想是将最优控制问题中的状态变量,控制输入,性能指标和各个参数分别用广义正交多项式展开,利用广义正交多项式的积分、乘积运算阵
将描述系统的微分方程转化为一系列的代数方程X=MU+N。然后,得到TU=V,当T非奇异时,由U=T-1V得到的控制律是一个多项式级数解u(t)=θ(t)U。该方法将最优控制问题转化为代数极值问题,从而避免了求解时变非线性Riccati方程
有限差分和有限元方法经典的有限差分和有限元方法可以用来近似求解非线性HJB方程近年来,这类方法用来近似求取非线性HJB方程的粘性解。
状态相关Riccati方程方法这种方法适用的模型是仿射非线性系统。通过极大值原理假设最优控制律具有如下形式。
其中P(x)为下式所述里卡提方程的解
这样,问题的关键归结于近似求解P(x)。状态相关里卡提方程方法通过在P(x)中引入灵敏度参数变量ε,在ε=o邻域内将P(x)展为幂级数
通过比较幂级数同次项系数将状态相关里卡提方程分解为一组矩阵微分方程序列,由此求得其近似解状态相关里卡提方程方法所设计的近似最优控制律是一种级数形式的状态反馈控制律
Riccati方程近似序列法该方法对非线性系统构造线性时变序列以及相应的线性二次型时变性能指标,得到线性时变序列的最优反馈控制序列
此方法计算量较大,但是当系统的维数不是很大时,较里卡提方程近似序列方法具有很快的收敛速度,并表现出很好的鲁棒性。
逐次逼近法该方法是针对非线性的一次项和高次项可分离的一类非线性系统进行近似最优控制问题的求解,给出了一种逐次逼近的近似求解方法该方法针对由极大值原理导致的两点边值问题,构造近似的等价序列将其转化为一组线性非齐次两点边值问题序列,通过迭代求解一系列的向量微分方程,包括状态向量方程序列和共态向量方程序列,得到原非线性系统近似最优控制问题的解该方法被广泛应用到各类非线性系统,其最大优点是在迭代过程中每次计算的不是矩阵微分或代数方程,而是向量微分或代数方程,计算量大大减少,而且实时性很高。
线性与非线性最优控制线性最优控制线性最优控制(linear optimal control)最优控制问题的实质是要找出允许的控制作用(规律),使得动态系统(受控对象)从初始状态转移到某种要求的终端状态,并且保证某种要求的性能指标达到最小(大)。线性最优控制是特指那类受控对象为线性时不变系统的最优控制。
线性最优控制是最优控制的一个特殊类。在线性最优控制中,受控制的装置假设为线性的,而控制器,即产生最优控制作用的装置也限于是线性的。这就是说,控制器输出即最优控制是与输人线性相关,而输人则是对装置进行测量而产生的量。当然,人们一定会问,为什么要特别地研究线性最优控制,而不直接研究最优控制呢?这里可以提出一些理由。例如,工程上许多实际装置在其附加控制器之前是线性的,而 且线性控制器在技术上是最易实现的,且它往往能满足需要。
区别线性和非线性最优控制理论之间既有相似之处更有重大区别。当系统为线性的时候,它的解可以由转移函数表出,特别是在定常情况下,转移函数有具体表达式,这就为我们的分析提供了十分便和之处。另一方面,在最大值原理基础上获得的Hamilton函数关于控制的偏导呈现相对简单的形式,往往可以求出最优反馈率,从而完全解决最优控制问题。非线性的情况则复杂得多,对它的研究也不够彻底,许多方面还有待进一步深入。这个领域的研究有一个十分明显的特点,那就是多种数学理论和方法的综合运用,包括非线性泛函分析、代数、和微分几何方法等等。
线性最优控制所要求的计算机程序往往可以用于非线性最优控制问题。
非线性最优控制理论研究成果对比幂级数展开方法要求系统关于状态向量X解析,才能够进行展开,这在实际工程应用中是不现实的Galcrkin逐次逼近法的收敛性过于依赖系统的初值,收敛性在很多情祝下是无法保证的广义正交多项式级数展开法和有限差分、有限元方法都是采用不同的数学工具来解决近似求解非线性系统的最优控制问题,但这两种方法的计算收敛性不好,所需的巨大计算量也使得它们离工程实际应用有很大一段距离状态相关里卡提方程适用于一类仿射非线性系统里卡提方程近似序列方法同样适用于一类仿射非线性系统,当处理高维系统时,其计算量将很大而逐次逼近法,从计算复杂度看,是对向量迭代,得到的最优控制律是由精确的线性反馈项和非线性补偿项组成,将最优控制的求解转化为非线性补偿向量序列的求极限过程,大大减少了计算量,容易被实际工程所应用简言之,逐次逼近法通过较为简单的计算设计得到系统的近似最优控制律,具有计算量少,易于工程实现的优点,有很好的工程应用前景然而,逐次逼近法的缺点在于其对外部扰动和系统内部参数摄动以及未建模动态敏感,因此提高最优控制的鲁棒性是非常必要的。