研究背景
20世纪60年代初,由于空间技术的迅猛发展和计算机的广泛应用,使得动态系统的优化理论得到了迅速发展,形成了最优控制这一重要的学科分支。最优控制是现代控制理论的一个重要组成部分。最优控制问题大都是从具体工程实践中归纳和提炼出来的,随着最优控制理论的不断完善,其在航空、航天、工业过程控制、经济管理与决策以及人口控制等领域得到了成功的应用,并取得了显著的成就。
最优控制是使被控系统的性能指标实现最优化的一种综合策略,可概括为,对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制策略,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。最优控制问题广泛存在实际的生产中,可以说最优控制问题无处不在。例如,对于吊车系统的吊运控制问题,希望在吊运过程中,摆角越小越好,同时吊运时间越短越好;对于机械臂系统的控制问题,期望机械臂系统的跟踪误差越小越好;对于行星着陆器的动力下降段的控制问题,期望对参考轨迹的跟踪效果好以及燃料消耗最少。
简介为了解决最优控制问题,必须建立描述受控运动过程的运动方程,给出控制变量的允许取值范围,指定运动过程的初始状态和目标状态,并且规定一个评价运动过程品质优劣的性能指标。通常,性能指标的好坏取决于所选择的控制函数和相应的运动状态。系统的运动状态受到运动方程的约束,而控制函数只能在允许的范围内选取。因此,从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制范围的约束下,对以控制函数和运动状态为变量的性能指标函数(称为泛函)求取极值(极大值或极小值)。解决最优控制问题的主要方法有古典变分法、极大值原理和动态规划。
对于非线性系统,其最优控制的解一般是不存在的再加上非线性系统的复杂性和多样性,这方面的研究成果还很少,尚待解决的问题还很多,本文对非线性最优控制理论现有研究成果对比进行了详细的阐述,并对其优缺点进行了客观的对比,为非线性最优控制理论的进一步研究提供参考。
近年来,最优控制理论的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支例如鲁棒最优控制、随机最优控制、分布参数系统的最优控制、大系统的次优控制网、离散系统的最优控制及最优滑模变结构控制等。而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情祝外,这两个问题都无法得到解析。因此,许多学者都致力于寻求近似的求解方法,通过近似解得到近似的最优控,即次优控制。
最优控制方法简介解决最优控制问题最大的难点在于HJB方程的求解,只有当系统模型是低阶线性模型时,才有可能给出具有显式表达式的最优控制解。在实际系统里,乃至自然界中,几乎绝大多数系统都是非线性的系统,想得到具有显式表达式的控制量几乎不可能,这就需要借助计算机,以及选择合适的最优的数值解法,以得到最优解。一般的,最优控制问题的求解方法为数值算法。极大值原理和动态规划从理论方面研究了最优控制所应遵循的方程和条件,而最优控制的数值算法则是从计算方面来确定最优控制量的具体方法和步骤。
评价最优控制数值算法优劣的三个主要方面是算法的收敛性、计算复杂性以及数值稳定性。算法的收敛性是保证计算过程能达到正确结果的前提。算法的计算复杂性也尤其重要,这对实时控制具有特别重要的意义。一个好的算法应使计算量和存储量尽可能小,以便能由尽可能简单的计算机来实现计算。好的算法还应具有较好的数值稳定性,即计算的结果对初始数据和运算过程的误差不能过于敏感,同时具有处理病态问题的能力。典型的最优控制数值算法包括:求解由极大值原理导出的微分或差分方程的两点边值问题的各种算法,对动态规划中的贝尔曼方程进行数值求解_的算法,求解线性二次型最优控制问题的黎卡提方程的各种算法,处理控制或状态受约束问题的惩罚函数法,在控制策略的函数空间中利用搜索寻优或梯度寻优技术和牛顿一拉夫森方法等直接求解非线性系统最优控制问题的算法等。其中,针对非线性系统的开环最优控制问题和线性二次型最优控制问题展开的数值算法研究尤多。
最优问题间接求解法在间接法中,我们依靠最小值原理和其它一些必要条件得到一个两点边值问题,然后通过数值求解该问题得到相应的最优轨迹。在几种基于打靶法求解两点边值问题的方法中,多重打靶法是最引人瞩目的。而其它的一些间接数值求解法,比如伴随方程的向前一向后积分法、函数空间梯度法等,在过去的几年中应用并不十分广泛。间接法的主要优点是解的精度高,同时方法保证了求解满足最优条件。然而间接法常常会遇到比较严重的解的收敛性问题。如果在求解中,没有关于系统初始值的一个好的选取,或是没有关于约束和非约束下系统运动轨迹的先验知识,收敛过程可能需要花费很长的计算时间,甚至可能根本无法找到最优解。
最优问题直接求解法在直接法中,连续性的最优控制问题通过参数化的过程被转化为了一个有限维的优化问题。转化后的问题可以通过一些已有的比较成熟的约束优化算法进行数值求解。相对于间接法而言,直接法无需考虑最优化条件,而是直接求解问题本身。直接法不易受到收敛问题的影响,但估计的精度不如间接法。最优的必要条件不是直接满足的,而且伴随量的估计精度有时也会很差。
现在比较常用的几种直接求解方法包括最优参数控制法,有限差分方法,配点法,微分包含方法和伪谱方法。在最优参数控制法中,控制量被单独参数化,同时数值积分方法被用来求解微分方程:在有限差分方法中,原微分方程和边界条件被近似为有限差分方程组:在配点法中,状态量和控制量同时被参数化,在各个节点处,局部分段多项式被用来近似微分方程;微分包含方法只是将状态量参数化,并使用由速端曲线定义的状态变化率;在伪谱方法中,通过全局多项式将状态量和控制量同时参数化,积分方程和微分方程通过求积法被近似。配点法和伪谱方法的一个重要的特点就是伴随量的相合估计。
非线性预测控制算法的研究分层控制方法通过利用递阶算法,将非线性优化转化为协调与线性优化两级计算,或通过非线性反馈实现输入输出线性化后,再用线性预测控制算法,以此获得良好的鲁棒性和跟踪性能。
预测控制原理与先进控制策略相结合如模糊非线性预测控制、支持向量机非线性预测控制、神经网络非线性预测控制等模糊
非线性预测控制
Hadjili M L(1990)把TS模型作为预测模型,给出了一种非线性预测控制方法CRoubos J A(1990)利用TS模型对多输入多输出约束非线性系统建模,然后滚动优化获得控制输入,并应用于多变量液位系统。Abonyi J(2001)将非线性系统转换成线性时变系统,后对模糊模型进行工作点线性化,并得到一种模糊非线性预测控制。王寅(2002)提出了一种新的基于TS模糊模型的非线性预测控制策略。他将T-S模型用于描述被控对象的非线性特性,把模糊预测器中的非线性优化问题进一步转化为线性二次优化问题,并且证明了这种非线性预测控制策略在无模型失配、闭环稳定、稳态值满足幅值约束条件等条件下,闭环系统不存在稳态跟踪误差。Mahfoufa M(2002)利用TS模型对精馏工业过程进行建模,然后利用带前馈的长时域预测控制,其获得的效果明显好于基于线性模型的预测控制。Sarimveis H(2003)利用TS模型建模,然后利用遗传算法优化求取非线性预测控制律,进行仿真,表明其控制性能良好。Liu B(2 003)提出了一种基于离散优化和在线模糊建模的非线性预测控制策略:首先采用线性辨识方法和模糊聚类构建被控对象的TS模糊预测模型;然后利用分支定界法对控制量进行离散寻优,从而实现对被控对象的非线性预测控制。刑宗义(2005)分别用递推最小二乘法和模糊聚类辨识TS模糊模型的前件参数以及后件参数,将预测时域内的一组线性模型序列作为预测模型,进而把约束非线性优化问题转换为线性二次规划问题,最终得出多步线性化的非线性预测控制策略。
支持向量机非线性预测控制
由于支持向量机改变了传统统计模式识别方法,采用结构风险最小化原则,有效解决了有限样本数目等问题,实现了学习能力与推广能力的统一。目前在概率密度函数估计、回归估计、模式识别等都有应用。将支持向量机应用于预测控制目前也得到了重视,并得出大量研究成果。这些研究集中于利用支持向量机对非线性系统进行建模,再利用非线性优化等方法求取控制律。这些研究为支持向量机非线性预测控制分析、综合问题提供一个基本方法与思路。
神经网络非线性预测控制
由于神经网络能够充分逼近复杂的非线性映射关系[[}l,有较强的容错性和鲁棒性,并且它的并行分布处理方法使快速大量运算成为可能,因此将神经网络和非线性预测控制相结合得到了广泛的研究。Donat J S(1991)等提出一种基于二次规划求解的神经网络多步预测控制算法。Mills P M(1994)等利用一种递推式网络建模进行多步预测,用非线性规划求解并得出一种非线性预测控制器。Zhang J(1995)利用递推神经网络提出了一种预测控制算法。李少远(1996)等基于多输出的前馈网络对多步预测的偏差进行修正。Najim K(1997)等利用两个神经网络,基于系统的多步预测目标函数和各种约束条件,在线训练控制网络求取系统控制律。Huang D P(1998)等利用神经网络模型对过程进行多步递推预测,并补偿产生的累加误差,得到一种控制大滞后的非线性系统的预测控制。李翔(1999)等将线性化模型应用于广义预测控制算法,并与非线性前馈增益补偿相结合,得到了一种非线性系统预测控制。刘军(2000)利用多个工作点作阶跃响应给出了一种控制算法。林刘贺平((2001)等提出偏差补偿与模型修正相结合的反馈校正策略,对性能指标中的偏差项进行负指数加权,不仅提高了实时性,更有效地克服了系统中不确定性因素的影响。
非线性预测控制稳定性的研究为了实现预测控制和提高其实时性,预测时域往往是有限的。因此,预测控制的最优性并不代表闭环系统的稳定性。预测控制虽然在工业中获得了广泛应用,但对于具有输入输出约束的、非线性预测控制算法的稳定性研究还不是很多,另外对于不同的对象,如开环不稳定、非最小相位、时滞对象等的稳定性预测控制研究也是热点。有限时域MPC最优性并不能保证闭环系统的稳定性,MPC稳定性问题研究比较困难,主要原因在于很难得到MPC系统的闭环描述。尽管这样,仍有一些令人可喜的研究成果出现。这些研究主要集中在标准MPC问题(无模型失配)的基础上,增加各种条件、约束。1
研究成果主要集中在以下几个方面:
无限时域预测控制保证闭环稳定最直接的方法是将有限预测时域延长至无限,这样,优化问题有解便意味着稳定性。但是这样的约束非线性优化问题很难有解析解,而采用无限时域又使数值优化几乎不可实现,从工程意义上说,无限即足够大时域即使应用于缓慢的过程,也会使预测控制算法缺乏实时性而应用受到限制。Rawlings J B C 1993)针对稳定的和不稳定系统将上述无限时域预测控制进一步发展,提出了一种无限预测时域有限控制时域的滚动时域控制策略,标称系统的闭环稳定性由约束的可行性来保证,而不是通过控制器参数的选取来保证。
终端等式约束预测控制另外一种方法是在开环优化问题中加入一等式约束强制终端状态回到平衡点。Keerthi S S(1985)首先在MPC的数学表达中加入终端等式约束,为以后的MPC稳定性分析提供了理论基础。这种思想也可推广到输入输出模型的预测控制,但获得的仅是输入输出稳定性。Mosca E(1990)通过设定零终端约束证明了基于线性输入/输出模型非线性系统的稳定性。Mayne D Q(1990)基于LyaPunov理论建立了非线性终端等式约束MPC的稳定性理论。Kouvaritakis B(1992)在将控制系统结构做巧妙变换的基础上,通过对参考信号设定等式约束,建立了一个稳定的类广义预钡(控制系统。GencehH(1995)证明了基于不同表达形式的非线性MPC的稳定性。
双模变时域预测控制用数值方法求解非线性优化问题时,终端等式约束只能近似满足。显然,在此近似范围内系统将失去稳定性。为此,又出现了用终端不等式约束代替终端等式约束,而在该邻域之内则用状态反馈控制的方法。这样,只要约束优化问题有解(不一定是最优解),系统就能到达约束域,闭环稳定性可由线性控制器保证。由于不等式约束容易处理,因此优化问题有可行解的范围也较大,这在工程上是不希望的。
Michalska H(1993)在MPC表达中用终端不等式约束(即要求在预测时域内将系统预测行为驱动至一个区域,而不是一个点)代替终端等式约束,提出了系统在平衡点的一个邻域之外由MPC控制,在该邻域之内则由状态反馈控制的双模变时域MPC方法。该方法先假设系统在平衡点附近的近似线性化系统是可镇定的,然后适当选择终端区域,并要求在可变预测时域内保证初始状态空间内的任意点可被驱动至终端区域的边缘。