版权归原作者所有,如有侵权,请联系我们

[科普中国]-航天自适应控制

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏
发展概况

自适应控制系统首先由Draper和Li 在1951年提出,他们介绍了一种能使性能特性不确定的内燃机达到最优性能的控制系统。而自适应这一专门名词是1954年由Tsien在《工程控制论》一书中提出的,其后,1955年Benner和Drenick也提出一个控制系统具有“自适应”的概念。

自适应控制发展的重要标志是在1958午Whitaker“及共同事设计了一种自适应飞机飞行控制系统。该系统利用参考模型期望特性和实际飞行特性之间的偏差去修改控制器的参数,使飞行达到最理想的特性,这种系统称为模型参考自适应控制系统(MRAC系统)。此后,此类系统因英国皇家军事科学院的Parks利用李稚普诺夫(Lyapunov)稳定性理论和法国Landau利用Popov的超稳定性理论等设计方法而得到很大的发展,使之成为—种最基本的自适应控制系统。1974年,为了避免出现输出量的微分信号,美国的Monopli提出了一种增广误差信号法,因而使输入输出信号设汁的自适应控制系统更加可靠地应用与实际工程中。

1960年Li和Wan Der Velde提出的自适应控制系统,他的控制回路中用一个极限环使参数不确定性得到自动补偿,这样的系统成为自振荡的自适应控制系统。

Petrov等人在1963年介绍了一种自适应控制系统,它的控制数如有一个开关函数或继电器产生,并以与参数值有关的系统轨线不变性原理为基础来设计系统,这种系统称为变结构系统。

1960到1961年Bellman和Fel`dbaum分别在美国和苏联应用动态规划原理设计具有随机不确定性的控制系统时,发现作为辨识信号和实际信号的控制输入之间存在对偶特性,因而提出对偶控制。 2

Astrom和Wittenmark对发展另一类重要的自适应控制系统,即自校正调节器(STR)作出了重要的贡献。这种调节器用微处理机很容易实现。这一有创见的工作得到各国学者普遍的重视,并且把发展各种新型的STR和探索新的应用工作推向新的高潮,使得以STR方法设计的自适应控制系统在数量上迢迢领先。在这些发展中以英国的Clarker和Gawthrop在1976年提出的广义最小方差自校正控制器最受重视。它克服了自校正调节器不能用于非最小相位系统等缺点。为了既保持自校正调节器实现简单的优点,又有拜较好的直观性和鲁棒件,l976年英国的Edmund首先提出极点配置自校正控制技术,Astrom,Westerberg和Wittenmark在这方面也做了一些研究。

近年来许多学者在自适应控制系统的稳定性、收敛件和设计方法上又做了大量的有益工作,其中有美国的Narend、Morse和澳大利亚的Goodwin。我国学者陈翰馥在收敛性分析方面也作了很大贡献。

组成

航天自适应系统主要由控制器、被控对象、自适应器及反馈控制回路和自适应回路组成。3

特点自身特点

自适应控制必须首先要在工作过程中不断地在线辨识系统模型(结构及参数)或性能,作为形成及修正最优控制的依据,这就是所谓的自适应能力,它是自适应控制主要特点。就是说它能修正自己的特性以响应过程和扰动的动力学特性变化。

自适应控制特点

与常规反馈控制系统比较,自适应控制系统有三个显著特点:

(1)控制器可调

相对于常规反馈控制器固定的结构和参数,自适应控制系统的控制器在控制的过程中一般是根据一定的自适应规则,不断更改或变动的;

(2)增加了自适应回路

自适应控制系统在常规反馈控制系统基础上增加了自适应回路(或称自适应外环),它的主要作用就是根据系统运行情况,自动调整控制器,以适应被控对象特性的变化;

(3)适用对象

自适应控制适用于被控对象特性未知或扰动特性变化范围很大,同时又要求经常保持高性能指标的一类系统,设计时不需要完全知道被控对象的数学模型。

研究对象特点

自适应控制的研究对象是具有一定程度不确定性的系统,这里所谓的“不确定性”是指描述被控对象及其环境的数学模型不是完全确定的,其中包含一些未知因素和随机因素。

主要特征功能

(1) 过程信息的在线积累 在线积累过程信息的目的i,是为了降低对被控系统的结构和参数值的原有的不确定性。为此,可用系统辨识的方法在线辨识被控系统的结构和参数,直接积累过程信息;也可通过测量能反映过程状态的某些辅助变量,间接积累过程信息。

(2) 可调控制器 可调控制器是指它的结果、参数或信号可以根据性能指标要求和被控系统的当前状态进行自动调整。这种可调性要求是由被控系统的数学模型的不定性决定的,否则就无法对过程实现有效的控制。

(3) 性能指标的控制 性能指标可分为开环控制方式和闭环控制方式两种。 自适应控制主要经历了以下发展历程:

1)模型参考自适应方法

2)自校正控制方法

3)自适应系统的收敛性分析

4)自适应控制的鲁棒性分析及鲁棒自适应控制

自适应控制系统的定义

自适应控制系统尚没有公认的统一定义,一些学者针对比较具体的系统构成方式提出了自适应控制系统的定义。有些定义得到了自适应控制研究领域广大学者的认同。下面介绍两个影响比较广泛的定义。

定义1(Gibson,1962年)一个自适应控制系统应提供被控对象当前状态的连续信息,即辨识对象;将当前系统性能与期望性能或某种最优化指标进行比较,在此基础上做出决策,对控制器进行实时修正,使得系统趋向期望性能或趋于最优化状态。

定义2(Landau,1974年)一个自适应系统,应利用可调系统的各种输入-输出信息来度量某个性能指标,然后将测量得出的性能指标与期望指标进行比较,由自适应机构来修正控制器的参数或产生一个辅助信号,以使系统接近规定的性能指标并保持。

定义1和定义2实际上规定了两类最重要的自适应控制系统:自校正系统和模型参考自适应控制系统。它们的区别在于:定义1所规定的系统需要对系统进行辨识,定义2所规定的系统不需要进行显示的辨识;定义1要求自适应系统按照某种最优指标做出决策,定义2不要求进行显式的决策,而将其隐含在某种已知的(通过参考模型表示)性能指标之中。不过两者的基本思想都是一致的。

系统类型

自从50年代末由美国麻省理工学院提出第一个自适应控制系统以来,先后出现过许多不同形式的自适应控制系统。比较成熟的自适应控制系统有下述几大类。

(1) 可变增益自适应控制系统

这类自适应控制系统结构简单,响应迅速,在许多方面都有应用。调节器按被控过程的参数的变化规律进行设计,也就是当被控对象(或控制过程)的参数因工作状态或环境情况的变化而变化时,通过能够测量到的某些变量,经过计算而按规定的程序来改变调节器的增益,以使系统保持较好的运行性能。另外在某些具有非线性校正装置和变结构系统中,由于调节器本身对系统参数变化不灵敏。采用此种自适应控制方案往往能去的较满意的效果。

(2) 模型参考自适应控制系统

(Model Reference Adaptive System,简称MRAS) 模型参考自适应控制系统由以下几部分组成,即参考模型、被控对象、反馈控制器和调整控制器参数的自适应机构等部分组成设计这类自适应控制系统的核心问题是如何综合自适应调整律,即自适应机构所应遵循的算法。关于自适应调整律的设计目前存在两类不同的方法。其中一种称为局部参数最优化地方法,即利用梯度或其他参数优化的第推算法,求得一组控制器的参数,使得某个预定的性能指标,如J=∫e2(t)dt,达到最小。最早的MIT自适应律就是利用这种方法求得的。这种方法的缺点是不能保证参数调整过程中,系统总是稳定的。自适应律的另一种设计方法是基于稳定性理论的方法,其基本思想是保证控制其参数自适应调节过程是稳定的,然后再尽量是这个过程收敛快一些。由于自适应控制系统是本质非线性的,因此这种自适应律的设计自然要采用适用于非线性系统的稳定理论。Lyapunov稳定性理论和Popov的超稳定性理论都是设计自适应律的有效工具。由于保证系统稳定是任何闭环控制系统的基本要求,所以基于稳定性理论的设计方法引起了更为广泛的关注。

(3) 自校正调节器

(Self-tuning Regulator,简称STR) 这类自适应控制系统的一个特点是具有一个被控对象数学模型的在线辨识环节,具体地说是加入了一个对象参数的递推估计器。由于估计得是对象参数,而调节器参数还要求解一个设计问题方能得出。这种自适应调节器也可设想成为内环和外环来年各个环路组成,内环包括被控对象和一个普通的线性反馈调节器,这个调节器的参数由外环调节,外环则由一个递推参数估计器和一个设计机构组成。这种系统的过程建模和控制的设计都是自动进行,每个采样周期都要更新一次。这种结构的自适应控制器称为自校正调节器,采用这个名称为的是强调调节器能自动校正自己的参数,已得到希望的闭环性能。

(4) 自寻最优控制系统

自寻最优控制系统是一种自动搜索和保持系统输出位于极值状态的控制系统。先前这种系统称为极值控制系统。在这种系统中,受控系统的输入—输出特性至少有一个代表最优运行状态的极值点或其他形式的非线性特性。因此,受控对象是非线性的。如果极值特性在运行过程中不发生变化,则可通过分析和试验找到一个能使系统工作在极值位置的固定控制量,这时由常规控制便可保持最优运行状态。不过,许多工业对象的极值特性在运行中都或多或少会发生漂移,因而无法采用常规控制策赂。对于这类受控系统,采用自寻最优控制策略便可自动保持极值运行状态,使运行状态的梯度为零。此外,自寻最优控制系统还具有易于理解和实现方便等优点,所以它在工业中也有广泛的应用。

(5) 学习控制系统

这是一类按行为科学进行处理的控制系统,它比上述各类自适应控制系统都更加复杂。这种系统的先验信息相当缺乏,为了保证有效的工作,它一般应具有识别、判断、积累经验和学习的功能。由IEEE的“自适应学习和模式识别标准与定义小组委员会”提出的定义如下:

定义(学习系统)

一个系统,如果能对一个过程或其环境的未知特征有关的信息进行学习,并将所得的经验用于未来的估计、分类、决策或控制,以改善系统的性能,则称此系统为学习系统。若一个学习系统以其学得的信息用来控制一个具有未知特征的过程,则称为学习控制系统。根据学习时是否需要接收外部信息,学习过程可分为两类:监督学习和无监督学习。在实际应用中,常将两种学习方式组合使用。首先通过监督学习获取尽可能多的先验信息,然后改为无监督学习,以使收到最好的学习效果。学习系统的形式有模糊自适应控制和专家或智能自适应控制。

研究学习过程的数学方法很多,在学习控制系统中采用的方法有:采用模式分类器的可训练系统、增量学习系统、Bayes估计、随机逼近、自动机模型和语言学方法等。学习系统理论的应用不限于控制工程,在计算机科学、经济和社会等领域中也有应用。

其他自适应控制系统还有混合自适应控制、非线性控制对象自适应控制、模糊自适应控制、神经网络自适应控制等等。4

其他

(6)直接优化目标函数自适应控制

(7)模糊自适应控制

(8).多模型自适应控制

(9)自适应逆控制

常用的控制器

航天器智能自适应控制是航天器智能自主控制的一个重要组成部分。5

控制器是自适应控制系统的重要基础,是实现既定控制策略和保障控制性能的重要环节。以下介绍几种控制器基于线性理论下的控制方法。

一般的线性控制器

一般的控制器可描述为:

PID控制器

PID控制器是一种具有固定结构形式的线性控制器

传递函数:

对消控制器

控制器传递函数为:

非周期控制器

控制的传递函数为:

其他控制器

预报控制器、最小方差控制器、广义预报控制器、状态控制器、状态观测器和卡尔曼滤波器和谨慎控制器等6

应用战术导弹的自校正控制

战术导弹在整个飞行过程中,由于飞行速度和高度的变化,使弹体参数剧烈变化,严重地影响了控制性能。当用经典控制理论设计自动驾驶仪时,一般采用舵回路、阻尼回路和加速度回路来减弱参数变化对系统的影响,但用这种方法不能完全消除参数变化对系统的影响。为了进一步提高导弹的控制性能,有必要采用自适应控制。 自校正控制是自适应控制的一种,它适用于结构已知,但参数未知而恒定或参数缓慢变化的系统。采用自校正控制需要辨识被控系统的参数,并自动校正控制作用,达到预期的控制效果。用自校正控制技术设计自动驾驶仪,能够使被控系统适应参数变化,保持较好的性能。

空间环境模拟器自适应控制

随着航天技术的发展,对航天器零部件的可靠性要求越来越高。为了确保航天器在太空可靠远行,航天器零部件必须在地面进行真空冷热浸试验、真空交变试验等各种空间环境模拟试验。空间环境模拟器就是提供这种条件的一套试验设备。

由于控制过程的复杂性和不能对被控对象进行事先测定以及在控制过程中希望不要人工干预等,用PID调节器,每做一次环境模拟试验,都要调试Kp、Ki、Kd等参数,非常麻烦,且保证不了过渡过程中超调调小于2℃的要求。用一般最佳控制,其状态方程的参数无法确定。用自校正调节器,需要知道滞后步数Ko和一次性测试βo ,而空间环境模拟器无法事先知道Ko,又无法确定βo,因为稳态和初治状态的βo差别很大、自校正调节器不适合于过渡过程控制,特别是本系统对过渡过程超调的要求很高。经多次实验均告失败。自校正控制器也因需要试凑控制权而遇到困难。总之,采用前述的各种方法,都无法衡足实验任务的要求。全系数自适应控制方法的提出,就是为了解决这个问题。

在航海方面

瑞典Astrom等人首先在大型油轮上采用了自适应控制的自动驾驶仪,取代了原有的PID调节器的自动驾驶仪。实验证明,自适应自动驾驶仪能够在变化复杂的随机环境(例如,在海浪、潮流、阵风的干扰以及在不同载荷不同的航速)下,都能使油轮按照预定的航迹稳定而可靠地航行。并取得了良好的经济效益。7

在化工过程方面

在钢铁和冶金工业方面许多工艺过程为非线性、非平稳的复杂过程,原材料成份的改变,催化刑的老化和设备的磨损等,都可能使工艺参数发生复杂而复杂较大的变化,对于这类生产过程,采用常规的PID调节器往往不能很好地适应工艺参数的变化而导致产品的产量和质量不稳定。当采用自适应控制后,由于调节器的参致可以随工艺参数的变化而按某种最优性能自动整定,从而保证了产品的产量和质量不随工艺参数的变化而下降,于是在十多年前即有人提出采用自适应控制来代替常规的PID调节器。目前在板轧机的厚厚度,带钢热轧机的张力,水泥的配料造纸等方面都有不同程度的自适应控制作用,并取得了较好的效果。

在电力系统方面

六十年代即出现对锅护燃烧效率的优比控制,且在热交换器上采用自适应控制技术使控制参数最优地适应发电机和各种负荷条件。到了七十年代自适应控制技术在火力发电站和水力发电站上的应用也获得了成功,并在原子能电站上进行了试验所究。

在电力拖动力面

已经用自适应控制对电动机的转矩、转速、位置和功率进行有效的的控制。目前,有人研究对交流感应电动机的转速采用自适应控制以达到当系统在运行过程中其惯性、负载力矩、时间常数和系统增益在大范同内变化时,系统的动态相应应仍可保持在期望值附近的目的。

在非化工业领域

如社会、经济、管理、生物、医学等等方面包有了一些探索。近来,宏观经济系统的随机最优化问题也引起了人们的注意。 我们完全可以预测,随着控制理论和电子计算机技术的发展,自适应控制的应用将会愈来愈广泛,所获得的效益会愈来愈大。89

存在的问题

①适应控制理论上很难得到一般解,给推广应用带来了困难;其通用性和开放性严重不足

②目前的参数估计方法都是在理想情况下随时间趋于无穷而渐近收敛,而实际工程应用需要在有限时间内快速收敛的参数估计方法;

③有些自适应控制器启动过程或过渡过程的动态性能不满足实际要求;

④控制精度与参数估计的矛盾;

⑤低阶控制器中存在高频未建模;

⑥测量精度直接影响控制器参数,进而影响系统性能。

发展方向总述

①在保证自适应控制精度的前提下,研究快速收敛的参数估计算法;

②研究鲁棒自适应控制方法,解决高频未建模问题;

③解决自适应控制系统启动阶段和过渡过程的参数收敛和动态性能问题;

④自适应控制方案的规范化,即提高其通用性和开放性;

⑤研究组合自适应控制策略,主要有自适应PID控制和智能自适应控制

航天自适应控制未来发展的方向:结合神经网络、模糊控制、知识库和专家系统等人工智能技术10

基于模糊控制理论的研究

针对对象模型不准确、非线性、慢时变性和时滞性等情况,采用了基于模糊控制理论的自适应控制策略,使自适应控制有了更广的适用范围,更容易实现。把模型参考自适应控制与模糊控制相结合的控制策略应用于在环境干扰下、系统本身动态变化及模型不准确的对象,仿真表明,与模型参考自适应控制相比,这一控制方法具有算法简单、实时性及鲁棒性强、自适应过程快的特点。介绍了基于模糊控制的多模型参考自适应控制,仿真表明该方法跟踪迅速。采用基于模糊模型的自校正控制,仿真和实验表明此方法适用于非线性、慢时变和时滞性系统,具有鲁棒性强的特点。阐述了自调整模糊控制,即将自适应控制、Smith预估器和模糊控制结合起来,对模糊量化因子及系统增益按误差及其变化率进行自调整,该方法已通过仿真与现场的考验。11

基于神经元网络的研究

对于复杂非线性系统,把神经元网络应用于自适应控制。把基于神经元网络的自适应控制方法用于稳定的、有某些未知非线性函数和可反馈线性化的对象,仿真实验表明,此方法有 一定的实用性,但由于这一方法仅具有局部收敛性,因此要求神经网络初始权系数充分接近正确权系数。设计了一种自适应神经网络的智能控制器,该控制器由两个自适应神经网络组成,一个用于评优,另一个用于学习并产生控制信号,仿真表明它能适用于一定复杂程度的非线性对象的控制。将神经网络作为补偿器应用于鲁棒自校正控制器,可使基于线性低阶模型的自校正算法适用于某些复杂的非线性系统。12

基于多学科交叉的研究

尽管基于模糊控制或神经网络的自适应控制可扩大自适应控制的适用范围,或在某方面能改善控制性能,但是仍有缺点,因此科学研究人员进行了基 于多学科交叉的自适应控制理论研究。

如何设计单个神经元学习单个变量的自适应模糊控制器,以改善控制性能,尽管这种设计方法在理论上能一定程度地改善基于神经网络的自适应控制性能,但是实验结果并不十分理想。把单层神经网络应用于自适应模糊控制器,并提出由单层神经网络学习多变量模糊控制规则中的未知参数,实现多变量模糊推理过程,该方法能解决多变量模糊控制规则难以获取及实时自适应控制难以实现的问题,但速度仍不理想。又把神经元学习的赫布(Hebb)规则与梯度算法相结合,构成梯度—赫布学习法,并应用于自适应模糊控制器中,这种方法可提高学习速度,减少实时控制超调量。利用模糊逻辑和BP算法相结合来设计模型参考模糊神经网络控制器,这种控制器可适用于缺乏准确数学模型的对象。

自适应控制器的产品

由于上述理论在设计方法上还不够完善,且科学技术与应用环节有脱节现象,致使目前用于电力系统及其它工业过程控制的自适应控制器产品并不多。据不完全统计,目前的产品主要有:美国Leeds和Northrup的自校正PID控制器,瑞士AseaBrownBoveri公司的自适应调节器,美国Foxboro公司的自整定的PID调节器EXACT,英国TurbullControl公司的自适应PID控制器,瑞典FirstControlSystems公司的自适应调节器,日本横河公司的自整定PID调节器YS—80E,美国FisherControl公司的DPR—9000自动整定PID调节器。