LQR外文文献翻译x
更新时间:2022-09-28 13:41:52 阅读: 评论:0
线性二次型调节最优控制问题
目录
反馈结构2
优化调节2
状态反馈线性二次型最优调节4
稳定性和鲁棒性4
2.5应用LQR的回路控制7
MATLAB仿真9
展望10
练****11
反馈结构
图1展示了线性二次型问题的反馈结构。
图2-1线性二次型调节的反馈结构。标注了负反馈和参考信号的缺失。在这个结构中,状态空间模型的形式有两个明显地输出。
x=Ax+Bu
y=Cx(2.1)
z=Gx+Hu
1、测量输出yeRk的控制信号和有效的可被测量的控制系统相类似。如果控制
t
器转移矩阵是C(s),我们可以得到如下的方程y(s)=-C(s)U(s),式中Y⑸和U(s)分别指的是过程输入u(t)和测量输出y(t)的拉氏变换。
2、控制输出z(t)eR与一个期望在尽可能短的时间量内使信号尽可能小的信号相一致。有时,z(t)=y(t),那意味着我们的控制目标是使整个的测量输出非常小。然而,当输出y(t)是一个矢量,经常需要使测量y1(t)输出很小。在这种情况下,我们选择z(t)=y1(t).
Py(t”
在一些情况下,选择z(t)=,那就意味着我们想要测量输出y1(t)和它的导
_y(t)_
数y(t)这两个量非常的小。许多其他的选择夜可能实现这一特征。z应该被做为一个设计参数来看待。在第2.5节我们将要学****在闭环控制系统下选择参数对系统的影响。
优化调节
线性二次型优化问题被定义为以下的内容:问题1(线性二次型优化问题)
控制器的转移矩阵c(s)使以下的特征值尽可能的小。
2.2)
Jlqr=f||z(t)||+p|u(t)Fdt
0
82
fz(t)dt
与控制输出的能量和项
0
tfu(t)
0
这项
在这里p是一个正的常量
具有相一致的控制信号能量。在线性二次型最优调节中主要是寻找一个具有两个最小能量的控制器。然而,增长的控制输出能量要求一个大的控制信号和一个小
的控制信号,它们将会引导一个大的控制输出。常数p的作用是为了在这些相冲突的目标之间建立一个权衡比:
1、当我们选择的p非常大的时候,最有效的途径是用小的控制去增长J,以
LQR一个大的控制输出作为结果。
2、当我们选择p非常小的时候,最有效的方法是增长J得到一个非常小的控
LQR制输出,即使这是一个以大的控制输出作为代价去实现的控制系统。经常,线性二次型最优问题是被定义的更笼统,它与找到控制器的转移矩阵C(s)有关系,它的最小值如下:
J二fz(t)Qz(t)+pu'(t)Ru(t)dt
LQR
0
这里Q是一个lxl维的系统正定矩阵,R是一个mxm维的正定矩阵,p是一个正
常数。
布莱森定理对于矩阵Q和R的选择在(2.3)被布莱定理给出:
选择Q和R的对角矩阵用到以下公式:
Qii=
1
maximumacceptablevalueofz2
Rjj=
1
maximumacceptablevalueofz2
ie£,2,.../}
je£,2...l}
和以下的特征量相匹配:
J二J(Qiiz(t)2+pRjju(t)2)dt
LQRij
01=1j=1
在布莱森定理的基本理论中,出现在J这项变量的最大值,其中每项的最
LQR
小有效值是1。当用在u和z的不同元器件地单元之间使这些数值之间的值互相不
同是特别重要的。
尽管布莱森定理有时给出一个好的结果,经常它只是开始对于一个实验---出错---实验反复迭代的设计程序,目的是得到期望性能指标的闭环系统。在第2.5节,我们将要讨论选择作用在物体上的力在LQR矩阵中的方法。
状态反馈线性二次型最优调节
在状态反馈描述的LQR问题中的图(2.2),我们假定整个的状态x能被测量,即使它对控制是有效的,我们采用线性二次型的状态反馈最优问题的解决方法。
图2.2带有状态反馈的线性二次型最优控制器
优化状态反馈LQR控制器对于准则(2.3)是一个简单矩阵增益的形式u=一Kx(2.4)
这里K是mxn维的矩阵在以下被给出
K二(H'QH+pR)-i(BP+H'QG)
P是唯一的正定解法对于下等式:
A'P+PA+G'QG-(PB+GQH)(H'QH+R)-i(BP+H'QG)二0这种算法被称为黎卡提算法。
稳定性和鲁棒性
状态反馈控制律(2.4),结果在以下形式的闭环系统中
X二(A-BK)x
LQR控制器设计的一个至关重要的性能是这个闭环系统是渐进稳定的,只要符合以下的两种情况:
1、系统(1)是可控的。
2、系统(1)是能观的当我们忽视y和把z作为唯一输出。
或许更重要的是一个事实,LQR控制器是对过程不确定的期望值具有内在的
鲁棒控制。为了理解为什么,考虑开环转移矩阵从过程输入u对控制器的输出U(图2.3)的影响。
图2.3状态反馈开环增益
状态空间模型从u到u在下式中被给出
x=Ax+Buu=-Kx
它是与以下的开环负反馈mxm维的转移矩阵相一致的
G(s)二K(sI-S)-iB
0
我们把我们的注意力集中在信号输入过程(m=1),GO(s)是一个标量的传函,以下给出:
卡尔门不等式当H'G二0,G(J®)的尼克尔斯图显示不进入一个以原
0
点为圆心,圆半径为1的圆的'-1'这点
1+G(Jw)>1VweR
0
卡尔门不等式在图(2.4)表述了许多重要的涵义,那是接下来讨论。
图2.4线性二次型最优控制器的尼克尔斯图
正的增幅如果过程增益是被常数K>1乘,即使包围的数量不改变,它的尼克尔斯图简单的径向拓展。这和正的增益量+8是相关的。
负的增幅如果过程增益是被常数5<k<1乘,它的尼克尔斯图凭借9的角度旋
转,但是它的包围数量仍然不改变。这个和负增益的幅度20log(0.5)=-6dB是
10
一致的。
K
△m
T=Ar—Hit
△<為(皿}.
图2.5带有乘法不确定性的反馈结构单元
相位的幅值如果过程相位以OwC60,60)度增长,它的尼克尔斯图在9的范围内旋转,但是包围数量仍然不改变,这个是向量的幅值土60度相关的。
乘性不确定性卡尔门不等式给出
(2.5)
G(j®
0
1+G(妙)
0
自此,我们知道闭环系统在图2.5保持稳定对于每个不确定乘性模块Am(jw)
带有相对小的范数比l(w),只要,
m
G(jw)
0
1+G(jw)
0
1
(2.6)l(w)
m
1
我们总结一个LQR控制器带有期望的不确定乘法对于比丄更小的幅值可以
2
确定它的鲁棒稳定性,然后我们得到
G0(㈣<2〈丄
1+G0(jw)l(w)
m然而,更大的不确定加法或许是被允许的:
例如:当G0(jw)))1,(2.6)中l(w)趋近1;当G(jw)〈〈l,(2.6)中l(w)趋近m0m
>1
G0(jw)
注意:卡尔门不等式只是有当H'G=0时是有效的.当不是这种情况的时候,LQR控制器的鲁棒控制很显著。这可以限制相同范围的控制输出,我们设定为z。
例如:考虑到过程X二Ax+Bu和设定我们想调节一个特别的输出y=Cx.
11
选择z=y=Cx
11
得出G=C和H二0,H'G二0,这些在卡尔门不等式中被提到的。
1
选择
得到
y⑴
z=
y(1)
C1(x)
C(X)
C1
0
1
—
x+
C(Ax+Bu)
1
CA
1
CB
1
「C一
「0_
G—
1
CA
1
H—
CB
1
1
得到
H'G=B'C'CA,
这个可能不等于0。11
2.5应用LQR的回路控制
尽管布莱森原理有时能得出一些好的结果,它或许不能够满足紧凑的控制特征。我们将要看到下面的一些原理实际上允许我们应用LQR控制一个回路。我们把注意力集中在对一个信号输入(m=1)和R=1,Q=I,、和以下相一致
Jz(t)2”+pu(t)2dt
,我们得出
0
低频的开环增益对于频率范围|G0(j®)|〉〉1(典型的低频)
||pz(j®)||
vH'H+p
这里
P(s)二G(sI-A)-1B+H
z
是从控制信号u到控制输出z传函形式。为了理解公式的涵义,它是有必要去考虑相同的典型项:
1、当z=y,带有y=Cx标量,我们得到
111
G0(j®)\〜驚片
0'H+p
其中
P(s)二C(si—A)-1B
11
是从控制输入u到y1的控制输出传函。在此情况下,
开环控制系统向量值增益的形状G(j®)是被从控制输入u到控制输出y的
01
传函所定义的;
参数p可以上下移动波德图。
当z=yYy',我们看到下式
11
G0(j®沁
1+jY®|p(j®||
XH'H+p
2.7)
在此情况下,低频开环增益从u到y模拟过程传函,带有个附加的0在丄和这样
Y
个标度
1
<H'H+p
里.
然而,(a)p可以移动波德图向量值的上或者下
(b)大量的值Y引导一个低频的0和大致的结果在一个最大的相位裕度里,稍
小点的过冲量在阶跃响应中。然而,这个经常被在代价低的响应情况下完成。高频开环增益因为®〉〉1,我们得到
c
G0(je)卜—=,
0叭・p
对于常数C。我们总结如下:
1、LQR控制器总需要一个高频量值为-20dB/decade.
2、交叉频率近似被给的公式如下:
cc
沁103沁,
①*Pcross.p
cross
这展示了交叉频率是近似丄,因为值P在更快的阶跃响应。
Jp
注意:-20dB/decade的幅值增长,它的主要不足是线性二次型最优控制器的状态反馈因为对于一个高频的,上界在开环增益上的,需要去避免扰动达到期望状态,
或许不是充分清楚地。在3.6节我们将对它进行详述。
例5图2.6展示了开环增益的波德坐标G(s)=K(si-A)-1B许多LQR的控制器0
在例1给出得到航空动态旋转。
控制器输出时被选择z二0Y0',与下式相关
控制器能得到结果关于R=1,Q=I,许多值赋予pY,图(6)a展示了开环系统
2*2
增益值Y.
图2.6(a)展示了许多开环增益的p值,图2.6(b)展示了许多开环增益的y值。
图2.7展示了开环增益尼克尔斯图开环增益G(s)二K(sI-A)-1B控制器控制输出
0
z的不同选择。在图(7)a中z=00,与下式相关
「100「
「0_
G=
H=
010
0
在此情况下,H'G和卡尔门不等式作为能在尼克尔斯图上看到的项
在图2.7(b),控制输出被这样选择为z=0』,要求和下式相一致
「100-
「0_
G=
H=
00-50
50
(a)对于含有很多p的开环增益,这个参
数允许我们上下移动波德图的幅值。
(b)对于含有很多y的开环增益,这个参
数结果的值在更大的幅值范围内。
图2.6在例5中出现的线性二次型最优控制器的开环增益的波德图。如期望的,因为低频的开环增益幅值匹配了从u到0的传函,并且在高频增益处幅值落到-20dB/decade。
这种情况下,我们得到H'G=b0-2500〕和未提到的卡尔门不等式。我们
从尼克尔斯图能看见幅值和增幅是非常小,并且带有一个期望的非典型动态时的
鲁棒性,它能在过程里能引导-1那个点的环绕的小扰动。
2.6MATLAB仿真
在MATLAB仿真中,命令[K,S,E]=lqr(A,B,QQ,RR,NN)可以为过程估算出最优状态反馈LQR控制器X=Ax+Bu
有一个准则