13. fejezet - Hinf. szabályozók tervezése

Tartalom
13.1. Véges horizontú FI feladat
13.2. Végtelen horizontú FI feladat
13.3. A OE feladat
13.4. Egyszerűsített kimenet visszacsatolásos feladat

Bár az egyszerüsített kimenet-visszacsatolásos optimális szabályozó kiszámítása jórészt az optimális 2 szabályozó levezetésénél alkalmazott lépéseket követi, vannak lényegi tulajdonságok, amik megkülönböztetik a két esetet.

Egyrészt nyilvánvaló, hogy egy stabil lineáris P rendszerre es egy adott γ>0 esetén P<γ akkor es csak akkor, ha létezik ε>0 amellyel

z22γ2w22εw22

(594)

minden w2 jelre. Ezt a feltételt átírhatjuk

εw22>0zTzdtγ20wTwdt=limT0T(zTzγ2wTw)dt,

(595)

alakba, ami azt sugallja, hogy lehetséges egy véges horizontú szabályozót definiálni, ami határesetben, ahogy a T tart végtelenhez, megközelíti a szabályozót. Így, mint azt a 2 esetben tettük, először célszerű a véges-horizontú FI feladatot megvizsgálni, ahol a költségfüggvény

J(u,w,T,Ψ)=0T(zTzγ2wTw)dt+xT(T)Ψx(T)

(596)

alakú, ahol Ψ>0 es w2.

Kimutatható, hogy ennek a feladatnak a megoldása egy KT szabályozó, ami egy olyan u*,T irányító bemenetet generál, amelyre létezik ε>0 úgy, hogy

J(u*,T,w,T,Ψ)<εw2,[0,T]2

(597)

fennáljon minden w2,[0,T] esetén, vagyis (P,KT)[0,T]γ. Határesetben azt várjuk, hogy

(P,KT)[0,T]P,K)<γ.

(598)

Azonban az optimális 2 feladattal szemben az optimális irányítástervezésnek nem minig van megoldása, ha γ túl kicsi, a zavaró γ2wTw tag jelenléte miatt a költségfüggvényben. Tekinthetjük úgy, hogy az optimalizálási feladat megoldása egy olyan játszma kimenetele, amelyben a szabályozó célja egy, a költséget minimalizáló u irányító bemenet tervezése, míg a környezet egy olyan w zavarással hat ami maximalizálja ezt a költséget.

Tehát a J(u,w,T,Ψ) költség függvénye u-nak és w-nek. Ha a zavarási stratégia adott akkor J(u,w,T,Ψ) egy konvex függvény aminek globális minimuma az u*,T irányításra vétetik fel, amit az optimális K*,T szabályozó general. Ha az irányítás fix és a w környezeti hatás változik akkor a J(u,w,T,Ψ) egy konkáv funkcionál, aminek aminek globális maximuma w* esetén adódik.

A két játékos optimális stratégiája a nyeregpontban van, vagyis a költségfüggvény inflexiós pontjában, ahol a szabályozó a lehető legjobb irányítást alkalmazza a legrosszabb szavarás feltételezése mellett.

Legyen (u*,w*) ez a nyeregponti stratégia, amit az alábbi feltétel jellemez:

J(u*,w,T,Ψ)J(u*,w*,T,Ψ)J(u,w*,T,Ψ).

(599)

Tehát a optimális eljárás a legrosszabb esetre készül fel, ami egy konkrét zavarás esetén nem feltétlenül adja az arra a zavarásra optimális választ.

13.1. Véges horizontú FI feladat

A véges horizontú FI feladat a

J(u,w,T,Ψ)=0T(zTzγ2wTw)dt+xT(T)Ψx(T)

(600)

költségfüggvény (u*,T,w*,T) nyeregponti stratégiáját keresi, ahol a rendszer az alábbi formában adott:

PFI(s)=[AB1B2C10D12I000I0].

(601)

A továbbiakban feltételezzük, hogy létezik ilyen (u*,T,w*,T) nyeregpont.

Elöször rögzítsük w=w*,T-t és tekintsük u=u*,T+ηu˜ jelet, ahol η egy kis állandó. Jelölje x* a nyeregponti trajektóriát, vagyis

x˙*=Ax*+B1w*,T+B2u*,T,    x*(0)=0,

(602)

és legyen x az u által meghatározott trajektória, vagyis

x˙=Ax+B1w*,T+B2u,    x(0)=0.

(603)

Következik, hogy x=x*+ηx˜ ahol x˜ kielégíti a

ddtx˜=Ax˜+B2u˜,    x˜(0)=0

(604)

egyenletet, azaz x˜(t)=0TΦ(t,τ)B2u˜dτ ahol Φ(t,τ) az A-nak megfelelő alapmátrix.

Ekkor a perturbált költségfüggvény alakja

J(u,w*,T,T,Ψ)=0T(x*C1TC1x*+u*,TTu*,Tγ2w*,TTw*,T)dt+

+(x*)T(T)Ψx*(T)+2η{0T(x˜TC1TC1x*+u˜Tu*,T)dt+x˜T(T)Ψx*(T)}+

+η2{0T(x˜TC1TC1x˜+u˜Tu˜)dt+x˜T(T)Ψx˜(T)}.

(605)

Mivel az első tag J(u*,T,w*,T,T,Ψ) és

J(u,w*,T,T,Ψ)J(u*,T,w*,T,T,Ψ)

(606)

következik, hogy

0J(u,w*,T,T,Ψ)J(u*,T,w*,T,T,Ψ)=2η{0T(x˜TC1TC1x*+u˜Tu*,T)dt+

+x˜T(T)Ψx*(T)}+η2{0T(x˜TC1TC1x˜+u˜Tu˜)dt+x˜T(T)Ψx˜(T)}.

(607)

Elég kis |η| esetén a jobboldal negatív. Mivel J(u,w*,T,T,Ψ)0 adódik, hogy

0T{x˜TC1TC1x*+u˜Tu*,T)dt+x˜T(T)Ψx*(T)=0.

(608)

Bevezetve az alábbi társváltozót

λ(t)=tTΦT(τ,t)C1TC1x*dτ+ΦT(T,t)Ψx*(T),

(609)

minden u˜-ra, a következő feltétel adódik:

0Tu˜(B2Tλ(t)+u*,T(t))dt=0,

(610)

azaz a nyeregponti optimális irényítás

u*,T=B2Tλ(t),

(611)

ahol tT.

A fenti gondolatmenetet megismételhetjük, hogy a legrosszabb w*,T zavarás egy jellemzését megkapjuk: rögzítsük u=u*,T-t és w=w*,T+ηw˜ ahol 0tT. A perturbáló jel egy tetszőleges 2[0,T]-beli függvény és η egy tetszőleges állandó.

Eza perturbáció egy x=x*+ηx˜ trajektórát generál, ahol 0tT és x˜ kielégíti az

ddtx˜=Ax˜+B1w˜,    x˜(0)=0,

(612)

egyenletet, azaz x˜(t)=0tΦ(t,τ)B1w˜dτ.

Ezt behelyettesítve J(u,w,T,Ψ)-be kapjuk, hogy

0T{x˜TC1TC1x*γ2w˜Tw*,T)dt+x˜T(T)Ψx*(T)=0,

(613)

vagyis minden w˜ esetén

0Tw˜T(B1Tλγ2w*,T)dt=0.

(614)

A társváltozó segítségével a legrosszabb zavarás kifejezhető mint

w*,T(t)=1γ2B1Tλ(t),

(615)

ahol 0tT.

Mint ahogyan az optimális LQ irányításnál már láttuk, az optimális állapot és társváltozó kielégíti az alábbi peremérték feladatot:

ddt(x*λ)=(A(B2B2Tγ2B1B1T)C1TC1AT)(x*λ),

(616)

(x*(0)λ(T))=(0Ψx*(T)).

(617)

A

H=(A(B2B2Tγ2B1B1T)C1TC1AT)

(618)

mátrix a rendszerhez rendelt Hamiltonian mátrix. A társváltozó kifejezhető mint

λ(t)=X(t)x*(t)

(619)

ahol X(t) egy mátrixértékű függvény. Ekkor az optimális irányítás és a legrosszabb zavarás alakja

u*,T(t)=B2X(t)x*(t),    w*,T(t)=γ2B1X(t)x*(t).

(620)

Várakozásunknak megfelelően X(t) megoldása egy mátrix Riccati differenciál egyenletnek:

X˙=XA+ATX+X(B2B2Tγ2B1B1T)X+C1TC1,    X(T)=Ψ.

(621)

Ennek az X-nek a segítségével a költségfüggvény alakja

J(u,w,T,M)=0T(zTzγ2wTw)+ddtxTXx)dt=

=0T(xT(C1TC1+ATX+XA+X˙)x+uTuγ2wTw+

+(wTB1+uTB2T)Xx+xTX(B1w+B2u))dt=

=0T[xTX(B2B2Tγ2B1B1T)Xx+uTuγ2wTw+

+(wTB1T+uTB2T)Xx+xTX(B1w+B2u)]dt=

=0T[(xTXB2B2TXx+uTB2TXx+xTXB2u+uTu)

γ2(wTwwTB1TXxxTXB2w+γ4xTXB1B1TXx)]dt=

=0T(u+B2TXx)T(u+B2Xx)dt

γ20T(wγ2B1TXx)T(wγ2B1TXx)dt=

=uu*,T2,[0,T]2γ2ww*,T2,[0,T]2

(622)

formában írható.

Bevezetve azt az L rendszert ami w-t a ww*,T-be viszi, kapjuk, hogy

L(s)=[AB2B2TXB1γ2B1TXI].

(623)

Ezzel következik, hogy

J(u*,T,w,T,Ψ)=γ2ww*,T2,[0,T]2=

γ2Lw2,[0,T]2εw2,[0,T]2

(624)

ahol ε=γ2/L[0,T]2. Így az optimális K* szabályozó kielégíti a

J(u*,T,w,T,Ψ)<εw220

(625)

feltételt minden w2[0,T] esetén, azaz bisztosítja, hogy (P,K*)[0,T]γ.

13.2. Végtelen horizontú FI feladat

A 2 esetben már látott módon a végtelen horizontú optimális irányítás alakja

u*,T(t)=B2TXx(t)

(626)

ahol X a

XA+ATXX(B2B2Tγ2B1B1T)X+C1TC1=0

(627)

algebrai Riccati egyenlet pozitív definit megoldása amire AB2B2TX aszimptotikusan stabilis.

A 2 és eset közötti különbség az algebrai Riccati egyenlet alakjában nyilvánul meg. Míg a 2 Riccati egyenletnek létezik stabilizáló megoldása, ha

(a) (A,B2) stablizálható,

(b) (C1,A) párnak nincsenek nem megfigyelhető módusai a képzetes tengelyen,

ez nem elégséges a Riccati egyenletre. A továbbiakban feltesszük, hogy ezek a szükséges feltételek fennállnak és a

ddtX(t,T)=XA+ATXX(B2B2Tγ2B1B1T)X+C1TC1,    X(T,T)=X2

(628)

Riccati differenciál egyenletnek vannak X(t,T,X2) megoldásai minden T-re, ahol X2>0 a 2 alakú

X2A+ATX2X2B2B2TX2T+C1TC1=0

(629)

Riccati egyenlet megoldása.

Feltehetjük, hogy a véges horizontú feladatok költségfüggvényei

J(u,w,T,X2)=0T(zTzγ2wTw)dt+xT(T)X2x(T),

(630)

alakban írhatók, azaz X2 a terminális kültség.

Legyen x0 egy tetszőleges nemzérus kezdeti érték és w tetszőleges 2-beli zavarás.Hogy kimutassuk X(t,T,X2) egyenletes korlátosságát T-ben, meg kell mutatnunk, hogylétezik β>0 amire x0TX(t,T,X2)x0<βx02 minden T>0 esetén.

A linearitást felhasználva z=zw+zx0 ahol zx0 és zw jelöli az x0 és w hatását z-re.Mivel a szabályozó stabilizálja a rendszert, létezik α>0 amire zx02αx0.Mivel a szabályozó garantálja, hogy (P,K)<γ, létezik ε>0 úgy, hogy z22γ2w22εw22. Következik, hogy

z22γw22zw22γ2w22+zx022+2zx02zw2

εw22+α2x02+2γαx0w2=

=(α2+γ2α2ε)x02ε(w2γαεx0)2

(631)

azaz,

z22γw22(α2+γ2α2ε)x02=βx02

(632)

minden x0 és minden w2 esetén.

Mivel

J(u,w,T,X2)=0T(zTzγ2wTw)dt+xT(T)X2x(T)=

=0T(zTzγ2wTw+ddt(xTXx))dt+x0TX(0,T,X2)x0=

=uu*,T2,[0,T]2γ2wwT*2,[0,T]2+x0TX(0,T,X2)x0,

(633)

ahol

u*,T(t)=B2X(t,T,X2)x(t),    w*,T(t)=γ2B1TX(t,T,X2)x(t)

(634)

minden tT-re, következik, hogy

J(u,w*,T,X2)=x0TX(0,T,X2)x0+uu*,T2,[0,T]2x0TX(0,T,X2)x0.

(635)

Mésrészt az optimális 2 szabályozót használva t>T esetén

TzTzdtminKTz˜Tz˜dt=xT(T)X2x(T).

(636)

Ezért

z22γ2w22=0(zTzγ2wTw)dt=0T(zTzγ2wTw)dt+TzTzdt

(637)

felhasználásával következik, hogy

z22γ2w220T(zTzγ2wTw)dt+xT(T)X2x(T)=J(u,w,T,X2)

(638)

minden w2 jelre.

Ezen egyenlőtlenségek felhasználásával adódik, hogy

x0TX(0,T,X2)x0J(u,w*,T,T,X2))z2γ2w*,T22βx02

(639)

minden T-re. Tehát X(0,T,X2) egyenletesen korlátos T-ben.

Az időinvariancia miatt X(t,T,X2)=X(0,Tt,X2), így létezik β, hogy

x0TX(t,T,X2)x0βx02

(640)

amiből következik, hogy a differenciál Riccati egyenlet megoldásai egyenletesen korlátosak T-ben.

A monotonitás kimutatásához tekintsük a Riccati egyenlet deriváltját

d2dt2X=X˙(A(B2B2Tγ2B1B1T)X)+(A(B2B2Tγ2B1B1T)X)TX˙,

(641)

ami egy lineáris egyenlet, tehát

X˙(t,T,X2)=Φ(t,T)X˙(T,T,X2)ΦT(t,T)

(642)

aholΦ az (A(B2B2Tγ2B1B1T)X)T alapmátrixa. A Riccati egyenletből következik, hogy

ddtX(T,T,X2)=X2A+ATX2X2(B2B2Tγ2B1B1T)X2+C1TC1=

=γ2X2B1B1TX2,

(643)

vagyis, X(t,T,X2) egy minoton nem növekvő függvény t-ben.

Ahogyan a 2 esetben is, az időinvarianciát felhasználva X(t,T,X2)=X(τ,Tt+τ,X2), vagyis X(t,T,X2) egy monoton nem csökkenő függvénye T-nek.

Ugyan így, X(t,T,X2)=X(0,Tt,X2), tehát határesetben

limTX(t,T,X2)=limTtX(0,Tt,X2)=X,

(644)

ahol X egy konstans mátrix, amire X0, mivel X(t,T,X2)0 minden tT esetén. Mivel a Riccati egyenlet megoldásai folytonosan függnek a peremfeltételektől

X=limTX(t,T,X2)==limTX(t,T1,X(T1,T,X2))=

X(t,T1,limTX(T1,T,X2))=X(t,T1,X).

(645)

Ezért X kielégíti a Riccati differencál egyenletet, ahol a peremfeltétel X(T1,T1)=X, azaz

XA+ATXX(B2B2Tγ2B1B1T)X+C1TC1=0.

(646)

Kimutattuk tehát, hogy az algebrai Riccati egyenlet megoldásának létezése szükséges a feltétel a FI szabnályozó létezéséhez, feltéve, hogy (A,B2) stabilizálható, (C1,A) párnak nincsenek nem-megfigyelhető módusai a képzetes tengelyen és a Riccati differenciál egyenleteknek van megoldása minden T-re. Kimutatható, hogy ez utóbbi feltátel nem szükséges és a algebrai Riccati egyenlet stabilizáló megoldásának létezése ekvivalens azzal, hogy a H Hamiltonian mátrixnak nincsenek sajátértékei a képzetes tengelyen.

A továbbiakban az eljárás követi a 2 esetben már látottakat: alkalmazva az u=B2TXx visszacsatolást, a zárt kör

x˙=(AB2B2TX)x+B1w,

(647)

z=(C1D12B1TX)x.

(648)

Ki kell mutatni, hogy ez a rendszer stabil. A Riccati egyenletből kapjuk, hogy

0=XA+ATXX(B2B2Tγ2B1B1T)X+C1TC1+X(B2B2TB2B2T)X=

=X(AB2B2TX)+(AB2B2TX)TX+γ2XB1B1TX+XB2B2TX+C1TC1.

(649)

Mivel X0, a AB2B2TX minden instabik módusa nem megfigyelhető (γ1XB1XB2C1T)T-re. Legyen (λ,x) az AB2B2TX egy instabil módusa,

(AB2B2TX)x=λx,XB1=0,    XB2=0,    C1x=0.

(650)

Következik, hogy

(A(B2B2Tγ2B1B1T)X)x=(A(B2B2TX)x=λx,

(651)

azaz, (λ,x) az A(B2B2Tγ2B1B1T)X-nak is egy módusa. De ez a mátrix stabilis, így AB2B2TX összes módusa stabil és megfigyelhető.

Mivel AB2B2TX asszimptotikusan stabilis, a KYP lemmából következik, hogy lemma that (P,K)<γ if and only létezik P ami kielégíti az alábbi algebrai Riccati egyenletet:

X(AB2B2TP)+(AB2B2TP)TX+γ2XB1B1TX+PB2B2TP+C1TC1=0

(652)

ahol (AB2B2TP)γ2B1B1TX asszimptotikusan stabilis.Nyílvánvaló, hogy X=P egy megoldás, így (P,K)<γ.

13.3. A H OE feladat

Az FI feladat megoldását felhasználhatjuk az OE szűrési feladat megoldásának előállítására. A 2 esetben felírt Kalman szűrővel analó módon képzelhetjük el a szűrőt: míg a Kalman szűrő az állapotbcslést négyzetes középben minimalizállja a Gauss eloszlású bemenetekre nézve, a szűrő a becslési hiba erősítését egy γ szintnél kisebbre garantálja minden lehetséges korlátos energiájú bemenet esetén.

A 2 feladatnál már látott módon az OE rendszer alakja

POE(s)=[AB1B2C10IC2D210],

(653)

aholAB2C1 stabilis. Ekkor (POE,KOE)<γ ha

KOE(s)=[A+LC1B2C1LC10]

(654)

ahol L=YC2T és Y kielégíti az alábbi algebraic Riccati egyenletet

AY+YATY(C2TC2γ2C1TC1)Y+B1B1T=0.

(655)

13.4. Egyszerűsített kimenet visszacsatolásos feladat

Lemma 12.1 Egy P rendszer esetén, ahol z=C1x+D12u

(P,K)<γ

(656)

akkor és csak akkor, ha (uu*,T)=U(ww*,T) ahol U<γ.

Bizonyítás 12.1 Az u*,T=B2TXx irányítással, ahol X kielégíti a FI feladat algebrai Riccati egyenletét, Twz<γ , ahol Twz a w -ről z -re vett átviteli függvény.

A véges horizontú feladatra

Twz[0,T]<γJ(K,w,T,Ψ)<εw2,[0,T]2

(657)

és

J(K,w,T,Ψ)=uu*,T2,[0,T]2γ2ww*,T2,[0,T]2.

(658)

Legyen L a w jelet ww*,T-re képző rendszer:

L(s)=[AB2B2TXB1γ2B1TXI].

(659)

Ha U[0,T]<γ, akkor létezik ε, hogy

J(K,w,T,Ψ)=U(ww*,T)2,[0,T]2γ2ww*,T2,[0,T]2

(U[0,T]2γ2)ww*,T2,[0,T]2=

=(U[0,T]2γ2)Lw2,[0,T]2εw2,[0,T]2,

(660)

azaz, (P,K)[0,T]<γ.

Fordítva, ha (P,K)[0,T]<γ, akkor

U(ww*,T)2,[0,T]2γ2ww*,T2,[0,T]2εw2,[0,T]2

εL1(ww*,T)2,[0,T]2εL[0,T]2ww*,T2,[0,T]2<0,

(661)

amiből következik, hogy U[0,T]<γ.

Ebből az eredményből kiindulva írjul át az eredeti P rendszert a 2 esethez hasonlóan két rendszer, P^ és Ptmp, Redheffer szorzataként:

P^(s)=[A+B2FB1B2C1+D12F0D12γ2B1TXI0],

(662)

Ptmp(s)=[A+γ2B1B1TXB1B2F0IC2D210]

(663)

ahol

v=uu*,T=u+B2TXx,    r=ww*,T=wγ2B1TXx.

(664)

Mivel (P,K)=(P^,(Ptmp,K)) és a P^ által generált jel z=(C1+D12F)x+D12u, következik, hogy

(P,K)[0,T]<γ(Ptmp,K)[0,T]<γ,

(665)

ami a T határesetben is igaz marad.

Ptmp egy OE típusú feladatot határoz meg a hozzá tartozó

K(s)=[Atmp+LC2+B2FLF0]

(666)

szabáltozóval, ahol Atmp=A+γ2B1B1TX és ahol L=ZC2T és Z kielégíti az

AtmpZ+ZAtmpTZ(C2TC2γ2FTF)Z+B1B1T=0

(667)

algebrai Riccati egyenletet.

Figyeljük meg, hogy a 2 esettel ellentétben a probléma két algebrai Riccati egyenlete nem független egymástól: F=B2TX-ben az X mátrix az FI Riccati egyenlet megoldása.

Ha megköveteljük azonban, hogy ρ(XY)<γ2, vagyis Iγ2XY invertálható, akkor az

Y=Z(I+γ2XZ)1

(668)

transzformáció invertálható és Z akkor és csak akkor elégíti ki az OF Riccati egyenletet ha Y megoldása az

AY+YAT+B1B1TY(C2TC2γ2C1TC1)Y=0

(669)

OE algebrai Riccati egyenletnek.

Összegzésként az egyszerüsített kimenet visszacsatolásos feladat megoldását az alábbi algoritmus írja le:

Tétel 12.1 Az egyszerüsített OF feladat megoldása

KOF(s)=[ALF0]

(670)

ahol

A=A+γ2B1B1TXZC2TC2B2B2TX,

(671)

L=ZC2T,    F=B2TX,

(672)

XA+ATXX(B2B2Tγ2B1B1T)X+C1TC1=0,

(673)

YAT+AYY(C2TC2γ2C1TC1)Y+B1B1T=0,

(674)

Z=Y(1γ2XY)1.

(675)