Bár az egyszerüsített kimenet-visszacsatolásos optimális
szabályozó kiszámítása jórészt az optimális
szabályozó levezetésénél alkalmazott lépéseket követi, vannak lényegi tulajdonságok, amik megkülönböztetik a két esetet.
Egyrészt nyilvánvaló, hogy egy stabil lineáris
rendszerre es egy adott
esetén
akkor es csak akkor, ha létezik
amellyel
|
|
(594) |
minden
jelre. Ezt a feltételt átírhatjuk
|
|
(595) |
alakba, ami azt sugallja, hogy lehetséges egy véges horizontú szabályozót definiálni, ami határesetben, ahogy a
tart végtelenhez, megközelíti a
szabályozót. Így, mint azt a
esetben tettük, először célszerű a véges-horizontú FI feladatot megvizsgálni, ahol a költségfüggvény
|
|
(596) |
alakú, ahol
es
.
Kimutatható, hogy ennek a feladatnak a megoldása egy
szabályozó, ami egy olyan
irányító bemenetet generál, amelyre létezik
úgy, hogy
|
|
(597) |
fennáljon minden
esetén, vagyis
. Határesetben azt várjuk, hogy
|
|
(598) |
Azonban az optimális
feladattal szemben az optimális
irányítástervezésnek nem minig van megoldása, ha
túl kicsi, a zavaró
tag jelenléte miatt a költségfüggvényben. Tekinthetjük úgy, hogy az optimalizálási feladat megoldása egy olyan játszma kimenetele, amelyben a szabályozó célja egy, a költséget minimalizáló
irányító bemenet tervezése, míg a környezet egy olyan
zavarással hat ami maximalizálja ezt a költséget.
Tehát a
költség függvénye
-nak és
-nek. Ha a zavarási stratégia adott akkor
egy konvex függvény aminek globális minimuma az
irányításra vétetik fel, amit az optimális
szabályozó general. Ha az irányítás fix és a
környezeti hatás változik akkor a
egy konkáv funkcionál, aminek aminek globális maximuma
esetén adódik.
A két játékos optimális stratégiája a nyeregpontban van, vagyis a költségfüggvény inflexiós pontjában, ahol a szabályozó a lehető legjobb irányítást alkalmazza a legrosszabb szavarás feltételezése mellett.
Legyen
ez a nyeregponti stratégia, amit az alábbi feltétel jellemez:
|
|
(599) |
Tehát a
optimális eljárás a legrosszabb esetre készül fel, ami egy konkrét zavarás esetén nem feltétlenül adja az arra a zavarásra optimális választ.
A véges horizontú FI feladat a
|
|
(600) |
költségfüggvény
nyeregponti stratégiáját keresi, ahol a rendszer az alábbi formában adott:
|
|
(601) |
A továbbiakban feltételezzük, hogy létezik ilyen
nyeregpont.
Elöször rögzítsük
-t és tekintsük
jelet, ahol
egy kis állandó. Jelölje
a nyeregponti trajektóriát, vagyis
|
|
(602) |
és legyen
az
által meghatározott trajektória, vagyis
|
|
(603) |
Következik, hogy
ahol
kielégíti a
|
|
(604) |
egyenletet, azaz
ahol
az
-nak megfelelő alapmátrix.
Ekkor a perturbált költségfüggvény alakja
|
|
(605) |
Mivel az első tag
és
|
|
(606) |
következik, hogy
|
|
(607) |
Elég kis
esetén a jobboldal negatív. Mivel
adódik, hogy
|
|
(608) |
Bevezetve az alábbi társváltozót
|
|
(609) |
minden
-ra, a következő feltétel adódik:
|
|
(610) |
azaz a nyeregponti optimális irényítás
|
|
(611) |
ahol
.
A fenti gondolatmenetet megismételhetjük, hogy a legrosszabb
zavarás egy jellemzését megkapjuk: rögzítsük
-t és
ahol
. A perturbáló jel egy tetszőleges
-beli függvény és
egy tetszőleges állandó.
Eza perturbáció egy
trajektórát generál, ahol
és
kielégíti az
|
|
(612) |
egyenletet, azaz
.
Ezt behelyettesítve
-be kapjuk, hogy
|
|
(613) |
vagyis minden
esetén
|
|
(614) |
A társváltozó segítségével a legrosszabb zavarás kifejezhető mint
|
|
(615) |
ahol
.
Mint ahogyan az optimális LQ irányításnál már láttuk, az optimális állapot és társváltozó kielégíti az alábbi peremérték feladatot:
|
|
(616) |
|
|
(617) |
A
|
|
(618) |
mátrix a rendszerhez rendelt Hamiltonian mátrix. A társváltozó kifejezhető mint
|
|
(619) |
ahol
egy mátrixértékű függvény. Ekkor az optimális irányítás és a legrosszabb zavarás alakja
|
|
(620) |
Várakozásunknak megfelelően
megoldása egy mátrix Riccati differenciál egyenletnek:
|
|
(621) |
Ennek az
-nek a segítségével a költségfüggvény alakja
|
|
(622) |
formában írható.
Bevezetve azt az
rendszert ami
-t a
-be viszi, kapjuk, hogy
|
|
(623) |
Ezzel következik, hogy
|
|
(624) |
ahol
. Így az optimális
szabályozó kielégíti a
|
|
(625) |
feltételt minden
esetén, azaz bisztosítja, hogy
.
A
esetben már látott módon a végtelen horizontú optimális irányítás alakja
|
|
(626) |
ahol
a
|
|
(627) |
algebrai Riccati egyenlet pozitív definit megoldása amire
aszimptotikusan stabilis.
A
és
eset közötti különbség az algebrai Riccati egyenlet alakjában nyilvánul meg. Míg a
Riccati egyenletnek létezik stabilizáló megoldása, ha
(a)
stablizálható,
(b)
párnak nincsenek nem megfigyelhető módusai a képzetes tengelyen,
ez nem elégséges a
Riccati egyenletre. A továbbiakban feltesszük, hogy ezek a szükséges feltételek fennállnak és a
|
|
(628) |
Riccati differenciál egyenletnek vannak
megoldásai minden
-re, ahol
a
alakú
|
|
(629) |
Riccati egyenlet megoldása.
Feltehetjük, hogy a véges horizontú feladatok költségfüggvényei
|
|
(630) |
alakban írhatók, azaz
a terminális kültség.
Legyen
egy tetszőleges nemzérus kezdeti érték és
tetszőleges
-beli zavarás.Hogy kimutassuk
egyenletes korlátosságát
-ben, meg kell mutatnunk, hogylétezik
amire
minden
esetén.
A linearitást felhasználva
ahol
és
jelöli az
és
hatását
-re.Mivel a szabályozó stabilizálja a rendszert, létezik
amire
.Mivel a szabályozó garantálja, hogy
, létezik
úgy, hogy
. Következik, hogy
|
|
(631) |
azaz,
|
|
(632) |
minden
és minden
esetén.
Mivel
|
|
(633) |
ahol
|
|
(634) |
minden
-re, következik, hogy
|
|
(635) |
Mésrészt az optimális
szabályozót használva
esetén
|
|
(636) |
Ezért
|
|
(637) |
felhasználásával következik, hogy
|
|
(638) |
minden
jelre.
Ezen egyenlőtlenségek felhasználásával adódik, hogy
|
|
(639) |
minden
-re. Tehát
egyenletesen korlátos
-ben.
Az időinvariancia miatt
, így létezik
, hogy
|
|
(640) |
amiből következik, hogy a differenciál Riccati egyenlet megoldásai egyenletesen korlátosak
-ben.
A monotonitás kimutatásához tekintsük a Riccati egyenlet deriváltját
|
|
(641) |
ami egy lineáris egyenlet, tehát
|
|
(642) |
ahol
az
alapmátrixa. A Riccati egyenletből következik, hogy
|
|
(643) |
vagyis,
egy minoton nem növekvő függvény
-ben.
Ahogyan a
esetben is, az időinvarianciát felhasználva
, vagyis
egy monoton nem csökkenő függvénye
-nek.
Ugyan így,
, tehát határesetben
|
|
(644) |
ahol
egy konstans mátrix, amire
, mivel
minden
esetén. Mivel a Riccati egyenlet megoldásai folytonosan függnek a peremfeltételektől
|
|
(645) |
Ezért
kielégíti a
Riccati differencál egyenletet, ahol a peremfeltétel
, azaz
|
|
(646) |
Kimutattuk tehát, hogy az algebrai Riccati egyenlet megoldásának létezése szükséges a feltétel a
FI szabnályozó létezéséhez, feltéve, hogy
stabilizálható,
párnak nincsenek nem-megfigyelhető módusai a képzetes tengelyen és a Riccati differenciál egyenleteknek van megoldása minden
-re. Kimutatható, hogy ez utóbbi feltátel nem szükséges és a
algebrai Riccati egyenlet stabilizáló megoldásának létezése ekvivalens azzal, hogy a
Hamiltonian mátrixnak nincsenek sajátértékei a képzetes tengelyen.
A továbbiakban az eljárás követi a
esetben már látottakat: alkalmazva az
visszacsatolást, a zárt kör
|
|
(647) |
|
|
(648) |
Ki kell mutatni, hogy ez a rendszer stabil. A Riccati egyenletből kapjuk, hogy
|
|
(649) |
Mivel
, a
minden instabik módusa nem megfigyelhető
-re. Legyen
az
egy instabil módusa,
|
|
(650) |
Következik, hogy
|
|
(651) |
azaz,
az
-nak is egy módusa. De ez a mátrix stabilis, így
összes módusa stabil és megfigyelhető.
Mivel
asszimptotikusan stabilis, a KYP lemmából következik, hogy lemma that
if and only létezik
ami kielégíti az alábbi algebrai Riccati egyenletet:
|
|
(652) |
ahol
asszimptotikusan stabilis.Nyílvánvaló, hogy
egy megoldás, így
.
OE feladatAz FI feladat megoldását felhasználhatjuk az OE szűrési feladat megoldásának előállítására. A
esetben felírt Kalman szűrővel analó módon képzelhetjük el a
szűrőt: míg a Kalman szűrő az állapotbcslést négyzetes középben minimalizállja a Gauss eloszlású bemenetekre nézve, a
szűrő a becslési hiba erősítését egy
szintnél kisebbre garantálja minden lehetséges korlátos energiájú bemenet esetén.
A
feladatnál már látott módon az OE rendszer alakja
|
|
(653) |
ahol
stabilis. Ekkor
ha
|
|
(654) |
ahol
és
kielégíti az alábbi algebraic Riccati egyenletet
|
|
(655) |
Lemma 12.1
Egy
rendszer esetén, ahol
|
|
(656) |
akkor és csak akkor, ha
ahol
.
Bizonyítás 12.1
Az
irányítással, ahol
kielégíti a
FI feladat algebrai Riccati egyenletét,
, ahol
a
-ről
-re vett átviteli függvény.
A véges horizontú feladatra
|
|
(657) |
és
|
|
(658) |
Legyen
a
jelet
-re képző rendszer:
|
|
(659) |
Ha
, akkor létezik
, hogy
|
|
(660) |
azaz,
.
Fordítva, ha
, akkor
|
|
(661) |
amiből következik, hogy
.
Ebből az eredményből kiindulva írjul át az eredeti
rendszert a
esethez hasonlóan két rendszer,
és
, Redheffer szorzataként:
|
|
(662) |
|
|
(663) |
ahol
|
|
(664) |
Mivel
és a
által generált jel
, következik, hogy
|
|
(665) |
ami a
határesetben is igaz marad.
egy OE típusú feladatot határoz meg a hozzá tartozó
|
|
(666) |
szabáltozóval, ahol
és ahol
és
kielégíti az
|
|
(667) |
algebrai Riccati egyenletet.
Figyeljük meg, hogy a
esettel ellentétben a
probléma két algebrai Riccati egyenlete nem független egymástól:
-ben az
mátrix az FI Riccati egyenlet megoldása.
Ha megköveteljük azonban, hogy
, vagyis
invertálható, akkor az
|
|
(668) |
transzformáció invertálható és
akkor és csak akkor elégíti ki az OF Riccati egyenletet ha
megoldása az
|
|
(669) |
OE algebrai Riccati egyenletnek.
Összegzésként az egyszerüsített kimenet visszacsatolásos feladat megoldását az alábbi algoritmus írja le:
Tétel 12.1 Az egyszerüsített OF feladat megoldása
|
|
(670) |
ahol
|
|
(671) |
|
|
(672) |
|
|
(673) |
|
|
(674) |
|
|
(675) |