Show
Ignore:
Timestamp:
06/13/10 23:03:58 (15 years ago)
Author:
vahalam
Message:
 
Location:
applications/dual/IterativeLocal/text
Files:
2 modified

Legend:

Unmodified
Added
Removed
  • applications/dual/IterativeLocal/text/bpkomplet.lyx

    r1088 r1101  
    650650LQG 
    651651\emph default 
    652  lineáně kvadraticky gaussovské řízení (Linear-Quadratic-Gaussian) 
     652 lineárně kvadraticky gaussovské řízení (Linear-Quadratic-Gaussian) 
    653653\end_layout 
    654654 
     
    682682 Situace se však ještě může zkomplikovat, když jeden nebo více parametrů 
    683683 neznáme. 
    684  To může nastat z různých důvodů, například příšlušné čidlo nebo měřící 
    685  přístroj nemůžeme nebo nechceme (například z důvodů vysoké ceny) instalovat 
     684 To může nastat z různých důvodů, například příslušné čidlo nebo měřící 
     685 přístroj nemůžeme nebo nechceme (například z důvodu vysoké ceny) instalovat 
    686686 a tedy o velikosti příslušné hodnoty můžeme jen usuzovat ze známých dat. 
    687687 Ještě složitější situace nastane, když uvažujeme neznámý parametr proměnný. 
     
    710710 Máme o nich však znalost v podobě počátečních středních hodnot a variancí. 
    711711 Naší snahou je co nejpřesněji určit hodnotu otáček a polohy hřídele a současně 
    712  systém řídit tak, abychom dosáhly požadované hodnoty otáček. 
     712 systém řídit tak, abychom dosáhli požadované hodnoty otáček. 
    713713 Tyto dvě snahy jsou ale v rozporu, protože nejvíce informací o neznámých 
    714714 parametrech získáme, když je motor vybuzen. 
     
    716716 což se projevuje v proudech, které máme možnost měřit. 
    717717 Ale právě vybuzení motoru je v rozporu se snahou o dobré řízení, protože 
    718  chyba, které se dopustíme je většinou nepřijatelná. 
    719  Naopak, když se systém snažíme řídit, bez dostatečné znalosti jeho parametrů, 
     718 chyba, které se dopustíme, je většinou nepřijatelná. 
     719 Naopak, když se systém snažíme řídit bez dostatečné znalosti jeho parametrů, 
    720720 s velkou pravděpodobností selžeme. 
    721721\end_layout 
     
    753753 Tedy stručně řečeno, algoritmus vyjde od nějakého počátečního řízení, které 
    754754 je ovšem nutno dodat jako apriorní informaci a v cyklech (iteracích) tuto 
    755  řídící strategii vylepšuje, za účelem získání řízení optimálního. 
    756  Dále se jedná o metodu lokální, což v můžeme jednoduše chápat tak, že kandidáti 
     755 řídící strategii vylepšuje za účelem získání řízení optimálního. 
     756 Dále se jedná o metodu lokální, což můžeme jednoduše chápat tak, že kandidáti 
    757757 na  
    758758\begin_inset Quotes gld 
     
    763763\end_inset 
    764764 
    765  řízení jsou vybírání z jistého, zatím blíže nespecifikovaného, okolí původní 
     765 řízení jsou vybíráni z jistého, zatím blíže nespecifikovaného okolí původní 
    766766 řídící strategie. 
    767767 Nakonec algoritmus využívá obecné schéma dynamického programování, které 
     
    781781ním. 
    782782 Následně tento algoritmus implementovat a aplikovat na jednoduchý systém. 
    783  Otestovat jeho funkčnost a schopnost řídit a to i v porovnání s jinými 
     783 Otestovat jeho funkčnost a schopnost řídit, a to i v porovnání s jinými 
    784784 metodami a algoritmy. 
    785785 Dále se pokusit implementovat algoritmus  
     
    790790 motor s permanentními magnety. 
    791791 Otestovat funkčnost a případně srovnat s dostupnými výsledky jiných řídících 
    792  strategii 
    793 \emph on 
    794 \color blue 
    795 . 
    796  
    797 \emph default 
    798 \color inherit 
     792 strategií. 
    799793 Na základě získaných výsledků posoudit výhody a nevýhody algoritmu a jeho 
    800  použitelnost na další úlohy. 
     794 použitelnost pro další úlohy. 
    801795\end_layout 
    802796 
     
    808802 na jiných problémech, než pro které byla vyvinuta autory. 
    809803 Objevení kladů a záporů algoritmu a dále díky srovnání s jinými algoritmy 
    810  získání přehledu, pro které praktické aplikace je vhodnější respektive 
     804 získání přehledu, pro které praktické aplikace je vhodnější, respektive 
    811805 méně vhodný než srovnávané metody. 
    812806 Prvotní očekávání pro srovnání algoritmu  
     
    855849 
    856850\begin_layout Standard 
    857 Základním pojmem, se kterým budeme v textu pracovat je  
     851Základním pojmem, se kterým budeme v textu pracovat, je  
    858852\emph on 
    859853systém 
     
    873867, často bude reprezentovat objekt skutečného světa. 
    874868 Hlavní vlastností systému je, že má zpravidla jeden nebo více vstupů, pomocí 
    875  kterých mu můžeme předávat informaci -- řízení a jeden nebo více výstupu, 
    876  což jsou hodnyty, které pozorujeme. 
     869 kterých mu můžeme předávat informaci -- řízení a jeden nebo více výstupů, 
     870 což jsou hodnoty, které pozorujeme. 
    877871 Co se odehrává uvnitř systému však obecně nevíme. 
    878  Řízení, které budeme dodávat systému na vstup bude v textu značeno písmenem 
     872 Řízení, které budeme dodávat systému na vstup, bude v textu značeno písmenem 
    879873  
    880874\emph on 
     
    906900\end_inset 
    907901 
    908  obecně diferenciální rovnicí respektive soustavou diferenciálních rovnic 
     902 obecně diferenciální rovnicí, respektive soustavou diferenciálních rovnic 
    909903 vyšších řádů. 
    910904 Jedná se o takzvaný  
     
    913907\color inherit 
    914908. 
    915  Tento druh popisu, pohlíží na systém  
     909 Tento druh popisu pohlíží na systém  
    916910\begin_inset Quotes gld 
    917911\end_inset 
     
    928922vnitřního (stavového) popisu 
    929923\color inherit 
    930 , kdy (soustavu) diferenciálních rovnic vyššího řádu, převedeme vhodnou 
    931  volbou nových proměnných  
     924, kdy soustavu diferenciálních rovnic vyššího řádu převedeme vhodnou volbou 
     925 nových proměnných  
    932926\emph on 
    933927 
     
    991985\series default 
    992986\emph default 
    993  dosáhnou (nebo se přiblíží s danou přesností) požadované hodnotě v podobě 
    994  referenčního signálu, který regulátor dostavá z vnějšku a současně dodrží 
     987 dosáhnou nebo se přiblíží s danou přesností požadované hodnotě v podobě 
     988 referenčního signálu, který regulátor dostává z vnějšku a současně dodrží 
    995989 předem stanovená omezení. 
    996990 Práce je ovšem zaměřena na řízení složitějších systémů, u kterých jeden 
     
    1005999 Dále je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy 
    10061000 analyticky neřešitelné. 
    1007  Pro numerické řešení, jsou rovnice systému zpravidla převáděny do diskrétního 
     1001 Pro numerické řešení jsou rovnice systému zpravidla převáděny do diskrétního 
    10081002 tvaru. 
    10091003\end_layout 
     
    10301024\emph default 
    10311025 využívá i informace o skutečném výstupu systému a snaží se tak eliminovat 
    1032  chyby v důsledku neurčitostí a chyb způsobenych nepřesností modelu. 
     1026 chyby v důsledku neurčitostí a chyb způsobených nepřesností modelu. 
    10331027\end_layout 
    10341028 
     
    10491043 buzení  
    10501044\emph default 
    1051 - určit neznáme parametry. 
     1045- určit neznámé parametry. 
    10521046 Tyto dva přístupy jsou ale obecně v rozporu. 
    10531047 Abychom mohli systém dobře řídit, potřebujeme znát parametry co nejpřesněji. 
    10541048 Nejvíce informací o parametrech však získáme, když je systém vybuzen a 
    1055  nechová optimálně. 
     1049 nechová se optimálně. 
    10561050 Tyto pojmy není snadné kvantifikovat, ale velmi často se projevují v konkrétníc 
    10571051h řídících schématech. 
    1058  Naším úkolem je pokusit nalézt nějaký kompromis mezi oběma úkoly. 
     1052 Naším úkolem je pokusit se nalézt nějaký kompromis mezi oběma úkoly. 
    10591053 Právě tento přístup je označován jako  
    10601054\emph on 
     
    10841078 s diskrétním časem, protože výpočty jsou prováděny ve většině případů problemat 
    10851079iky duálního řízení numericky. 
    1086  Rovnice popisující systém jsou však zpravidla ve spojitém tvaru, (model 
     1080 Rovnice popisující systém jsou však zpravidla ve spojitém tvaru (model 
    10871081 často vychází ze skutečnosti, popřípadě fyzikálních zákonů). 
    10881082 V tomto případě provádíme diskretizaci. 
     
    11271121\end_inset 
    11281122 
    1129  je stavová proměná,  
     1123 je stavová proměnná,  
    11301124\begin_inset Formula $u_{k}$ 
    11311125\end_inset 
     
    11481142\end_inset 
    11491143 
    1150  klademe omezení, že může nabývat pouze hodnot z neprázdné monožiny  
     1144 klademe omezení, že může nabývat pouze hodnot z neprázdné množiny  
    11511145\begin_inset Formula $U_{k}(x_{k})$ 
    11521146\end_inset 
     
    12161210\end_inset 
    12171211 
    1218  můžeme stavy  
     1212, můžeme stavy  
    12191213\begin_inset Formula $x_{k}$ 
    12201214\end_inset 
     
    12971291 
    12981292\begin_layout Standard 
    1299 Dynamické programovní dle  
     1293Dynamické programování dle  
    13001294\begin_inset CommandInset citation 
    13011295LatexCommand cite 
     
    13061300 je jedním ze způsobů návrhu algoritmů pro řešení jistých typu optimalizačních 
    13071301 problémů. 
    1308  Konkrétně se uplatňuje v případě, že jde o diskrétní optimalizační úlohu, 
    1309  na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 
     1302 Konkrétně se uplatňuje v případě, že se jedná o diskrétní optimalizační 
     1303 úlohu. 
     1304 Na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 
    13101305 rozhodnutí a platí  
    13111306\emph on 
     
    14551450\end_inset 
    14561451 
    1457 , je optimální cena  
     1452 je optimální cena  
    14581453\begin_inset Formula $J^{*}(x_{0})$ 
    14591454\end_inset 
     
    15611556\end_inset 
    15621557 
    1563 , a končícího v čase  
     1558 a končícího v čase  
    15641559\begin_inset Formula $N$ 
    15651560\end_inset 
     
    16251620 To je velmi užitečné zejména pro lepší náhled do problematiky a jako vodítko 
    16261621 pro složitější modely. 
    1627  Avšak ve většíně případů není analytické řešení možné, pak je třeba použít 
     1622 Avšak ve většině případů není analytické řešení možné, pak je třeba použít 
    16281623 numerické řešení pomocí algoritmu dynamického programování. 
    16291624 Tento přístup může být časově velmi náročný, zejména minimalizaci v rovnici 
     
    16401635 
    16411636. 
    1642  Stavový prostor musí být diskretizován, nejedná-li se o konečnou množinu 
     1637 Stavový prostor musí být diskretizován, nejedná-li se o konečnou množinu, 
    16431638 a výpočetní nároky pak narůstají proporcionálně k počtu možných hodnot 
    16441639  
     
    19491944\end_inset 
    19501945 
    1951  ale současně zahrne veškerý důležitý obsah  
     1946, ale současně zahrne veškerý důležitý obsah  
    19521947\begin_inset Formula $I_{k}$ 
    19531948\end_inset 
     
    19871982\end_inset 
    19881983 
    1989 , abychom získaly výhody z jejího použití. 
     1984, abychom získali výhody z jejího použití. 
    19901985 Obecně existuje mnoho funkcí, které mohou sloužit jako postačující statistika. 
    19911986 Triviálním příkladem může být identita  
     
    20072002\end_inset 
    20082003 
    2009  a nezávisí na předchozích hodnotách  
     2004, a nezávisí na předchozích hodnotách  
    20102005\begin_inset Formula $x_{k-1},\ldots,x_{0},u_{k-1},\ldots,u_{0},w_{k-1},\ldots,w_{0},v_{k-1},\ldots,v_{0}$ 
    20112006\end_inset 
    20122007 
    2013  můžeme za postačující statistiku volit podmíněné rozdělení pravděpodobnosti 
     2008, můžeme za postačující statistiku volit podmíněné rozdělení pravděpodobnosti 
    20142009  
    20152010\begin_inset Formula $P_{x_{k}|I_{k}}$ 
     
    22132208\end_inset 
    22142209 
    2215  na základě informačí až do času  
     2210 na základě informací až do času  
    22162211\begin_inset Formula $k$ 
    22172212\end_inset 
     
    22342229 
    22352230\begin_layout Subsubsection 
    2236 System 
     2231Systém 
    22372232\end_layout 
    22382233 
     
    22562251\end_inset 
    22572252 
    2258  vektor náhodné poruchy a matice  
     2253 je vektor náhodné poruchy a matice  
    22592254\begin_inset Formula $A_{k}$ 
    22602255\end_inset 
    22612256 
    2262  předpokládáme známé. 
     2257 považujeme za známé. 
    22632258 Dále rovnice měření je 
    22642259\begin_inset Formula \[ 
     
    22972292\end_inset 
    22982293 
    2299  pozitivně definitní pro všechny časy  
     2294 je pozitivně definitní pro všechny časy  
    23002295\begin_inset Formula $k$ 
    23012296\end_inset 
     
    25262521 
    25272522 diferenciálních rovnic prvního řádu. 
    2528  Naším cílem je nalézení přípustné řídící trajektorie  
     2523 Naším cílem je nalezení přípustné řídící trajektorie  
    25292524\begin_inset Formula $\left\{ u(t)\mid t\in[0,T]\right\} $ 
    25302525\end_inset 
     
    29582953 Jednoduše můžeme tento problém chápat tak, že při numerickém řešení úlohy 
    29592954 jsou počítačem procházeny všechny body diskretizovaného stavového a řídícího 
    2960  prostoru jejichž počet s rostoucím počtem dimenzí extrémně (exponenciálně) 
     2955 prostoru, jejichž počet s rostoucím počtem dimenzí extrémně (exponenciálně) 
    29612956 rychle roste. 
    29622957 Výpočet pro mnohadimenzionální úlohy se pak stává co do paměťových nároků, 
     
    29752970\end_inset 
    29762971 
    2977 extremalní 
     2972extremální 
    29782973\begin_inset Quotes grd 
    29792974\end_inset 
     
    29902985  
    29912986\color inherit 
    2992 a nezle užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality, 
     2987a nelze užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality, 
    29932988 což umožňuje řešit i komplexnější problémy. 
    29942989\end_layout 
     
    31373132 
    31383133) je primárně navrženo pro řízení lineárních systémů s kvadratickou ztrátovou 
    3139  funkci a Gaussovským šumem. 
     3134 funkcí a Gaussovským šumem. 
    31403135 Existují však různé modifikace i pro nelineární systémy. 
    31413136 Algoritmus  
     
    31453140 je založen právě na  
    31463141\emph on 
    3147 principu separace  
     3142principu separace 
     3143\emph default 
     3144, 
     3145\emph on 
     3146  
    31483147\emph default 
    31493148kdy pozorovatel a regulátor jsou navrhovány zvlášť. 
     
    32483247\emph default 
    32493248, avšak v jeho průběhu je do výpočtů ještě zasahováno. 
    3250  Jsou prováděny úpravy dílčích výsledků a opravy chyb z důvodu práce s linearozo 
     3249 Jsou prováděny úpravy dílčích výsledků a opravy chyb z důvodu práce s linearizo 
    32513250vaným nelineárním systémem pro zajištění konvergence algoritmu. 
    3252  Samotný algoritmus je odvozen a detailně popsám v  
     3251 Samotný algoritmus je odvozen a detailně popsán v  
    32533252\begin_inset CommandInset citation 
    32543253LatexCommand cite 
     
    32573256\end_inset 
    32583257 
    3259  odkud je převzat následující zestručněný popis: 
     3258, odkud je převzat následující zestručněný popis: 
    32603259\end_layout 
    32613260 
     
    34433442\end_inset 
    34443443 
    3445 ) rovnice  
     3444), rovnice  
    34463445\begin_inset CommandInset ref 
    34473446LatexCommand ref 
     
    34923491 Použitý minimalizační algoritmus se samozřejmě liší podle konkrétního problému, 
    34933492 zejména jedná-li se o minimalizaci omezenou nebo neomezenou. 
    3494  Ještě je třeba zmínil, že pro algoritmus je nutno zvolit parametr  
     3493 Ještě je třeba zmínit, že pro algoritmus je nutno zvolit parametr  
    34953494\begin_inset Quotes gld 
    34963495\end_inset 
     
    37493748\end_inset 
    37503749 
    3751  použitím Hamolton-Jacobi-Bellmanovi rovnosti  
     3750 použitím Hamilton-Jacobi-Bellmanovy rovnosti  
    37523751\begin_inset Formula \[ 
    37533752V(k,x^{(n)})\approx\Delta k\cdot H(k,x^{(n)},u^{(n)})+\tilde{V}(k+1,x^{(n)}).\] 
     
    39243923fmincon 
    39253924\family default 
    3926  pro neomezenou respektive omezenou minimalizaci. 
     3925 pro neomezenou, respektive omezenou minimalizaci. 
    39273926 V případě, kdy je možno spočítat minimalizaci analyticky, jedná se samozřejmě 
    39283927 o nejlepší způsob. 
     
    39953994\emph on 
    39963995bodě 1. 
     3996\emph default 
     3997, 
     3998\emph on 
    39973999  
    39984000\emph default 
     
    40034005iLDP 
    40044006\emph default 
    4005 , jedná se současně i o největší slabinu, protože autoři explicitně neuvadějí 
     4007, jedná se současně i o největší slabinu, protože autoři explicitně neuvádějí, 
    40064008 jaké aproximace volit. 
    40074009 Následně, při implementaci algoritmu pro systém s větším počtem dimenzí, 
     
    40334035\end_inset 
    40344036 
    4035  kde  
     4037, kde  
    40364038\begin_inset Formula $P<N$ 
    40374039\end_inset 
     
    40724074\end_inset 
    40734075 
    4074  respektive  
     4076, respektive  
    40754077\emph on 
    40764078vektor  
     
    41554157\end_inset 
    41564158 
    4157  je konstantní v nejen čase, ale i v iteracích algoritmu a matici  
     4159 je konstantní nejen v čase, ale i v iteracích algoritmu a matici  
    41584160\begin_inset Formula $\left(\mathbf{\Phi\Phi}^{T}\right)^{-1}\mathbf{\Phi}$ 
    41594161\end_inset 
     
    41864188 a následně i v průběhu implementace metody. 
    41874189 Později budou konfrontovány s pozorováními získaných výsledků a závěry 
    4188  simulací, aby bylo zřejmé, která očekávání byla naplněna, a která nikoliv. 
     4190 simulací, aby bylo zřejmé, která očekávání byla naplněna a která nikoliv. 
    41894191 Tento postup může být velmi užitečný zejména z důvodu posouzení, které 
    41904192 charakteristické vlastnosti algoritmu  
     
    41924194iLDP 
    41934195\emph default 
    4194  jsou patrny pouze při letmém prostudovaní a naopak, pro které je nutno 
     4196 jsou patrny pouze při letmém prostudování a naopak, pro které je nutno 
    41954197 algoritmus implementovat a otestovat. 
    41964198\end_layout