Show
Ignore:
Timestamp:
06/29/10 09:15:04 (15 years ago)
Author:
vahalam
Message:
 
Location:
applications/dual/IterativeLocal/text
Files:
2 modified

Legend:

Unmodified
Added
Removed
  • applications/dual/IterativeLocal/text/bpkomplet.lyx

    r1110 r1119  
    44\begin_header 
    55\textclass scrreprt 
     6\begin_preamble 
     7\usepackage[czech]{babel} 
     8\end_preamble 
    69\use_default_options true 
    710\language czech 
     
    546549iterative local dynamic programming 
    547550\emph default 
    548  algorithm as one of methods used for solving a dual control problem. 
     551 algorithm as one of the methods used for solving a dual control problem. 
    549552 The algorithm has been implemented for a simple system -- integrator with 
    550553 an unknown gain. 
    551554 Obtained results have been compared with a control designed by other methods, 
    552555 especially by using a separation principle. 
    553  Next, the algorithm has been tested on more complicated system, namely 
     556 Next, the algorithm has been tested on a more complicated system, namely 
    554557 permanent magnet synchronous machine. 
    555558 The thesis contains general dual control theory, used algorithms and systems 
    556559 descriptions and list of gained results. 
    557  Lastly the features and usability of the  
     560 Lastly, the features and usability of the  
    558561\emph on 
    559562iterative local dynamic programming 
     
    800803iLDP 
    801804\emph default 
    802  na jiných problémech, než pro které byla vyvinuta autory. 
    803  Objevení kladů a záporů algoritmu a dále díky srovnání s jinými algoritmy 
    804  získání přehledu, pro které praktické aplikace je vhodnější, respektive 
    805  méně vhodný než srovnávané metody. 
     805 na jiných problémech, než pro které byla vyvinuta autory; objevení kladů 
     806 a záporů algoritmu a dále díky srovnání s jinými algoritmy získání přehledu, 
     807 pro které praktické aplikace je vhodnější, respektive méně vhodný než srovnávan 
     808é metody. 
    806809 Prvotní očekávání pro srovnání algoritmu  
    807810\emph on 
     
    880883\emph default 
    881884. 
    882  Analogicky bude písmenem  
     885 Písmenem  
    883886\emph on 
    884887 
     
    888891 
    889892\emph default 
    890  označena pozorovaná hodnota na výstupu. 
     893 bude označena pozorovaná hodnota na výstupu. 
    891894  
    892895\end_layout 
     
    9971000\color inherit 
    9981001 očekávané hodnoty a variance. 
    999  Dále je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy 
     1002 Navíc je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy 
    10001003 analyticky neřešitelné. 
    10011004 Pro numerické řešení jsou rovnice systému zpravidla převáděny do diskrétního 
     
    10241027\emph default 
    10251028 využívá i informace o skutečném výstupu systému a snaží se tak eliminovat 
    1026  chyby v důsledku neurčitostí a chyb způsobených nepřesností modelu. 
     1029 chyby v důsledku neurčitostí a nepřesnosti modelu. 
    10271030\end_layout 
    10281031 
     
    10321035 
    10331036\begin_layout Standard 
    1034 Chceme navrhnout regulátor pro zadaný systém s neznámými parametry. 
     1037Naším cílem je navrhnout regulátor pro zadaný systém s neznámými parametry. 
    10351038 Úkoly jsou tedy dva: 1. 
    10361039 
     
    12731276\end_inset 
    12741277 
    1275 je právě to, které minimalizuje ztrátu 
     1278 je právě to, které minimalizuje ztrátu 
    12761279\begin_inset Formula \[ 
    12771280J_{\pi^{*}}(x_{0})=\min_{\pi\in\Pi}J_{\pi}(x_{0}).\] 
     
    13011304 problémů. 
    13021305 Konkrétně se uplatňuje v případě, že se jedná o diskrétní optimalizační 
    1303  úlohu. 
    1304  Na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 
     1306 úlohu; na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 
    13051307 rozhodnutí a platí  
    13061308\emph on 
     
    15251527 
    15261528, stretegie  
    1527 \begin_inset Formula $\pi*=\left\{ \mu_{1}^{*},\ldots,\mu_{N-1}^{*}\right\} $ 
     1529\begin_inset Formula $\pi^{*}=\left\{ \mu_{1}^{*},\ldots,\mu_{N-1}^{*}\right\} $ 
    15281530\end_inset 
    15291531 
     
    16581660 a na jejich základě libovolným způsobem upravovat jeho dynamické vlastnosti. 
    16591661 Ve skutečnosti ale zpravidla není možné všechny stavy změřit a musíme se 
    1660  rozhodovat pouze na základě informací, které máme k dispozici, pak mluvíme 
    1661  o  
     1662 rozhodovat pouze na základě informací, které máme k dispozici. 
     1663 V takovém případě mluvíme o  
    16621664\emph on 
    16631665neúplné informaci o stavu systému 
     
    19631965 takovou, že minimalizuje ztrátu v algoritmu dynamického programování přes 
    19641966 všechna přípustná řízení. 
    1965  Což můžeme zapsat pro vhodnou funkci  
     1967 To můžeme zapsat pro vhodnou funkci  
    19661968\begin_inset Formula $H_{k}$ 
    19671969\end_inset 
     
    29852987  
    29862988\color inherit 
    2987 a nelze užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality, 
    2988  což umožňuje řešit i komplexnější problémy. 
     2989a nelze užít pro stochastické úlohy. 
     2990 Vyhýbá se ale problému dimenzionality, což umožňuje řešit i komplexnější 
     2991 problémy. 
    29892992\end_layout 
    29902993 
     
    30233026\emph default 
    30243027. 
    3025  Dále pak do kategorie smíšených metod spadá právě i metoda  
     3028 Do kategorie smíšených metod spadá i metoda  
    30263029\emph on 
    30273030iLDP 
     
    31843187\end_inset 
    31853188 
    3186 při uvažování neúplné stavové informace je optimálním řízením v každém čase 
     3189při uvažování neúplné stavové informace je optimální řízení v každém čase 
    31873190 rovno 
    31883191\begin_inset Formula \[ 
     
    36163619 
    36173620\begin_layout Standard 
    3618 V každé iteraci proběhne nejprve přípravná fáze, kdy z řízení  
     3621V každé iteraci proběhne nejprve přípravná fáze, kdy se z řízení  
    36193622\begin_inset Formula $\pi(k,x)$ 
    36203623\end_inset 
    36213624 
    3622  generuje průměrnou trajektorii  
     3625 generuje průměrná trajektorie  
    36233626\begin_inset Formula $\bar{x}(k)$ 
    36243627\end_inset 
     
    37443747\end_inset 
    37453748 
    3746  aproximovat  
     3749 aproximujeme  
    37473750\begin_inset Formula $v^{(n)}=V(k,x^{(n)})$ 
    37483751\end_inset 
     
    37583761 
    37593762\begin_layout Enumerate 
    3760 Vypočítat novou aproximaci funkce  
     3763Vypočítáme novou aproximaci funkce  
    37613764\begin_inset Formula $\tilde{V}(k,x)$ 
    37623765\end_inset 
     
    40244027 
    40254028\begin_layout Standard 
    4026 Výpočet hodnot a aproximace  
     4029Výpočet hodnot a aproximací  
    40274030\begin_inset Formula $\tilde{V}\;(\tilde{V}_{x},\tilde{V}_{xx})$ 
    40284031\end_inset 
     
    43264329b & \sim & \mathcal{N}(\hat{b},P),\label{eq:simplesystem}\\ 
    43274330e_{k} & \sim & \mathcal{N}(0,1),\nonumber \\ 
    4328 \mathrm{cov}(e_{k},b_{k}) & = & 0,\;\forall k.\nonumber \end{eqnarray} 
     4331\mathrm{cov}(e_{k},b_{k}) & = & 0,\;\forall k,\nonumber \end{eqnarray} 
    43294332 
    43304333\end_inset 
     
    44264429\end_inset 
    44274430 
    4428  reprezentuje stav původní  
     4431 reprezentuje původní stav  
    44294432\begin_inset Formula $y_{k}$ 
    44304433\end_inset 
     
    44964499\end_inset 
    44974500 
    4498  je lineární, Gaussovský a máme k dispozici sdruženou hustotu rozdělení 
     4501 je lineární, gaussovský a máme k dispozici sdruženou hustotu rozdělení 
    44994502 pravděpodobnosti  
    45004503\begin_inset Formula $f(b_{k})=N(\hat{b}_{k},P_{k})$ 
     
    50535056\end_inset 
    50545057 
    5055  Přičemž obecný tvar parametrů vychází z systému definovaného v  
     5058 Obecný tvar parametrů vychází z systému definovaného v  
    50565059\begin_inset CommandInset ref 
    50575060LatexCommand ref 
     
    54005403\end_inset 
    54015404 
    5402 Kdy se koeficienty aproximace určují lineární regresí podle vzorce uvedeného 
     5405Koeficienty aproximace se určují lineární regresí podle vzorce uvedeného 
    54035406 v  
    54045407\begin_inset CommandInset ref 
     
    54535456Následující model popisuje synchronní elektromotor s rotorem tvořeným permanentn 
    54545457ími magnety. 
    5455  Systém je popsán standartními rovnicemi synchronního stroje s permanentními 
     5458 Systém je popsán standardními rovnicemi synchronního stroje s permanentními 
    54565459 magnety ve stacionárním tvaru 
    54575460\begin_inset Formula \begin{eqnarray} 
     
    57225725\end_inset 
    57235726 
    5724  získáme linearizecí systému v každém kroku, tedy 
     5727 získáme linearizací systému v každém kroku, tedy 
    57255728\begin_inset Formula \begin{eqnarray*} 
    57265729A_{k}=\frac{d}{dx_{k}}g(x_{k},u_{k}) & = & \left(\begin{array}{cccc} 
     
    60286031 
    60296032\begin_layout Standard 
    6030 Aproximace řízení byly volena a zkoušena v několika různých tvarech. 
     6033Aproximace řízení byla volena a zkoušena v několika různých tvarech. 
    60316034 Jednalo se o přímovazební řízení  
    60326035\begin_inset Formula $\pi(k,x)=\overline{u}_{k}$ 
     
    63096312 
    63106313aplikovat rovnice pro rozšířený Kalmanův filtr a LQ regulátor. 
    6311  Přičemž konkrétní hodnoty počátečních hodnot a parametrů budou specifikovány 
    6312  v kapitole  
     6314 Konkrétní hodnoty počátečních hodnot a parametrů budou specifikovány v 
     6315 kapitole  
    63136316\begin_inset CommandInset ref 
    63146317LatexCommand ref 
     
    66446647\end_inset 
    66456648 
    6646 , není-li uvedeno jinak. 
     6649. 
    66476650 Časový horizont pro výpočty je  
    66486651\begin_inset Formula $K=5$ 
     
    91949197 
    91959198 a chyby jsou zde v důsledku nepřesných výpočtů a následné linearizace vůči 
    9196  špatné trajektorii. 
    9197  Zejména při skutečné hodnotě  
     9199 špatné trajektorii, zejména při skutečné hodnotě  
    91989200\begin_inset Formula $b$ 
    91999201\end_inset 
     
    92039205 tím, že řídící strategie je navrhována pouze jednou (v rámci iterace), 
    92049206 pro celý časový horizont. 
    9205  Zlepšení, tedy rychlejší dosažení požadované hodnoty, by mohlo být využití 
    9206   
     9207 Zlepšení, tedy rychlejšího dosažení požadované hodnoty, by mohlo být dosaženo 
     9208 využitím  
    92079209\emph on 
    92089210ubíhajícího horizontu  
    92099211\emph default 
    9210 (receding horizon) podobně jako pro  
     9212( 
     9213\begin_inset Quotes gld 
     9214\end_inset 
     9215 
     9216receding horizon 
     9217\begin_inset Quotes grd 
     9218\end_inset 
     9219 
     9220) podobně jako pro  
    92119221\emph on 
    92129222LQG 
     
    94899499\end_inset 
    94909500 
    9491 A počáteční variance variance postupně:  
     9501A počáteční variance jsou postupně:  
    94929502\begin_inset Formula \begin{eqnarray*} 
    94939503P_{0} & = & \mathrm{diag\left(0,01;\:0,01;\:0,01;\:0,01\right),}\\ 
     
    1043010440 je nejsložitější ze zde prezentovaných metod pro nalezení optimálního řízení, 
    1043110441 zejména při nutnosti duálního přístupu. 
    10432  Je založen na obecných principech, jmenovitě Hamilton-Jacobi-Bellmanova 
    10433  rovnost a Pontryaginův princip minima. 
     10442 Je založen na obecných principech, jmenovitě Hamilton-Jacobi-Bellmanově 
     10443 rovnosti a Pontryaginůvě principu minima. 
    1043410444 Jedná se o iterační metodu, tedy takovou, která vychází od jistého počátečního 
    1043510445 řízení a to v iteracích  
     
    1075910769\begin_layout Standard 
    1076010770Vyhnout se výše popsanému problému by bylo možno pouze jinou volbou okolí. 
    10761  Narážíme zde ale opět na obtíže, jak jiné okolí zvolit, abychom se vyhli 
     10771 Narážíme zde ale opět na obtíže, jak jiné okolí zvolit, abychom se vyhnuli 
    1076210772 výše popsanému problému. 
    1076310773\end_layout 
     
    1084210852 
    1084310853\begin_layout Standard 
    10844 Shrnutí výše zmiňovaných problémů nám tedy dává následující závěr: Svoboda 
     10854Shrnutí výše zmiňovaných problémů nám tedy dává následující závěr: svoboda 
    1084510855 ve výběru aproximací nám poskytuje značnou volnost a činí algoritmus univerzáln 
    1084610856ím.