Changeset 1119 for applications/dual/IterativeLocal/text
- Timestamp:
- 06/29/10 09:15:04 (15 years ago)
- Location:
- applications/dual/IterativeLocal/text
- Files:
-
- 2 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/dual/IterativeLocal/text/bpkomplet.lyx
r1110 r1119 4 4 \begin_header 5 5 \textclass scrreprt 6 \begin_preamble 7 \usepackage[czech]{babel} 8 \end_preamble 6 9 \use_default_options true 7 10 \language czech … … 546 549 iterative local dynamic programming 547 550 \emph default 548 algorithm as one of methods used for solving a dual control problem.551 algorithm as one of the methods used for solving a dual control problem. 549 552 The algorithm has been implemented for a simple system -- integrator with 550 553 an unknown gain. 551 554 Obtained results have been compared with a control designed by other methods, 552 555 especially by using a separation principle. 553 Next, the algorithm has been tested on more complicated system, namely556 Next, the algorithm has been tested on a more complicated system, namely 554 557 permanent magnet synchronous machine. 555 558 The thesis contains general dual control theory, used algorithms and systems 556 559 descriptions and list of gained results. 557 Lastly the features and usability of the560 Lastly, the features and usability of the 558 561 \emph on 559 562 iterative local dynamic programming … … 800 803 iLDP 801 804 \emph default 802 na jiných problémech, než pro které byla vyvinuta autory .803 Objevení kladů a záporů algoritmu a dále díky srovnání s jinými algoritmy804 získání přehledu, pro které praktické aplikace je vhodnější, respektive805 méně vhodný než srovnávané metody.805 na jiných problémech, než pro které byla vyvinuta autory; objevení kladů 806 a záporů algoritmu a dále díky srovnání s jinými algoritmy získání přehledu, 807 pro které praktické aplikace je vhodnější, respektive méně vhodný než srovnávan 808 é metody. 806 809 Prvotní očekávání pro srovnání algoritmu 807 810 \emph on … … 880 883 \emph default 881 884 . 882 Analogicky bude písmenem885 Písmenem 883 886 \emph on 884 887 … … 888 891 889 892 \emph default 890 označena pozorovaná hodnota na výstupu.893 bude označena pozorovaná hodnota na výstupu. 891 894 892 895 \end_layout … … 997 1000 \color inherit 998 1001 očekávané hodnoty a variance. 999 Dáleje-li systém nelineární, jsou výsledné rovnice příliš složité a tedy1002 Navíc je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy 1000 1003 analyticky neřešitelné. 1001 1004 Pro numerické řešení jsou rovnice systému zpravidla převáděny do diskrétního … … 1024 1027 \emph default 1025 1028 využívá i informace o skutečném výstupu systému a snaží se tak eliminovat 1026 chyby v důsledku neurčitostí a chyb způsobených nepřesnostímodelu.1029 chyby v důsledku neurčitostí a nepřesnosti modelu. 1027 1030 \end_layout 1028 1031 … … 1032 1035 1033 1036 \begin_layout Standard 1034 Chceme navrhnout regulátor pro zadaný systém s neznámými parametry.1037 Naším cílem je navrhnout regulátor pro zadaný systém s neznámými parametry. 1035 1038 Úkoly jsou tedy dva: 1. 1036 1039 … … 1273 1276 \end_inset 1274 1277 1275 je právě to, které minimalizuje ztrátu1278 je právě to, které minimalizuje ztrátu 1276 1279 \begin_inset Formula \[ 1277 1280 J_{\pi^{*}}(x_{0})=\min_{\pi\in\Pi}J_{\pi}(x_{0}).\] … … 1301 1304 problémů. 1302 1305 Konkrétně se uplatňuje v případě, že se jedná o diskrétní optimalizační 1303 úlohu. 1304 Na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 1306 úlohu; na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 1305 1307 rozhodnutí a platí 1306 1308 \emph on … … 1525 1527 1526 1528 , stretegie 1527 \begin_inset Formula $\pi *=\left\{ \mu_{1}^{*},\ldots,\mu_{N-1}^{*}\right\} $1529 \begin_inset Formula $\pi^{*}=\left\{ \mu_{1}^{*},\ldots,\mu_{N-1}^{*}\right\} $ 1528 1530 \end_inset 1529 1531 … … 1658 1660 a na jejich základě libovolným způsobem upravovat jeho dynamické vlastnosti. 1659 1661 Ve skutečnosti ale zpravidla není možné všechny stavy změřit a musíme se 1660 rozhodovat pouze na základě informací, které máme k dispozici , pak mluvíme1661 o1662 rozhodovat pouze na základě informací, které máme k dispozici. 1663 V takovém případě mluvíme o 1662 1664 \emph on 1663 1665 neúplné informaci o stavu systému … … 1963 1965 takovou, že minimalizuje ztrátu v algoritmu dynamického programování přes 1964 1966 všechna přípustná řízení. 1965 Cožmůžeme zapsat pro vhodnou funkci1967 To můžeme zapsat pro vhodnou funkci 1966 1968 \begin_inset Formula $H_{k}$ 1967 1969 \end_inset … … 2985 2987 2986 2988 \color inherit 2987 a nelze užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality, 2988 což umožňuje řešit i komplexnější problémy. 2989 a nelze užít pro stochastické úlohy. 2990 Vyhýbá se ale problému dimenzionality, což umožňuje řešit i komplexnější 2991 problémy. 2989 2992 \end_layout 2990 2993 … … 3023 3026 \emph default 3024 3027 . 3025 D ále pak do kategorie smíšených metod spadá právěi metoda3028 Do kategorie smíšených metod spadá i metoda 3026 3029 \emph on 3027 3030 iLDP … … 3184 3187 \end_inset 3185 3188 3186 při uvažování neúplné stavové informace je optimální m řízenímv každém čase3189 při uvažování neúplné stavové informace je optimální řízení v každém čase 3187 3190 rovno 3188 3191 \begin_inset Formula \[ … … 3616 3619 3617 3620 \begin_layout Standard 3618 V každé iteraci proběhne nejprve přípravná fáze, kdy z řízení3621 V každé iteraci proběhne nejprve přípravná fáze, kdy se z řízení 3619 3622 \begin_inset Formula $\pi(k,x)$ 3620 3623 \end_inset 3621 3624 3622 generuje průměrn ou trajektorii3625 generuje průměrná trajektorie 3623 3626 \begin_inset Formula $\bar{x}(k)$ 3624 3627 \end_inset … … 3744 3747 \end_inset 3745 3748 3746 aproxim ovat3749 aproximujeme 3747 3750 \begin_inset Formula $v^{(n)}=V(k,x^{(n)})$ 3748 3751 \end_inset … … 3758 3761 3759 3762 \begin_layout Enumerate 3760 Vypočít atnovou aproximaci funkce3763 Vypočítáme novou aproximaci funkce 3761 3764 \begin_inset Formula $\tilde{V}(k,x)$ 3762 3765 \end_inset … … 4024 4027 4025 4028 \begin_layout Standard 4026 Výpočet hodnot a aproximac e4029 Výpočet hodnot a aproximací 4027 4030 \begin_inset Formula $\tilde{V}\;(\tilde{V}_{x},\tilde{V}_{xx})$ 4028 4031 \end_inset … … 4326 4329 b & \sim & \mathcal{N}(\hat{b},P),\label{eq:simplesystem}\\ 4327 4330 e_{k} & \sim & \mathcal{N}(0,1),\nonumber \\ 4328 \mathrm{cov}(e_{k},b_{k}) & = & 0,\;\forall k .\nonumber \end{eqnarray}4331 \mathrm{cov}(e_{k},b_{k}) & = & 0,\;\forall k,\nonumber \end{eqnarray} 4329 4332 4330 4333 \end_inset … … 4426 4429 \end_inset 4427 4430 4428 reprezentuje stav původní4431 reprezentuje původní stav 4429 4432 \begin_inset Formula $y_{k}$ 4430 4433 \end_inset … … 4496 4499 \end_inset 4497 4500 4498 je lineární, Gaussovský a máme k dispozici sdruženou hustotu rozdělení4501 je lineární, gaussovský a máme k dispozici sdruženou hustotu rozdělení 4499 4502 pravděpodobnosti 4500 4503 \begin_inset Formula $f(b_{k})=N(\hat{b}_{k},P_{k})$ … … 5053 5056 \end_inset 5054 5057 5055 Přičemž obecný tvar parametrů vychází z systému definovaného v5058 Obecný tvar parametrů vychází z systému definovaného v 5056 5059 \begin_inset CommandInset ref 5057 5060 LatexCommand ref … … 5400 5403 \end_inset 5401 5404 5402 K dy se koeficienty aproximace určují lineární regresí podle vzorce uvedeného5405 Koeficienty aproximace se určují lineární regresí podle vzorce uvedeného 5403 5406 v 5404 5407 \begin_inset CommandInset ref … … 5453 5456 Následující model popisuje synchronní elektromotor s rotorem tvořeným permanentn 5454 5457 ími magnety. 5455 Systém je popsán standar tními rovnicemi synchronního stroje s permanentními5458 Systém je popsán standardními rovnicemi synchronního stroje s permanentními 5456 5459 magnety ve stacionárním tvaru 5457 5460 \begin_inset Formula \begin{eqnarray} … … 5722 5725 \end_inset 5723 5726 5724 získáme lineariz ecí systému v každém kroku, tedy5727 získáme linearizací systému v každém kroku, tedy 5725 5728 \begin_inset Formula \begin{eqnarray*} 5726 5729 A_{k}=\frac{d}{dx_{k}}g(x_{k},u_{k}) & = & \left(\begin{array}{cccc} … … 6028 6031 6029 6032 \begin_layout Standard 6030 Aproximace řízení byl yvolena a zkoušena v několika různých tvarech.6033 Aproximace řízení byla volena a zkoušena v několika různých tvarech. 6031 6034 Jednalo se o přímovazební řízení 6032 6035 \begin_inset Formula $\pi(k,x)=\overline{u}_{k}$ … … 6309 6312 6310 6313 aplikovat rovnice pro rozšířený Kalmanův filtr a LQ regulátor. 6311 Přičemž konkrétní hodnoty počátečních hodnot a parametrů budou specifikovány6312 vkapitole6314 Konkrétní hodnoty počátečních hodnot a parametrů budou specifikovány v 6315 kapitole 6313 6316 \begin_inset CommandInset ref 6314 6317 LatexCommand ref … … 6644 6647 \end_inset 6645 6648 6646 , není-li uvedeno jinak.6649 . 6647 6650 Časový horizont pro výpočty je 6648 6651 \begin_inset Formula $K=5$ … … 9194 9197 9195 9198 a chyby jsou zde v důsledku nepřesných výpočtů a následné linearizace vůči 9196 špatné trajektorii. 9197 Zejména při skutečné hodnotě 9199 špatné trajektorii, zejména při skutečné hodnotě 9198 9200 \begin_inset Formula $b$ 9199 9201 \end_inset … … 9203 9205 tím, že řídící strategie je navrhována pouze jednou (v rámci iterace), 9204 9206 pro celý časový horizont. 9205 Zlepšení, tedy rychlejší dosažení požadované hodnoty, by mohlo být využití9206 9207 Zlepšení, tedy rychlejšího dosažení požadované hodnoty, by mohlo být dosaženo 9208 využitím 9207 9209 \emph on 9208 9210 ubíhajícího horizontu 9209 9211 \emph default 9210 (receding horizon) podobně jako pro 9212 ( 9213 \begin_inset Quotes gld 9214 \end_inset 9215 9216 receding horizon 9217 \begin_inset Quotes grd 9218 \end_inset 9219 9220 ) podobně jako pro 9211 9221 \emph on 9212 9222 LQG … … 9489 9499 \end_inset 9490 9500 9491 A počáteční variance variancepostupně:9501 A počáteční variance jsou postupně: 9492 9502 \begin_inset Formula \begin{eqnarray*} 9493 9503 P_{0} & = & \mathrm{diag\left(0,01;\:0,01;\:0,01;\:0,01\right),}\\ … … 10430 10440 je nejsložitější ze zde prezentovaných metod pro nalezení optimálního řízení, 10431 10441 zejména při nutnosti duálního přístupu. 10432 Je založen na obecných principech, jmenovitě Hamilton-Jacobi-Bellmanov a10433 rovnost a Pontryaginův principminima.10442 Je založen na obecných principech, jmenovitě Hamilton-Jacobi-Bellmanově 10443 rovnosti a Pontryaginůvě principu minima. 10434 10444 Jedná se o iterační metodu, tedy takovou, která vychází od jistého počátečního 10435 10445 řízení a to v iteracích … … 10759 10769 \begin_layout Standard 10760 10770 Vyhnout se výše popsanému problému by bylo možno pouze jinou volbou okolí. 10761 Narážíme zde ale opět na obtíže, jak jiné okolí zvolit, abychom se vyh li10771 Narážíme zde ale opět na obtíže, jak jiné okolí zvolit, abychom se vyhnuli 10762 10772 výše popsanému problému. 10763 10773 \end_layout … … 10842 10852 10843 10853 \begin_layout Standard 10844 Shrnutí výše zmiňovaných problémů nám tedy dává následující závěr: Svoboda10854 Shrnutí výše zmiňovaných problémů nám tedy dává následující závěr: svoboda 10845 10855 ve výběru aproximací nám poskytuje značnou volnost a činí algoritmus univerzáln 10846 10856 ím.