Changeset 1101 for applications/dual/IterativeLocal
- Timestamp:
- 06/13/10 23:03:58 (15 years ago)
- Location:
- applications/dual/IterativeLocal/text
- Files:
-
- 2 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/dual/IterativeLocal/text/bpkomplet.lyx
r1088 r1101 650 650 LQG 651 651 \emph default 652 lineá ně kvadraticky gaussovské řízení (Linear-Quadratic-Gaussian)652 lineárně kvadraticky gaussovské řízení (Linear-Quadratic-Gaussian) 653 653 \end_layout 654 654 … … 682 682 Situace se však ještě může zkomplikovat, když jeden nebo více parametrů 683 683 neznáme. 684 To může nastat z různých důvodů, například pří šlušné čidlo nebo měřící685 přístroj nemůžeme nebo nechceme (například z důvod ůvysoké ceny) instalovat684 To může nastat z různých důvodů, například příslušné čidlo nebo měřící 685 přístroj nemůžeme nebo nechceme (například z důvodu vysoké ceny) instalovat 686 686 a tedy o velikosti příslušné hodnoty můžeme jen usuzovat ze známých dat. 687 687 Ještě složitější situace nastane, když uvažujeme neznámý parametr proměnný. … … 710 710 Máme o nich však znalost v podobě počátečních středních hodnot a variancí. 711 711 Naší snahou je co nejpřesněji určit hodnotu otáček a polohy hřídele a současně 712 systém řídit tak, abychom dosáhl ypožadované hodnoty otáček.712 systém řídit tak, abychom dosáhli požadované hodnoty otáček. 713 713 Tyto dvě snahy jsou ale v rozporu, protože nejvíce informací o neznámých 714 714 parametrech získáme, když je motor vybuzen. … … 716 716 což se projevuje v proudech, které máme možnost měřit. 717 717 Ale právě vybuzení motoru je v rozporu se snahou o dobré řízení, protože 718 chyba, které se dopustíme je většinou nepřijatelná.719 Naopak, když se systém snažíme řídit ,bez dostatečné znalosti jeho parametrů,718 chyba, které se dopustíme, je většinou nepřijatelná. 719 Naopak, když se systém snažíme řídit bez dostatečné znalosti jeho parametrů, 720 720 s velkou pravděpodobností selžeme. 721 721 \end_layout … … 753 753 Tedy stručně řečeno, algoritmus vyjde od nějakého počátečního řízení, které 754 754 je ovšem nutno dodat jako apriorní informaci a v cyklech (iteracích) tuto 755 řídící strategii vylepšuje ,za účelem získání řízení optimálního.756 Dále se jedná o metodu lokální, což vmůžeme jednoduše chápat tak, že kandidáti755 řídící strategii vylepšuje za účelem získání řízení optimálního. 756 Dále se jedná o metodu lokální, což můžeme jednoduše chápat tak, že kandidáti 757 757 na 758 758 \begin_inset Quotes gld … … 763 763 \end_inset 764 764 765 řízení jsou vybírán í z jistého, zatím blíže nespecifikovaného,okolí původní765 řízení jsou vybíráni z jistého, zatím blíže nespecifikovaného okolí původní 766 766 řídící strategie. 767 767 Nakonec algoritmus využívá obecné schéma dynamického programování, které … … 781 781 ním. 782 782 Následně tento algoritmus implementovat a aplikovat na jednoduchý systém. 783 Otestovat jeho funkčnost a schopnost řídit a to i v porovnání s jinými783 Otestovat jeho funkčnost a schopnost řídit, a to i v porovnání s jinými 784 784 metodami a algoritmy. 785 785 Dále se pokusit implementovat algoritmus … … 790 790 motor s permanentními magnety. 791 791 Otestovat funkčnost a případně srovnat s dostupnými výsledky jiných řídících 792 strategii 793 \emph on 794 \color blue 795 . 796 797 \emph default 798 \color inherit 792 strategií. 799 793 Na základě získaných výsledků posoudit výhody a nevýhody algoritmu a jeho 800 použitelnost nadalší úlohy.794 použitelnost pro další úlohy. 801 795 \end_layout 802 796 … … 808 802 na jiných problémech, než pro které byla vyvinuta autory. 809 803 Objevení kladů a záporů algoritmu a dále díky srovnání s jinými algoritmy 810 získání přehledu, pro které praktické aplikace je vhodnější respektive804 získání přehledu, pro které praktické aplikace je vhodnější, respektive 811 805 méně vhodný než srovnávané metody. 812 806 Prvotní očekávání pro srovnání algoritmu … … 855 849 856 850 \begin_layout Standard 857 Základním pojmem, se kterým budeme v textu pracovat je851 Základním pojmem, se kterým budeme v textu pracovat, je 858 852 \emph on 859 853 systém … … 873 867 , často bude reprezentovat objekt skutečného světa. 874 868 Hlavní vlastností systému je, že má zpravidla jeden nebo více vstupů, pomocí 875 kterých mu můžeme předávat informaci -- řízení a jeden nebo více výstup u,876 což jsou hodn yty, které pozorujeme.869 kterých mu můžeme předávat informaci -- řízení a jeden nebo více výstupů, 870 což jsou hodnoty, které pozorujeme. 877 871 Co se odehrává uvnitř systému však obecně nevíme. 878 Řízení, které budeme dodávat systému na vstup bude v textu značeno písmenem872 Řízení, které budeme dodávat systému na vstup, bude v textu značeno písmenem 879 873 880 874 \emph on … … 906 900 \end_inset 907 901 908 obecně diferenciální rovnicí respektive soustavou diferenciálních rovnic902 obecně diferenciální rovnicí, respektive soustavou diferenciálních rovnic 909 903 vyšších řádů. 910 904 Jedná se o takzvaný … … 913 907 \color inherit 914 908 . 915 Tento druh popisu ,pohlíží na systém909 Tento druh popisu pohlíží na systém 916 910 \begin_inset Quotes gld 917 911 \end_inset … … 928 922 vnitřního (stavového) popisu 929 923 \color inherit 930 , kdy (soustavu) diferenciálních rovnic vyššího řádu, převedeme vhodnou931 volbounových proměnných924 , kdy soustavu diferenciálních rovnic vyššího řádu převedeme vhodnou volbou 925 nových proměnných 932 926 \emph on 933 927 … … 991 985 \series default 992 986 \emph default 993 dosáhnou (nebo se přiblíží s danou přesností)požadované hodnotě v podobě994 referenčního signálu, který regulátor dost avá z vnějšku a současně dodrží987 dosáhnou nebo se přiblíží s danou přesností požadované hodnotě v podobě 988 referenčního signálu, který regulátor dostává z vnějšku a současně dodrží 995 989 předem stanovená omezení. 996 990 Práce je ovšem zaměřena na řízení složitějších systémů, u kterých jeden … … 1005 999 Dále je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy 1006 1000 analyticky neřešitelné. 1007 Pro numerické řešení ,jsou rovnice systému zpravidla převáděny do diskrétního1001 Pro numerické řešení jsou rovnice systému zpravidla převáděny do diskrétního 1008 1002 tvaru. 1009 1003 \end_layout … … 1030 1024 \emph default 1031 1025 využívá i informace o skutečném výstupu systému a snaží se tak eliminovat 1032 chyby v důsledku neurčitostí a chyb způsoben ych nepřesností modelu.1026 chyby v důsledku neurčitostí a chyb způsobených nepřesností modelu. 1033 1027 \end_layout 1034 1028 … … 1049 1043 buzení 1050 1044 \emph default 1051 - určit neznám eparametry.1045 - určit neznámé parametry. 1052 1046 Tyto dva přístupy jsou ale obecně v rozporu. 1053 1047 Abychom mohli systém dobře řídit, potřebujeme znát parametry co nejpřesněji. 1054 1048 Nejvíce informací o parametrech však získáme, když je systém vybuzen a 1055 nechová optimálně.1049 nechová se optimálně. 1056 1050 Tyto pojmy není snadné kvantifikovat, ale velmi často se projevují v konkrétníc 1057 1051 h řídících schématech. 1058 Naším úkolem je pokusit nalézt nějaký kompromis mezi oběma úkoly.1052 Naším úkolem je pokusit se nalézt nějaký kompromis mezi oběma úkoly. 1059 1053 Právě tento přístup je označován jako 1060 1054 \emph on … … 1084 1078 s diskrétním časem, protože výpočty jsou prováděny ve většině případů problemat 1085 1079 iky duálního řízení numericky. 1086 Rovnice popisující systém jsou však zpravidla ve spojitém tvaru ,(model1080 Rovnice popisující systém jsou však zpravidla ve spojitém tvaru (model 1087 1081 často vychází ze skutečnosti, popřípadě fyzikálních zákonů). 1088 1082 V tomto případě provádíme diskretizaci. … … 1127 1121 \end_inset 1128 1122 1129 je stavová proměn á,1123 je stavová proměnná, 1130 1124 \begin_inset Formula $u_{k}$ 1131 1125 \end_inset … … 1148 1142 \end_inset 1149 1143 1150 klademe omezení, že může nabývat pouze hodnot z neprázdné m onožiny1144 klademe omezení, že může nabývat pouze hodnot z neprázdné množiny 1151 1145 \begin_inset Formula $U_{k}(x_{k})$ 1152 1146 \end_inset … … 1216 1210 \end_inset 1217 1211 1218 můžeme stavy1212 , můžeme stavy 1219 1213 \begin_inset Formula $x_{k}$ 1220 1214 \end_inset … … 1297 1291 1298 1292 \begin_layout Standard 1299 Dynamické programov ní dle1293 Dynamické programování dle 1300 1294 \begin_inset CommandInset citation 1301 1295 LatexCommand cite … … 1306 1300 je jedním ze způsobů návrhu algoritmů pro řešení jistých typu optimalizačních 1307 1301 problémů. 1308 Konkrétně se uplatňuje v případě, že jde o diskrétní optimalizační úlohu, 1309 na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 1302 Konkrétně se uplatňuje v případě, že se jedná o diskrétní optimalizační 1303 úlohu. 1304 Na řešení daného problému můžeme nahlížet jako na konečnou posloupnost 1310 1305 rozhodnutí a platí 1311 1306 \emph on … … 1455 1450 \end_inset 1456 1451 1457 ,je optimální cena1452 je optimální cena 1458 1453 \begin_inset Formula $J^{*}(x_{0})$ 1459 1454 \end_inset … … 1561 1556 \end_inset 1562 1557 1563 ,a končícího v čase1558 a končícího v čase 1564 1559 \begin_inset Formula $N$ 1565 1560 \end_inset … … 1625 1620 To je velmi užitečné zejména pro lepší náhled do problematiky a jako vodítko 1626 1621 pro složitější modely. 1627 Avšak ve větš íně případů není analytické řešení možné, pak je třeba použít1622 Avšak ve většině případů není analytické řešení možné, pak je třeba použít 1628 1623 numerické řešení pomocí algoritmu dynamického programování. 1629 1624 Tento přístup může být časově velmi náročný, zejména minimalizaci v rovnici … … 1640 1635 1641 1636 . 1642 Stavový prostor musí být diskretizován, nejedná-li se o konečnou množinu 1637 Stavový prostor musí být diskretizován, nejedná-li se o konečnou množinu, 1643 1638 a výpočetní nároky pak narůstají proporcionálně k počtu možných hodnot 1644 1639 … … 1949 1944 \end_inset 1950 1945 1951 ale současně zahrne veškerý důležitý obsah1946 , ale současně zahrne veškerý důležitý obsah 1952 1947 \begin_inset Formula $I_{k}$ 1953 1948 \end_inset … … 1987 1982 \end_inset 1988 1983 1989 , abychom získal yvýhody z jejího použití.1984 , abychom získali výhody z jejího použití. 1990 1985 Obecně existuje mnoho funkcí, které mohou sloužit jako postačující statistika. 1991 1986 Triviálním příkladem může být identita … … 2007 2002 \end_inset 2008 2003 2009 a nezávisí na předchozích hodnotách2004 , a nezávisí na předchozích hodnotách 2010 2005 \begin_inset Formula $x_{k-1},\ldots,x_{0},u_{k-1},\ldots,u_{0},w_{k-1},\ldots,w_{0},v_{k-1},\ldots,v_{0}$ 2011 2006 \end_inset 2012 2007 2013 můžeme za postačující statistiku volit podmíněné rozdělení pravděpodobnosti2008 , můžeme za postačující statistiku volit podmíněné rozdělení pravděpodobnosti 2014 2009 2015 2010 \begin_inset Formula $P_{x_{k}|I_{k}}$ … … 2213 2208 \end_inset 2214 2209 2215 na základě informa čí až do času2210 na základě informací až do času 2216 2211 \begin_inset Formula $k$ 2217 2212 \end_inset … … 2234 2229 2235 2230 \begin_layout Subsubsection 2236 Syst em2231 Systém 2237 2232 \end_layout 2238 2233 … … 2256 2251 \end_inset 2257 2252 2258 vektor náhodné poruchy a matice2253 je vektor náhodné poruchy a matice 2259 2254 \begin_inset Formula $A_{k}$ 2260 2255 \end_inset 2261 2256 2262 p ředpokládámeznámé.2257 považujeme za známé. 2263 2258 Dále rovnice měření je 2264 2259 \begin_inset Formula \[ … … 2297 2292 \end_inset 2298 2293 2299 pozitivně definitní pro všechny časy2294 je pozitivně definitní pro všechny časy 2300 2295 \begin_inset Formula $k$ 2301 2296 \end_inset … … 2526 2521 2527 2522 diferenciálních rovnic prvního řádu. 2528 Naším cílem je nal ézení přípustné řídící trajektorie2523 Naším cílem je nalezení přípustné řídící trajektorie 2529 2524 \begin_inset Formula $\left\{ u(t)\mid t\in[0,T]\right\} $ 2530 2525 \end_inset … … 2958 2953 Jednoduše můžeme tento problém chápat tak, že při numerickém řešení úlohy 2959 2954 jsou počítačem procházeny všechny body diskretizovaného stavového a řídícího 2960 prostoru jejichž počet s rostoucím počtem dimenzí extrémně (exponenciálně)2955 prostoru, jejichž počet s rostoucím počtem dimenzí extrémně (exponenciálně) 2961 2956 rychle roste. 2962 2957 Výpočet pro mnohadimenzionální úlohy se pak stává co do paměťových nároků, … … 2975 2970 \end_inset 2976 2971 2977 extrem alní2972 extremální 2978 2973 \begin_inset Quotes grd 2979 2974 \end_inset … … 2990 2985 2991 2986 \color inherit 2992 a ne zle užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality,2987 a nelze užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality, 2993 2988 což umožňuje řešit i komplexnější problémy. 2994 2989 \end_layout … … 3137 3132 3138 3133 ) je primárně navrženo pro řízení lineárních systémů s kvadratickou ztrátovou 3139 funkc ia Gaussovským šumem.3134 funkcí a Gaussovským šumem. 3140 3135 Existují však různé modifikace i pro nelineární systémy. 3141 3136 Algoritmus … … 3145 3140 je založen právě na 3146 3141 \emph on 3147 principu separace 3142 principu separace 3143 \emph default 3144 , 3145 \emph on 3146 3148 3147 \emph default 3149 3148 kdy pozorovatel a regulátor jsou navrhovány zvlášť. … … 3248 3247 \emph default 3249 3248 , avšak v jeho průběhu je do výpočtů ještě zasahováno. 3250 Jsou prováděny úpravy dílčích výsledků a opravy chyb z důvodu práce s linear ozo3249 Jsou prováděny úpravy dílčích výsledků a opravy chyb z důvodu práce s linearizo 3251 3250 vaným nelineárním systémem pro zajištění konvergence algoritmu. 3252 Samotný algoritmus je odvozen a detailně popsá mv3251 Samotný algoritmus je odvozen a detailně popsán v 3253 3252 \begin_inset CommandInset citation 3254 3253 LatexCommand cite … … 3257 3256 \end_inset 3258 3257 3259 odkud je převzat následující zestručněný popis:3258 , odkud je převzat následující zestručněný popis: 3260 3259 \end_layout 3261 3260 … … 3443 3442 \end_inset 3444 3443 3445 ) rovnice3444 ), rovnice 3446 3445 \begin_inset CommandInset ref 3447 3446 LatexCommand ref … … 3492 3491 Použitý minimalizační algoritmus se samozřejmě liší podle konkrétního problému, 3493 3492 zejména jedná-li se o minimalizaci omezenou nebo neomezenou. 3494 Ještě je třeba zmíni l, že pro algoritmus je nutno zvolit parametr3493 Ještě je třeba zmínit, že pro algoritmus je nutno zvolit parametr 3495 3494 \begin_inset Quotes gld 3496 3495 \end_inset … … 3749 3748 \end_inset 3750 3749 3751 použitím Ham olton-Jacobi-Bellmanovirovnosti3750 použitím Hamilton-Jacobi-Bellmanovy rovnosti 3752 3751 \begin_inset Formula \[ 3753 3752 V(k,x^{(n)})\approx\Delta k\cdot H(k,x^{(n)},u^{(n)})+\tilde{V}(k+1,x^{(n)}).\] … … 3924 3923 fmincon 3925 3924 \family default 3926 pro neomezenou respektive omezenou minimalizaci.3925 pro neomezenou, respektive omezenou minimalizaci. 3927 3926 V případě, kdy je možno spočítat minimalizaci analyticky, jedná se samozřejmě 3928 3927 o nejlepší způsob. … … 3995 3994 \emph on 3996 3995 bodě 1. 3996 \emph default 3997 , 3998 \emph on 3997 3999 3998 4000 \emph default … … 4003 4005 iLDP 4004 4006 \emph default 4005 , jedná se současně i o největší slabinu, protože autoři explicitně neuv adějí4007 , jedná se současně i o největší slabinu, protože autoři explicitně neuvádějí, 4006 4008 jaké aproximace volit. 4007 4009 Následně, při implementaci algoritmu pro systém s větším počtem dimenzí, … … 4033 4035 \end_inset 4034 4036 4035 kde4037 , kde 4036 4038 \begin_inset Formula $P<N$ 4037 4039 \end_inset … … 4072 4074 \end_inset 4073 4075 4074 respektive4076 , respektive 4075 4077 \emph on 4076 4078 vektor … … 4155 4157 \end_inset 4156 4158 4157 je konstantní v nejenčase, ale i v iteracích algoritmu a matici4159 je konstantní nejen v čase, ale i v iteracích algoritmu a matici 4158 4160 \begin_inset Formula $\left(\mathbf{\Phi\Phi}^{T}\right)^{-1}\mathbf{\Phi}$ 4159 4161 \end_inset … … 4186 4188 a následně i v průběhu implementace metody. 4187 4189 Později budou konfrontovány s pozorováními získaných výsledků a závěry 4188 simulací, aby bylo zřejmé, která očekávání byla naplněna ,a která nikoliv.4190 simulací, aby bylo zřejmé, která očekávání byla naplněna a která nikoliv. 4189 4191 Tento postup může být velmi užitečný zejména z důvodu posouzení, které 4190 4192 charakteristické vlastnosti algoritmu … … 4192 4194 iLDP 4193 4195 \emph default 4194 jsou patrny pouze při letmém prostudov aní a naopak, pro které je nutno4196 jsou patrny pouze při letmém prostudování a naopak, pro které je nutno 4195 4197 algoritmus implementovat a otestovat. 4196 4198 \end_layout