Context Navigation

bpkomplet.lyx @ 906

Revision 906, 85.7 kB (checked in by vahalam, 14 years ago)

Rev	Line
[906]	1	#LyX 1.6.5 created this file. For more info see http://www.lyx.org/
	2	\lyxformat 345
	3	\begin_document
	4	\begin_header
	5	\textclass scrreprt
	6	\use_default_options true
	7	\language czech
	8	\inputencoding auto
	9	\font_roman default
	10	\font_sans default
	11	\font_typewriter default
	12	\font_default_family default
	13	\font_sc false
	14	\font_osf false
	15	\font_sf_scale 100
	16	\font_tt_scale 100
	17
	18	\graphics default
	19	\paperfontsize default
	20	\spacing single
	21	\use_hyperref false
	22	\papersize a4paper
	23	\use_geometry false
	24	\use_amsmath 1
	25	\use_esint 1
	26	\cite_engine basic
	27	\use_bibtopic false
	28	\paperorientation portrait
	29	\secnumdepth 2
	30	\tocdepth 2
	31	\paragraph_separation indent
	32	\defskip medskip
	33	\quotes_language german
	34	\papercolumns 1
	35	\papersides 1
	36	\paperpagestyle default
	37	\tracking_changes false
	38	\output_changes false
	39	\author ""
	40	\author ""
	41	\end_header
	42
	43	\begin_body
	44
	45	\begin_layout Standard
	46	\align left
	47	\begin_inset ERT
	48	status open
	49
	50	\begin_layout Plain Layout
	51
	52
	53	\backslash
	54	thispagestyle{empty}
	55	\end_layout
	56
	57	\end_inset
	58
	59
	60	\end_layout
	61
	62	\begin_layout Standard
	63	\align center
	64
	65	\size large
	66	České vysoké učení technické v Praze
	67	\end_layout
	68
	69	\begin_layout Standard
	70	\align center
	71
	72	\size large
	73	Fakulta jaderná a fyzikálně inženýrská
	74	\end_layout
	75
	76	\begin_layout Standard
	77	\begin_inset VSpace bigskip
	78	\end_inset
	79
	80
	81	\end_layout
	82
	83	\begin_layout Standard
	84	\align center
	85	Katedra matematiky
	86	\end_layout
	87
	88	\begin_layout Standard
	89	\align center
	90	Obor: Inženýrská informatika
	91	\end_layout
	92
	93	\begin_layout Standard
	94	\align center
	95	Zaměření: Softwarové inženýrství
	96	\end_layout
	97
	98	\begin_layout Standard
	99	\begin_inset VSpace bigskip
	100	\end_inset
	101
	102
	103	\end_layout
	104
	105	\begin_layout Standard
	106	\align center
	107	\begin_inset Graphics
	108	filename logo_cvut.eps
	109	lyxscale 20
	110	scale 20
	111
	112	\end_inset
	113
	114
	115	\end_layout
	116
	117	\begin_layout Standard
	118	\begin_inset VSpace bigskip
	119	\end_inset
	120
	121
	122	\end_layout
	123
	124	\begin_layout Standard
	125	\align center
	126
	127	\size larger
	128	\color black
	129	Iterativní lokální dynamické programování pro návrh duálního řízení
	130	\end_layout
	131
	132	\begin_layout Standard
	133	\begin_inset VSpace smallskip
	134	\end_inset
	135
	136
	137	\end_layout
	138
	139	\begin_layout Standard
	140	\align center
	141
	142	\size larger
	143	\color black
	144	Iterative local dynamic programming for dual control
	145	\end_layout
	146
	147	\begin_layout Standard
	148	\begin_inset VSpace bigskip
	149	\end_inset
	150
	151
	152	\end_layout
	153
	154	\begin_layout Standard
	155	\align center
	156
	157	\size largest
	158	\color black
	159	BAKALÁŘSKÁ
	160	\size larger
	161
	162	\size largest
	163	PRÁCE
	164	\end_layout
	165
	166	\begin_layout Standard
	167	\begin_inset VSpace vfill
	168	\end_inset
	169
	170
	171	\end_layout
	172
	173	\begin_layout Standard
	174	\align center
	175	Vypracoval: Michal Vahala
	176	\end_layout
	177
	178	\begin_layout Standard
	179	\align center
	180	Vedoucí práce: Ing.
	181	Václav Šmídl, Ph.D.
	182	\end_layout
	183
	184	\begin_layout Standard
	185	\align center
	186	Rok: 2010
	187	\end_layout
	188
	189	\begin_layout Standard
	190	\begin_inset Newpage newpage
	191	\end_inset
	192
	193
	194	\end_layout
	195
	196	\begin_layout Standard
	197	\begin_inset ERT
	198	status open
	199
	200	\begin_layout Plain Layout
	201
	202
	203	\backslash
	204	thispagestyle{empty}
	205	\end_layout
	206
	207	\end_inset
	208
	209
	210	\end_layout
	211
	212	\begin_layout Standard
	213	zadání práce
	214	\end_layout
	215
	216	\begin_layout Standard
	217	\begin_inset Newpage newpage
	218	\end_inset
	219
	220
	221	\end_layout
	222
	223	\begin_layout Standard
	224	\begin_inset ERT
	225	status open
	226
	227	\begin_layout Plain Layout
	228
	229
	230	\backslash
	231	thispagestyle{empty}~
	232	\end_layout
	233
	234	\end_inset
	235
	236
	237	\end_layout
	238
	239	\begin_layout Standard
	240	\begin_inset VSpace vfill
	241	\end_inset
	242
	243
	244	\end_layout
	245
	246	\begin_layout Subsubsection*
	247	Prohlášení
	248	\end_layout
	249
	250	\begin_layout Standard
	251	Prohlašuji, že jsem svou bakalářskou práci vypracoval samostatně a použil
	252	jsem pouze podklady uvedené v přiloženém seznamu.
	253	\end_layout
	254
	255	\begin_layout Standard
	256	\begin_inset VSpace bigskip
	257	\end_inset
	258
	259
	260	\end_layout
	261
	262	\begin_layout Standard
	263	\noindent
	264	\align left
	265	V Praze dne \SpecialChar \ldots{}
	266	\SpecialChar \ldots{}
	267	\SpecialChar \ldots{}
	268	\SpecialChar \ldots{}
	269	\SpecialChar \ldots{}
	270
	271	\begin_inset space \hfill{}
	272	\end_inset
	273
	274	\SpecialChar \ldots{}
	275	\SpecialChar \ldots{}
	276	\SpecialChar \ldots{}
	277	\SpecialChar \ldots{}
	278	\SpecialChar \ldots{}
	279	\SpecialChar \ldots{}
	280
	281	\end_layout
	282
	283	\begin_layout Standard
	284	\noindent
	285	\align block
	286	\begin_inset space \hfill{}
	287	\end_inset
	288
	289	Michal Vahala
	290	\begin_inset ERT
	291	status open
	292
	293	\begin_layout Plain Layout
	294
	295	~~
	296	\end_layout
	297
	298	\end_inset
	299
	300
	301	\end_layout
	302
	303	\begin_layout Standard
	304	\begin_inset Newpage newpage
	305	\end_inset
	306
	307
	308	\end_layout
	309
	310	\begin_layout Standard
	311	\begin_inset ERT
	312	status open
	313
	314	\begin_layout Plain Layout
	315
	316
	317	\backslash
	318	thispagestyle{empty}~
	319	\end_layout
	320
	321	\end_inset
	322
	323
	324	\end_layout
	325
	326	\begin_layout Standard
	327	\begin_inset VSpace vfill
	328	\end_inset
	329
	330
	331	\end_layout
	332
	333	\begin_layout Subsubsection*
	334	Poděkování
	335	\end_layout
	336
	337	\begin_layout Standard
	338	Děkuji \SpecialChar \ldots{}
	339	za \SpecialChar \ldots{}
	340
	341	\end_layout
	342
	343	\begin_layout Standard
	344	\begin_inset VSpace defskip
	345	\end_inset
	346
	347
	348	\end_layout
	349
	350	\begin_layout Standard
	351	\begin_inset space \hfill{}
	352	\end_inset
	353
	354	Michal Vahala
	355	\end_layout
	356
	357	\begin_layout Standard
	358	\begin_inset Newpage newpage
	359	\end_inset
	360
	361
	362	\end_layout
	363
	364	\begin_layout Standard
	365	\begin_inset ERT
	366	status open
	367
	368	\begin_layout Plain Layout
	369
	370
	371	\backslash
	372	thispagestyle{empty}
	373	\end_layout
	374
	375	\end_inset
	376
	377
	378	\end_layout
	379
	380	\begin_layout Description
	381
	382	\emph on
	383	Název
	384	\begin_inset space \space{}
	385	\end_inset
	386
	387	práce:
	388	\emph default
	389	\color black
	390
	391	\begin_inset ERT
	392	status open
	393
	394	\begin_layout Plain Layout
	395
	396	~
	397	\end_layout
	398
	399	\end_inset
	400
	401
	402	\begin_inset Newline newline
	403	\end_inset
	404
	405	Iterativní lokální dynamické programování pro návrh duálního řízení
	406	\end_layout
	407
	408	\begin_layout Description
	409	\begin_inset VSpace defskip
	410	\end_inset
	411
	412
	413	\end_layout
	414
	415	\begin_layout Description
	416
	417	\emph on
	418	Autor:
	419	\emph default
	420	Michal Vahala
	421	\end_layout
	422
	423	\begin_layout Description
	424
	425	\emph on
	426	Obor:
	427	\emph default
	428	Inženýrská informatika
	429	\end_layout
	430
	431	\begin_layout Description
	432
	433	\emph on
	434	Druh
	435	\begin_inset space \space{}
	436	\end_inset
	437
	438	práce:
	439	\emph default
	440	Bakalářská práce
	441	\end_layout
	442
	443	\begin_layout Description
	444
	445	\emph on
	446	Vedoucí
	447	\begin_inset space \space{}
	448	\end_inset
	449
	450	práce:
	451	\emph default
	452	Ing.
	453	Václav Šmídl, Ph.D.
	454	\end_layout
	455
	456	\begin_layout Description
	457
	458	\emph on
	459	Konzultant:
	460	\emph default
	461	---
	462	\end_layout
	463
	464	\begin_layout Description
	465
	466	\emph on
	467	Abstrakt:
	468	\emph default
	469	abstrakt
	470	\end_layout
	471
	472	\begin_layout Description
	473
	474	\emph on
	475	Klíčová
	476	\begin_inset space \space{}
	477	\end_inset
	478
	479	slova:
	480	\emph default
	481	klíčová slova
	482	\end_layout
	483
	484	\begin_layout Standard
	485	\begin_inset VSpace bigskip
	486	\end_inset
	487
	488
	489	\end_layout
	490
	491	\begin_layout Description
	492
	493	\emph on
	494	Title:
	495	\emph default
	496	\color black
	497
	498	\begin_inset ERT
	499	status open
	500
	501	\begin_layout Plain Layout
	502
	503	~
	504	\end_layout
	505
	506	\end_inset
	507
	508
	509	\begin_inset Newline newline
	510	\end_inset
	511
	512	Iterative local dynamic programming for dual control
	513	\end_layout
	514
	515	\begin_layout Description
	516	\begin_inset VSpace defskip
	517	\end_inset
	518
	519
	520	\end_layout
	521
	522	\begin_layout Description
	523
	524	\emph on
	525	Author:
	526	\emph default
	527	Michal Vahala
	528	\end_layout
	529
	530	\begin_layout Description
	531
	532	\emph on
	533	Abstract:
	534	\emph default
	535	abstrakt
	536	\end_layout
	537
	538	\begin_layout Description
	539
	540	\emph on
	541	Key
	542	\begin_inset space \space{}
	543	\end_inset
	544
	545	words:
	546	\emph default
	547	klíčová slova
	548	\end_layout
	549
	550	\begin_layout Standard
	551	\begin_inset Newpage newpage
	552	\end_inset
	553
	554
	555	\end_layout
	556
	557	\begin_layout Standard
	558	\begin_inset ERT
	559	status open
	560
	561	\begin_layout Plain Layout
	562
	563
	564	\backslash
	565	thispagestyle{empty}
	566	\end_layout
	567
	568	\end_inset
	569
	570
	571	\end_layout
	572
	573	\begin_layout Standard
	574	\begin_inset CommandInset toc
	575	LatexCommand tableofcontents
	576
	577	\end_inset
	578
	579
	580	\end_layout
	581
	582	\begin_layout Standard
	583	\begin_inset Newpage newpage
	584	\end_inset
	585
	586
	587	\end_layout
	588
	589	\begin_layout Standard
	590	\begin_inset ERT
	591	status open
	592
	593	\begin_layout Plain Layout
	594
	595
	596	\backslash
	597	thispagestyle{empty}
	598	\end_layout
	599
	600	\end_inset
	601
	602
	603	\end_layout
	604
	605	\begin_layout Chapter*
	606	Seznam použitého označení
	607	\end_layout
	608
	609	\begin_layout Labeling
	610	\labelwidthstring 00.00.0000
	611	iLDP iterativní lokální dynamické programování
	612	\end_layout
	613
	614	\begin_layout Labeling
	615	\labelwidthstring 00.00.0000
	616	LQG lineáně kvadraticky gaussovské řízení (Linear-Quadratic-Gaussian)
	617	\end_layout
	618
	619	\begin_layout Labeling
	620	\labelwidthstring 00.00.0000
	621	iLQG iterativní LQG
	622	\end_layout
	623
	624	\begin_layout Labeling
	625	\labelwidthstring 00.00.0000
	626
	627	\color red
	628	DDP
	629	\color inherit
	630	diferenciální dynamické programování
	631	\end_layout
	632
	633	\begin_layout Standard
	634	\begin_inset Newpage newpage
	635	\end_inset
	636
	637
	638	\end_layout
	639
	640	\begin_layout Addchap
	641	Úvod
	642	\end_layout
	643
	644	\begin_layout Standard
	645	Skutečný svět se nikdy nechová přesně podle matematických rovnic, protože
	646	ty jsou vždy jen jakýmsi zjednodušením nebo přiblížením.
	647	V reálném světě se vyskytuje mnoho neznámých veličin, poruch, nepředvídatelných
	648	vlivů a ani naše měřící přístroje nejsou přesné.
	649	Chceme-li efektivně řídit nějaký systém, musíme si být těchto vlivů vědomi
	650	a zahrnout je do našich uvažování.
	651	Situace se však ještě může zkomplikovat, když jeden nebo více parametrů
	652	neznáme.
	653	To může nastat z různých důvodů, například příšlušné čidlo nebo měřící
	654	přístroj nemůžeme nebo nechceme (například z důvodů vysoké ceny) instalovat
	655	a tedy o velikosti příslušné hodnoty můžeme jen usuzovat ze známých dat.
	656	Ještě složitější situace nastane, když uvažujeme neznámý parametr proměnný.
	657
	658	\end_layout
	659
	660	\begin_layout Standard
	661
	662	\color black
	663	Máme tedy dva cíle, musíme systém co nejlépe řídit a současně se snažit
	664	o co nejpřesnější určení neznámých parametrů.
	665	Tyto dva postupy jsou však obecně v rozporu, protože parametry se nejlépe
	666	určují, když je systém vybuzen a nechová se optimálně.
	667	Právě tento rozpor a nalezení kompromisu, který povede k jeho řešení, je
	668	podstatou duálního řízení.
	669	\end_layout
	670
	671	\begin_layout Standard
	672
	673	\color black
	674	Pro přiblížení ilustrujme problém na jednoduchém příkladě: Uvažujme elektromotor
	675	s možností řídit napětí na vstupu motoru a měřit příslušné proudy.
	676	Jedná se tedy o systém se dvěma vstupy a dvěma výstupy.
	677	Cílem našeho řízení je dosažení požadovaných otáček rotoru.
	678	Ovšem otáčky a ani polohu hřídele měřit nemůžeme.
	679	Máme o nich však znalost v podobě středních hodnot a variancí.
	680	Naší snahou je co nejpřesněji určit hodnotu otáček a polohy hřídele a současně
	681	systém řídit tak, abychom dosáhly požadované hodnoty otáček.
	682	Tyto dvě snahy jsou ale v rozporu, protože nejvíce informací o neznámých
	683	parametrech získáme, když je motor vybuzen.
	684	Tedy například se prudce rozjíždí, brzdí, rychle mění rychlost nebo kmitá,
	685	což se projevuje v proudech, které máme možnost měřit.
	686	Ale právě vybuzení motoru je v rozporu se snahou o dobré řízení, protože
	687	chyba, které se dopustíme je většinou nepřijatelná.
	688	Naopak, když se systém snažíme řídit, bez dostatečné znalosti jeho parametrů,
	689	s velkou pravděpodobností selžeme.
	690	\end_layout
	691
	692	\begin_layout Standard
	693	\begin_inset VSpace bigskip
	694	\end_inset
	695
	696
	697	\end_layout
	698
	699	\begin_layout Standard
	700	Námětem této bakalářské práce je algoritmus
	701	\emph on
	702	iterativního lokálního dynamického programování
	703	\emph default
	704	(iLDP) jako jedna z metod pro řešení problému duálního řízení.
	705	Algoritmus byl navržen a popsán v článku
	706	\color black
	707
	708	\begin_inset CommandInset citation
	709	LatexCommand cite
	710	key "TodorovTassaILDP"
	711
	712	\end_inset
	713
	714
	715	\color inherit
	716	.
	717	Jak už prozrazuje název algoritmu, jedná se o iterační metodu.
	718	Tedy stručně řečeno, algoritmus vyjde od nějakého počátečního řízení, které
	719	je ovšem nutno dodat jako apriorní informaci a v cyklech (iteracích) tuto
	720	řídící strategii vylepšuje, za účelem získání řízení optimálního.
	721	Dále se jedná o metodu lokální, což v můžeme jednoduše chápat tak, že kandidáti
	722	na
	723	\begin_inset Quotes gld
	724	\end_inset
	725
	726	vylepšení
	727	\begin_inset Quotes grd
	728	\end_inset
	729
	730	řízení jsou vybírání z jistého, zatím blíže nespecifikovaného, okolí původní
	731	řídící strategie.
	732	Nakonec algoritmus využívá obecné schéma dynamického programování, které
	733	bude blíže popsáno v dalším textu.
	734	\end_layout
	735
	736	\begin_layout Standard
	737	\begin_inset VSpace bigskip
	738	\end_inset
	739
	740
	741	\end_layout
	742
	743	\begin_layout Standard
	744	Cílem této práce bylo seznámit se s obecnou tématikou duálního řízení a
	745	detailněji s konkrétním algoritmem - iterativním lokálním dynamickým programová
	746	ním.
	747	Následně tento algoritmus implementovat a aplikovat na jednoduchý systém.
	748	Otestovat jeho funkčnost a schopnost řídit a to i v porovnání s jinými
	749	metodami a algoritmy.
	750
	751	\emph on
	752	\color blue
	753	Dále implementovat algoritmus iLDP pro složitější systém blíže praktické
	754	aplikaci, konkrétně se jedná o synchronní motor s permanentními magnety.
	755	Opět otestovat funkčnost a případně srovnat s dostupnými výsledky jiných
	756	řídících strategii.
	757
	758	\emph default
	759	\color inherit
	760	Na základě získaných výsledků posoudit výhody a nevýhody algoritmu a jeho
	761	použitelnost na další úlohy.
	762	\end_layout
	763
	764	\begin_layout Standard
	765	Hlavním přínosem práce je otestování vlastností algoritmu iLDP na jiných
	766	problémech, než pro které byla vyvinuta autory.
	767	Objevení kladů a záporů algoritmu a dále díky srovnání s jinými algoritmy
	768	získání přehledu, pro které praktické aplikace je vhodnější respektive
	769	méně vhodný než srovnávané metody.
	770	Prvotní očekávání pro srovnání algoritmu iLDP a
	771	\emph on
	772	\color blue
	773	principu separace
	774	\emph default
	775	\color inherit
	776	jsou, že iLDP bude rychlejší co do výpočetního času, avšak přesnost získaných
	777	výsledků bude nižší.
	778	Dále je očekávána nezanedbatelná závislost výsledného řízení na volbě použitých
	779	aproximací a apriorní řídící strategie.
	780	\end_layout
	781
	782	\begin_layout Standard
	783	\begin_inset Newpage newpage
	784	\end_inset
	785
	786
	787	\end_layout
	788
	789	\begin_layout Chapter
	790	Teorie duálního řízení
	791	\end_layout
	792
	793	\begin_layout Section
	794	Základní pojmy
	795	\end_layout
	796
	797	\begin_layout Subsection
	798	Systém a řízení
	799	\end_layout
	800
	801	\begin_layout Subsubsection
	802	Systém
	803	\end_layout
	804
	805	\begin_layout Standard
	806	Základním pojmem, se kterým budeme v textu pracovat je
	807	\emph on
	808	systém
	809	\emph default
	810	.
	811	Obdobně jako základní pojmy zejména v matematických vědách (bod, množina,
	812	algoritmus,\SpecialChar \ldots{}
	813	), nelze tento pojem exaktně definovat.
	814	Systém si můžeme představit jako jistý
	815	\begin_inset Quotes gld
	816	\end_inset
	817
	818	objekt
	819	\begin_inset Quotes grd
	820	\end_inset
	821
	822	, často bude reprezentovat objekt skutečného světa.
	823	Hlavní vlastností systému je, že má zpravidla jeden nebo více vstupů, pomocí
	824	kterých mu můžeme předávat informaci -- řízení a jeden nebo více výstupu,
	825	což jsou hodnyty, které pozorujeme.
	826	Co se odehrává uvnitř systému však obecně nevíme.
	827	Řízení, které budeme dodávat systému na vstup bude v textu značeno písmenem
	828
	829	\emph on
	830
	831	\begin_inset Formula $u$
	832	\end_inset
	833
	834
	835	\emph default
	836	.
	837	Analogicky bude písmenem
	838	\emph on
	839
	840	\begin_inset Formula $y$
	841	\end_inset
	842
	843
	844	\emph default
	845	označena pozorovaná hodnota na výstupu.
	846
	847	\end_layout
	848
	849	\begin_layout Standard
	850	Chování systému, to je jakým výstupem reaguje na vstup, popisujeme dle
	851	\begin_inset CommandInset citation
	852	LatexCommand cite
	853	key "MelicharLS"
	854
	855	\end_inset
	856
	857	obecně diferenciální rovnicí respektive soustavou diferenciálních rovnic
	858	vyšších řádů.
	859	Jedná se o takzvaný
	860	\color black
	861	vnější popis
	862	\color inherit
	863	.
	864	Tento druh popisu, pohlíží na systém
	865	\begin_inset Quotes gld
	866	\end_inset
	867
	868	zvenku
	869	\begin_inset Quotes grd
	870	\end_inset
	871
	872	bez skutečné znalosti, co se odehrává uvnitř systému a jaká je jeho podstata.
	873	Vnější popis obvykle obdržíme při odvození modelu systému z fyzikálních
	874	rovnic.
	875	Omezení, která z něj plynou, se snažíme odstranit zavedením
	876	\color black
	877	vnitřního (stavového) popisu
	878	\color inherit
	879	, kdy (soustavu) diferenciálních rovnic vyššího řádu, převedeme vhodnou
	880	volbou nových proměnných
	881	\emph on
	882
	883	\begin_inset Formula $x$
	884	\end_inset
	885
	886
	887	\series bold
	888
	889	\series default
	890	\emph default
	891	na soustavu diferenciálních rovnic prvního řádu.
	892	Proměnné
	893	\emph on
	894
	895	\begin_inset Formula $x$
	896	\end_inset
	897
	898
	899	\series bold
	900
	901	\series default
	902	\emph default
	903	označujeme jako
	904	\color black
	905	stavové proměnné
	906	\color inherit
	907	.
	908	\end_layout
	909
	910	\begin_layout Subsubsection
	911	Řízení
	912	\end_layout
	913
	914	\begin_layout Standard
	915	Naším úkolem je pro zadaný systém nalézt regulátor, tedy obecně řízení
	916	\emph on
	917
	918	\begin_inset Formula $u$
	919	\end_inset
	920
	921
	922	\emph default
	923	takové, které dodané na vstup způsobí, že systém se bude
	924	\begin_inset Quotes gld
	925	\end_inset
	926
	927	chovat podle našich požadavků
	928	\begin_inset Quotes grd
	929	\end_inset
	930
	931	.
	932	To zpravidla znamená, že hodnoty výstupní veličiny
	933	\series bold
	934	\emph on
	935
	936	\begin_inset Formula $y$
	937	\end_inset
	938
	939
	940	\series default
	941	\emph default
	942	dosáhnou (nebo se přiblíží s danou přesností) požadované hodnotě v podobě
	943	referenčního signálu, který regulátor dostavá z vnějšku a současně dodrží
	944	předem stanovená omezení.
	945	Práce je ovšem zaměřena na řízení složitějších systémů, u kterých jeden
	946	nebo více parametrů neznáme přesně.
	947	Tedy některý (více) z koeficientů v rovnicích popisujících systém není
	948	znám.
	949	Máme však o něm jistou statistickou informaci v podob
	950	\color black
	951	ě jeho
	952	\color inherit
	953	očekávané hodnoty a variance.
	954	Dále je-li systém nelineární, jsou výsledné rovnice příliš složité a tedy
	955	analyticky neřešitelné.
	956	Pro numerické řešení, jsou rovnice systému zpravidla převáděny do diskrétního
	957	tvaru.
	958	\end_layout
	959
	960	\begin_layout Standard
	961	Řízení obecně dělíme podle
	962	\begin_inset CommandInset citation
	963	LatexCommand cite
	964	key "MelicharLS"
	965
	966	\end_inset
	967
	968	na dva typy:
	969	\emph on
	970	Přímovazební řízení
	971	\emph default
	972	užíváme v případě, kde je k dispozici přesný matematický model systému
	973	a je vyloučen výskyt neurčitostí.
	974	Toto řízení nevyužívá žádné zpětné informace od systému a regulátor pracuje
	975	pouze s referenčním signálem.
	976	Naproti tomu
	977	\emph on
	978	zpětnovazební řízení
	979	\emph default
	980	využívá i informace o skutečném výstupu systému a snaží se tak eliminovat
	981	chyby v důsledku neurčitostí a chyb způsobenych nepřesností modelu.
	982	\end_layout
	983
	984	\begin_layout Subsubsection
	985	Duální řízení
	986	\end_layout
	987
	988	\begin_layout Standard
	989	Chceme navrhnout regulátor pro zadaný systém s neznámými parametry.
	990	Úkoly jsou tedy dva: 1.
	991
	992	\emph on
	993	opatrnost
	994	\emph default
	995	- efektivně systém řídit a 2.
	996
	997	\emph on
	998	testování
	999	\emph default
	1000	- určit neznáme parametry.
	1001	Tyto dva přístupy jsou ale obecně v rozporu.
	1002	Abychom mohli systém dobře řídit, potřebujeme znát parametry co nejpřesněji.
	1003	Nejvíce informací o parametrech však získáme, když je systém vybuzen a
	1004	nechová optimálně.
	1005	Tyto pojmy není snadné kvantifikovat, ale velmi často se projevují v konkrétníc
	1006	h řídících schématech.
	1007	Naším úkolem je pokusit nalézt nějaký kompromis mezi oběma úkoly.
	1008	Právě tento přístup je označován jako
	1009	\emph on
	1010	duální řízení
	1011	\emph default
	1012
	1013	\begin_inset CommandInset citation
	1014	LatexCommand cite
	1015	key "BertsekasDPOC"
	1016
	1017	\end_inset
	1018
	1019	.
	1020
	1021	\end_layout
	1022
	1023	\begin_layout Subsection
	1024	Formulace problému
	1025	\end_layout
	1026
	1027	\begin_layout Standard
	1028	V textu budeme pracovat zpravidla s diskrétním systémem, ve smyslu systému
	1029	s diskrétním časem, protože výpočty jsou prováděny ve většině případů problemat
	1030	iky duálního řízení numericky.
	1031	Rovnice popisující systém jsou však zpravidla ve spojitém tvaru, (model
	1032	často vychází ze skutečnosti, popřípadě fyzikálních zákonů).
	1033	V tomto případě provádíme diskretizaci.
	1034	\end_layout
	1035
	1036	\begin_layout Standard
	1037	Základní problém je formulován podle
	1038	\begin_inset CommandInset citation
	1039	LatexCommand cite
	1040	key "BertsekasDPOC"
	1041
	1042	\end_inset
	1043
	1044	následovně:
	1045	\end_layout
	1046
	1047	\begin_layout Standard
	1048	\begin_inset VSpace defskip
	1049	\end_inset
	1050
	1051
	1052	\end_layout
	1053
	1054	\begin_layout Standard
	1055	Uvažujme stavový popis diskrétního dynamického systému
	1056	\begin_inset Formula \begin{equation}
	1057	\begin{array}{cc}
	1058	x_{k+1}=f_{k}(x_{k},u_{k},w_{k}), & k=0,\ldots,N-1\end{array},\label{eq:zakladniproblem}\end{equation}
	1059
	1060	\end_inset
	1061
	1062	kde
	1063	\begin_inset Formula $x_{k}$
	1064	\end_inset
	1065
	1066	je stavová proměná z prostoru
	1067	\begin_inset Formula $S_{k}$
	1068	\end_inset
	1069
	1070	,
	1071	\begin_inset Formula $u_{k}$
	1072	\end_inset
	1073
	1074	řízení z prostoru
	1075	\begin_inset Formula $C_{k}$
	1076	\end_inset
	1077
	1078	a
	1079	\begin_inset Formula $w_{k}$
	1080	\end_inset
	1081
	1082	náhodná porucha z prostoru
	1083	\begin_inset Formula $D_{k}$
	1084	\end_inset
	1085
	1086	, vše v čase
	1087	\begin_inset Formula $k$
	1088	\end_inset
	1089
	1090	při celkovém časovém horizontu
	1091	\begin_inset Formula $N$
	1092	\end_inset
	1093
	1094	.
	1095	Na řízení
	1096	\begin_inset Formula $u_{k}$
	1097	\end_inset
	1098
	1099	klademe omezení, že může nabývat pouze hodnot z neprázdné podmonožiny
	1100	\begin_inset Formula $U_{k}(x_{k})\subset C_{k}$
	1101	\end_inset
	1102
	1103	závislé na stavu
	1104	\begin_inset Formula $x_{k}$
	1105	\end_inset
	1106
	1107	.
	1108	Náhodná porucha
	1109	\begin_inset Formula $w_{k}$
	1110	\end_inset
	1111
	1112	je charakterizována rozdělením pravděpodobnosti
	1113	\begin_inset Formula $P_{k}$
	1114	\end_inset
	1115
	1116	, které může explicitně záviset na
	1117	\begin_inset Formula $x_{k}$
	1118	\end_inset
	1119
	1120	a
	1121	\begin_inset Formula $u_{k}$
	1122	\end_inset
	1123
	1124	, ne však na předchozích poruchách
	1125	\begin_inset Formula $w_{k-1},\ldots,w_{0}$
	1126	\end_inset
	1127
	1128	.
	1129	\end_layout
	1130
	1131	\begin_layout Standard
	1132	Dále uvažujme množinu řízení, jedná se o posloupnost funkcí
	1133	\begin_inset Formula \[
	1134	\pi=\{\mu_{0},\ldots,\mu_{N-1}\},\]
	1135
	1136	\end_inset
	1137
	1138	kde
	1139	\begin_inset Formula $\mu_{k}$
	1140	\end_inset
	1141
	1142	přiřazuje stavu
	1143	\begin_inset Formula $x_{k}$
	1144	\end_inset
	1145
	1146	přípustné řízení
	1147	\begin_inset Formula $u_{k}=\mu_{k}(x_{k})$
	1148	\end_inset
	1149
	1150	, to je takové, že
	1151	\begin_inset Formula $\mu_{k}(x_{k})\in U_{k}(x_{k})$
	1152	\end_inset
	1153
	1154	, množinu přípustných řešení označme
	1155	\begin_inset Formula $\Pi$
	1156	\end_inset
	1157
	1158	.
	1159	Máme-li dány počáteční stav
	1160	\begin_inset Formula $x_{0}$
	1161	\end_inset
	1162
	1163	a přípustné řešení
	1164	\begin_inset Formula $\pi$
	1165	\end_inset
	1166
	1167	můžeme stavy
	1168	\begin_inset Formula $x_{k}$
	1169	\end_inset
	1170
	1171	a poruchy
	1172	\begin_inset Formula $w_{k}$
	1173	\end_inset
	1174
	1175	považovat za náhodné veličiny s rozdělemím definovaným systémem rovnic
	1176
	1177	\begin_inset CommandInset ref
	1178	LatexCommand ref
	1179	reference "eq:zakladniproblem"
	1180
	1181	\end_inset
	1182
	1183	, kde za řízení
	1184	\begin_inset Formula $u_{k}$
	1185	\end_inset
	1186
	1187	dosadíme hodnotu funkce
	1188	\begin_inset Formula $\mu_{k}$
	1189	\end_inset
	1190
	1191	v
	1192	\begin_inset Formula $x_{k}$
	1193	\end_inset
	1194
	1195	.
	1196	\end_layout
	1197
	1198	\begin_layout Standard
	1199	Pro dané ztráty v jednotlivých časech -- funkce
	1200	\begin_inset Formula $g_{k}$
	1201	\end_inset
	1202
	1203	, pak definujeme očekávanou ztrátu
	1204	\begin_inset Formula $\pi$
	1205	\end_inset
	1206
	1207	v
	1208	\begin_inset Formula $x_{0}$
	1209	\end_inset
	1210
	1211	jako
	1212	\begin_inset Formula \[
	1213	J_{\pi}(x_{0})=\mathbf{E}\left\{ g_{N}(x_{N})+\sum_{k=0}^{N-1}g_{k}\left(x_{k},\mu_{k}(x_{k}),w_{k}\right)\right\} \]
	1214
	1215	\end_inset
	1216
	1217	kde je očekávaná hodnota počítána přes náhodné veličiny
	1218	\begin_inset Formula $w_{k}$
	1219	\end_inset
	1220
	1221	a
	1222	\begin_inset Formula $x_{k}$
	1223	\end_inset
	1224
	1225	.
	1226	Optimální řízení
	1227	\begin_inset Formula $\pi^{*}$
	1228	\end_inset
	1229
	1230	je právě to, které minimalizuje ztrátu
	1231	\begin_inset Formula \[
	1232	J_{\pi^{*}}(x_{0})=\min_{\pi\in\Pi}J_{\pi}(x_{0}).\]
	1233
	1234	\end_inset
	1235
	1236	Optimální ztrátu označme
	1237	\begin_inset Formula $J^{*}(x_{0})$
	1238	\end_inset
	1239
	1240	.
	1241	\end_layout
	1242
	1243	\begin_layout Subsection
	1244	Dynamické programování
	1245	\end_layout
	1246
	1247	\begin_layout Standard
	1248	Dynamické programovní dle
	1249	\begin_inset CommandInset citation
	1250	LatexCommand cite
	1251	key "ViriusZA"
	1252
	1253	\end_inset
	1254
	1255	je jedním ze způsobů návrhu algoritmů pro řešení jistých typu optimalizačních
	1256	problémů.
	1257	Konkrétně se uplatňuje v případě, že jde o diskrétní optimalizační úlohu,
	1258	na řešení daného problému můžeme nahlížet jako na konečnou posloupnost
	1259	rozhodnutí a platí
	1260	\emph on
	1261	princip optimality
	1262	\emph default
	1263	.
	1264	\end_layout
	1265
	1266	\begin_layout Subsubsection
	1267	Princip optimality
	1268	\end_layout
	1269
	1270	\begin_layout Standard
	1271	říká, že optimální posloupnost rozhodnutí musí mít následující vlastnost:
	1272
	1273	\emph on
	1274	Jestliže jsme už udělali
	1275	\emph default
	1276	k
	1277	\emph on
	1278	rozhodnutí, musí být všechna následující rozhodnutí optimální vzhledem k
	1279	výsledkům rozhodnutí předchozích, jinak nemůžeme dostat optimální řešení
	1280
	1281	\emph default
	1282
	1283	\begin_inset CommandInset citation
	1284	LatexCommand cite
	1285	key "ViriusZA"
	1286
	1287	\end_inset
	1288
	1289
	1290	\emph on
	1291	.
	1292	\end_layout
	1293
	1294	\begin_layout Subsubsection
	1295	Princip optimality v teorii řízení
	1296	\end_layout
	1297
	1298	\begin_layout Standard
	1299	Nechť
	1300	\begin_inset Formula $\pi^{}=\left\{ \mu_{0}^{},\mu_{1}^{},\ldots,\mu_{N-1}^{}\right\} $
	1301	\end_inset
	1302
	1303	je optimální řídící strategie pro
	1304	\color black
	1305	základní
	1306	\color inherit
	1307	problém a předpokládejme, že když aplikujeme řízení
	1308	\begin_inset Formula $\pi^{*}$
	1309	\end_inset
	1310
	1311	, daný stav
	1312	\begin_inset Formula $x_{i}$
	1313	\end_inset
	1314
	1315	se vyskytne v čase
	1316	\begin_inset Formula $i$
	1317	\end_inset
	1318
	1319	s pozitivní pravděpodobností.
	1320	Uvažujme podproblém, kdy ve stavu
	1321	\begin_inset Formula $x_{i}$
	1322	\end_inset
	1323
	1324	a čase
	1325	\begin_inset Formula $i$
	1326	\end_inset
	1327
	1328	chceme minimalizovat
	1329	\emph on
	1330	náklady na pokračování
	1331	\emph default
	1332	(v anglické literatuře označováno jako
	1333	\color black
	1334
	1335	\begin_inset Quotes gld
	1336	\end_inset
	1337
	1338	cost-to-go
	1339	\color inherit
	1340
	1341	\begin_inset Quotes grd
	1342	\end_inset
	1343
	1344	) od času
	1345	\begin_inset Formula $i$
	1346	\end_inset
	1347
	1348	do
	1349	\begin_inset Formula $N$
	1350	\end_inset
	1351
	1352
	1353	\begin_inset Formula \[
	1354	\mathbf{E}\left\{ g_{N}(x_{N})+\sum_{k=i}^{N-1}g_{k}(x_{k},\mu_{k}(x_{k}),w_{k})\right\} \]
	1355
	1356	\end_inset
	1357
	1358	Potom úsek strategie
	1359	\family roman
	1360	\series medium
	1361	\shape up
	1362	\size normal
	1363	\emph off
	1364	\bar no
	1365	\noun off
	1366	\color none
	1367
	1368	\begin_inset Formula $\left\{ \mu_{i}^{},\mu_{i+1}^{},\ldots,\mu_{N-1}^{*}\right\} $
	1369	\end_inset
	1370
	1371	je optimální pro tento podproblém.
	1372	\begin_inset VSpace medskip
	1373	\end_inset
	1374
	1375
	1376	\end_layout
	1377
	1378	\begin_layout Standard
	1379	Intuitivně je princip optimality velmi jednoduchý.
	1380	Jestliže úsek strategie
	1381	\begin_inset Formula $\left\{ \mu_{i}^{},\mu_{i+1}^{},\ldots,\mu_{N-1}^{*}\right\} $
	1382	\end_inset
	1383
	1384	nebude optimální, budeme schopni dále zredukovat cenu přechodem k optimální
	1385	strategii pro podproblém.
	1386	\end_layout
	1387
	1388	\begin_layout Standard
	1389	Princip optimality umožňuje optimální strategii konstruovat postupně.
	1390	Nejdříve nalezneme optimální strategii pro koncový podproblém zahrnující
	1391	poslední krok.
	1392	Poté rozšiřujeme podproblém od konce přidáním předposledního kroku a tak
	1393	dále.
	1394	Takto může být vytvořena optimální strategie pro celý problém.
	1395	\end_layout
	1396
	1397	\begin_layout Standard
	1398	Algoritmus dynamického programování je tedy založen na následující myšlence:
	1399	Algoritmus pracuje iterativně a řeší
	1400	\color black
	1401	koncové
	1402	\color inherit
	1403	podproblémy pro daný časový úsek, při tom využívá řešení předchozích
	1404	\color black
	1405	koncových
	1406	\color inherit
	1407	podproblémů pro kratší časové úseky.
	1408	Převzato z
	1409	\begin_inset CommandInset citation
	1410	LatexCommand cite
	1411	key "BertsekasDPOC"
	1412
	1413	\end_inset
	1414
	1415	.
	1416	\end_layout
	1417
	1418	\begin_layout Subsubsection
	1419	Formulace algoritmu dynamického programování
	1420	\end_layout
	1421
	1422	\begin_layout Standard
	1423	Podle
	1424	\begin_inset CommandInset citation
	1425	LatexCommand cite
	1426	key "BertsekasDPOC"
	1427
	1428	\end_inset
	1429
	1430	, pro každý počáteční stav
	1431	\begin_inset Formula $x_{0}$
	1432	\end_inset
	1433
	1434	, je optimální cena
	1435	\begin_inset Formula $J^{*}(x_{0})$
	1436	\end_inset
	1437
	1438	základního problému rovna
	1439	\begin_inset Formula $J_{0}(x_{0})$
	1440	\end_inset
	1441
	1442	, získané z posledního kroku následujícího algoritmu, který prochází zpět
	1443	časy od
	1444	\begin_inset Formula $N-1$
	1445	\end_inset
	1446
	1447	do
	1448	\begin_inset Formula $0$
	1449	\end_inset
	1450
	1451	:
	1452	\begin_inset Formula \[
	1453	J_{N}(x_{N})=g_{N}(x_{N})\]
	1454
	1455	\end_inset
	1456
	1457
	1458	\end_layout
	1459
	1460	\begin_layout Standard
	1461	\begin_inset Formula \begin{equation}
	1462	J_{k}(x_{k})=\min_{u_{k}\in U_{k}(x_{k})w_{k}}\mathbf{E}\left\{ g_{k}(x_{k},u_{k},w_{k})+J_{k+1}(f_{k}(x_{k},u_{k},w_{k}))\right\} \label{eq:Jkeqmin}\end{equation}
	1463
	1464	\end_inset
	1465
	1466
	1467	\begin_inset Formula \[
	1468	k=0,1,\ldots,N-1\]
	1469
	1470	\end_inset
	1471
	1472
	1473	\end_layout
	1474
	1475	\begin_layout Standard
	1476	kde je očekávaná hodnota počítána podle náhodné veličiny
	1477	\begin_inset Formula $w_{k}$
	1478	\end_inset
	1479
	1480	, která obecně závisí na
	1481	\begin_inset Formula $x_{k}$
	1482	\end_inset
	1483
	1484	a
	1485	\begin_inset Formula $u_{k}$
	1486	\end_inset
	1487
	1488	.
	1489	Dále, když
	1490	\begin_inset Formula $u_{k}^{}=\mu_{k}^{}(x_{k})$
	1491	\end_inset
	1492
	1493	minimalizuje pravou stranu rovnice
	1494	\begin_inset CommandInset ref
	1495	LatexCommand eqref
	1496	reference "eq:Jkeqmin"
	1497
	1498	\end_inset
	1499
	1500	pro každé
	1501	\begin_inset Formula $x_{k}$
	1502	\end_inset
	1503
	1504	a
	1505	\begin_inset Formula $k$
	1506	\end_inset
	1507
	1508	, stretegie
	1509	\begin_inset Formula $\pi=\left\{ \mu_{1}^{},\ldots,\mu_{N-1}^{*}\right\} $
	1510	\end_inset
	1511
	1512	je optimální.
	1513	\begin_inset VSpace medskip
	1514	\end_inset
	1515
	1516
	1517	\end_layout
	1518
	1519	\begin_layout Standard
	1520	Hodnotu
	1521	\begin_inset Formula $J_{k}(x_{k})$
	1522	\end_inset
	1523
	1524	je možno interpretovat jako optimální cenu pro
	1525	\emph on
	1526
	1527	\begin_inset Formula $(N-k)$
	1528	\end_inset
	1529
	1530
	1531	\emph default
	1532	-tý krok problému začínajícího ve stavu
	1533	\begin_inset Formula $x_{k}$
	1534	\end_inset
	1535
	1536	a čase
	1537	\begin_inset Formula $k$
	1538	\end_inset
	1539
	1540	, a končícího v čase
	1541	\begin_inset Formula $N$
	1542	\end_inset
	1543
	1544	.
	1545	Následně označujeme
	1546	\begin_inset Formula $J_{k}(x_{k})$
	1547	\end_inset
	1548
	1549	náklady na pokračování (
	1550	\color black
	1551
	1552	\begin_inset Quotes gld
	1553	\end_inset
	1554
	1555	cost-to-go
	1556	\color inherit
	1557
	1558	\begin_inset Quotes grd
	1559	\end_inset
	1560
	1561	) ve stavu
	1562	\begin_inset Formula $x_{k}$
	1563	\end_inset
	1564
	1565	a čase
	1566	\begin_inset Formula $k$
	1567	\end_inset
	1568
	1569	, a
	1570	\begin_inset Formula $J_{k}$
	1571	\end_inset
	1572
	1573	označujeme jako funkci nákladů na pokračování (
	1574	\color black
	1575
	1576	\begin_inset Quotes gld
	1577	\end_inset
	1578
	1579	cost-to-go
	1580	\color inherit
	1581	function
	1582	\begin_inset Quotes grd
	1583	\end_inset
	1584
	1585	) v čase
	1586	\begin_inset Formula $k$
	1587	\end_inset
	1588
	1589	.
	1590
	1591	\end_layout
	1592
	1593	\begin_layout Standard
	1594	Ideálně bychom chtěli využít algoritmus dynamického programování k získání
	1595
	1596	\begin_inset Formula $J_{k}$
	1597	\end_inset
	1598
	1599	vyjádřené v uzavřeném tvaru nebo k získání optimální strategie.
	1600	Existuje mnoho případů, kdy je daná úloha řešitelná analyticky, obzvláště
	1601	za zjednodušujících předpokladů.
	1602	To je velmi užitečné zejména pro lepší náhled do problematiky a jako vodítko
	1603	pro složitější modely.
	1604	Avšak ve většíně případů není analytické řešení možné, pak je třeba použít
	1605	numerické řešení pomocí algoritmu dynamického programování.
	1606	Tento přístup může být časově velmi náročný, zejména minimalizaci v rovnici
	1607
	1608	\begin_inset CommandInset ref
	1609	LatexCommand eqref
	1610	reference "eq:Jkeqmin"
	1611
	1612	\end_inset
	1613
	1614	je třeba provést pro každou hodnotu
	1615	\begin_inset Formula $x_{k}$
	1616	\end_inset
	1617
	1618	.
	1619	Stavový prostor musí být diskretizován, nejedná-li se o konečnou množinu
	1620	a výpočetní nároky pak narůstají proporcionálně k počtu možných hodnot
	1621
	1622	\begin_inset Formula $x_{k}$
	1623	\end_inset
	1624
	1625	.
	1626	Nicméně dynamické programování je pouze obecný přístup pro iterativní optimaliz
	1627	aci při uvažování nejistoty v systému.
	1628	\end_layout
	1629
	1630	\begin_layout Subsection
	1631	Úplná a neúplná stavová informace
	1632	\end_layout
	1633
	1634	\begin_layout Standard
	1635	V optimálním případě by bylo možno měřit všechny stavové veličiny systému
	1636	a na jejich základě libovolným způsobem upravovat jeho dynamické vlastnosti.
	1637	Ve skutečnosti ale zpravidla není možné všechny stavy změřit a musíme se
	1638	rozhodovat pouze na základě informací, které máme k dispozici, pak mluvíme
	1639	o
	1640	\emph on
	1641	neúplné informaci o stavu systému
	1642	\emph default
	1643
	1644	\begin_inset CommandInset citation
	1645	LatexCommand cite
	1646	key "StechaTDS,BertsekasDPOC"
	1647
	1648	\end_inset
	1649
	1650	.
	1651	Může to být způsobeno například nedostupností hodnot některých stavů, použité
	1652	měřící přístroje mohou být nepřesné nebo náklady na získání přesné hodnoty
	1653	stavu mohou být příliš omezující.
	1654	Případy tohoto typu modelujeme zpravidla tak, že v každém kroku regulátor
	1655	obdrží jisté pozorování skutečné hodnoty stavu, které ovšem může být ovlivněno
	1656	a narušeno stochastickou nejistotou.
	1657	Teoreticky se však problém s neúplnou informací o stavu neodlišuje od úloh
	1658	s úplnou stavovou informací, protože existují způsoby, jak převést (redukovat)
	1659	systém s neúplnou informací na systém s úplnou.
	1660	Tyto postupy obecně vedou na algoritmy využívající dynamické programování,
	1661	ale jsou výpočetně mnohem náročnější, než v případě úplné informace.
	1662	Dva možné postupy redukce převzaté z
	1663	\begin_inset CommandInset citation
	1664	LatexCommand cite
	1665	key "BertsekasDPOC"
	1666
	1667	\end_inset
	1668
	1669	budou následovat po formulaci problému:
	1670	\end_layout
	1671
	1672	\begin_layout Subsubsection
	1673	Formulace problému s neúplnou informací o stavu
	1674	\end_layout
	1675
	1676	\begin_layout Standard
	1677	Nejdříve formulujme základní problém s neúplnou stavovou informací, který
	1678	následně redukujeme na systém s informací úplnou.
	1679	Uvažujme rozšíření základního problému
	1680	\begin_inset CommandInset ref
	1681	LatexCommand ref
	1682	reference "eq:zakladniproblem"
	1683
	1684	\end_inset
	1685
	1686	, kde ale regulátor, namísto přístupu ke stavu systému, získává pouze pozorování
	1687
	1688	\begin_inset Formula $z_{k}$
	1689	\end_inset
	1690
	1691	ve tvaru
	1692	\begin_inset Formula \begin{equation}
	1693	z_{0}=h_{0}(x_{0},v_{0}),\quad z_{k}=h_{k}(x_{k},u_{k-1},v_{k}),\quad k=1,2,\ldots,N-1,\label{eq:zaklprobneuplnystav}\end{equation}
	1694
	1695	\end_inset
	1696
	1697	kde
	1698	\begin_inset Formula $v_{k}$
	1699	\end_inset
	1700
	1701	reprezentuje náhodnou poruchu pozorování charakterizovanou rozdělením pravděpod
	1702	obnosti
	1703	\begin_inset Formula $P_{v_{k}}$
	1704	\end_inset
	1705
	1706	, která závisí na současném stavu a všech předchozích stavech, řízeních
	1707	a poruchách.
	1708	Dále také počáteční stav
	1709	\begin_inset Formula $x_{0}$
	1710	\end_inset
	1711
	1712	považujeme za náhodnou veličinu s rozdělením
	1713	\begin_inset Formula $P_{x_{0}}$
	1714	\end_inset
	1715
	1716	.
	1717	\end_layout
	1718
	1719	\begin_layout Standard
	1720	Soubor informací dostupných regulátoru v čase
	1721	\begin_inset Formula $k$
	1722	\end_inset
	1723
	1724	označme
	1725	\begin_inset Formula $I_{k}$
	1726	\end_inset
	1727
	1728	informačním vektorem.
	1729	Tedy
	1730	\begin_inset Formula \begin{eqnarray*}
	1731	I_{k} & = & (z_{0},\ldots,z_{k},u_{0},\ldots,u_{k-1}),\quad k=1,\ldots,N-1,\\
	1732	I_{0} & = & z_{0}.\end{eqnarray*}
	1733
	1734	\end_inset
	1735
	1736	Uvažujme množinu přípustných řízení jako posloupnost funkcí
	1737	\begin_inset Formula $\pi=\{\mu_{0},\ldots,\mu_{N-1}\}$
	1738	\end_inset
	1739
	1740	, kde každá funkce
	1741	\begin_inset Formula $\mu_{k}$
	1742	\end_inset
	1743
	1744	přiřazuje informačnímu vektoru
	1745	\begin_inset Formula $I_{k}$
	1746	\end_inset
	1747
	1748	řízení
	1749	\begin_inset Formula $\mu_{k}(I_{k})\in U_{k}$
	1750	\end_inset
	1751
	1752	, pro všechna
	1753	\begin_inset Formula $I_{k}$
	1754	\end_inset
	1755
	1756	, kde
	1757	\begin_inset Formula $k=0,\ldots,N-1$
	1758	\end_inset
	1759
	1760	.
	1761	Chceme najít přípustnou řídící strategii, to jest posloupnost
	1762	\begin_inset Formula $\pi$
	1763	\end_inset
	1764
	1765	, která minimalizuje očekávanou ztrátu
	1766	\begin_inset Formula \[
	1767	J_{\pi}=\mathbf{E}\left\{ g_{N}(x_{N})+\sum_{k=0}^{N-1}g_{k}\left(x_{k},\mu_{k}(I_{k}),w_{k}\right)\right\} ,\]
	1768
	1769	\end_inset
	1770
	1771	kde je očekávaná hodnota počítána přes náhodné veličiny
	1772	\begin_inset Formula $x_{0}$
	1773	\end_inset
	1774
	1775	a
	1776	\begin_inset Formula $w_{k},v_{k}$
	1777	\end_inset
	1778
	1779	pro
	1780	\begin_inset Formula $k=0,\ldots,N-1$
	1781	\end_inset
	1782
	1783	.
	1784	Veličiny
	1785	\begin_inset Formula $x_{k}$
	1786	\end_inset
	1787
	1788	a
	1789	\begin_inset Formula $z_{k}$
	1790	\end_inset
	1791
	1792	se vypočítají z rovnic
	1793	\begin_inset CommandInset ref
	1794	LatexCommand ref
	1795	reference "eq:zakladniproblem"
	1796
	1797	\end_inset
	1798
	1799	respektive
	1800	\begin_inset CommandInset ref
	1801	LatexCommand ref
	1802	reference "eq:zaklprobneuplnystav"
	1803
	1804	\end_inset
	1805
	1806	, přičemž v nich položíme
	1807	\begin_inset Formula $u_{k}=\mu_{k}(I_{k})$
	1808	\end_inset
	1809
	1810	.
	1811	\end_layout
	1812
	1813	\begin_layout Subsubsection
	1814	Redukce na systém s úplnou stavovou informací
	1815	\end_layout
	1816
	1817	\begin_layout Standard
	1818	Tento postup je založen na myšlence definovat nový systém, jehož stav v
	1819	čase
	1820	\begin_inset Formula $k$
	1821	\end_inset
	1822
	1823	je množina všech hodnot, kterých může využít regulátor při tvorbě řízení.
	1824	Jako stav nového systému tedy volíme informační vektor
	1825	\begin_inset Formula $I_{k}$
	1826	\end_inset
	1827
	1828	a získáme systém
	1829	\begin_inset Formula \begin{equation}
	1830	I_{k+1}=(I_{k,}z_{k+1},u_{k}),\quad I_{0}=z_{0},\quad k=0,\ldots,N-2.\label{eq:rednewsystem}\end{equation}
	1831
	1832	\end_inset
	1833
	1834	Na tento systém povahy základního problému s úplnou informací můžeme pohlížet
	1835	tak, že
	1836	\begin_inset Formula $I_{k}$
	1837	\end_inset
	1838
	1839	je stav.
	1840	Řízení
	1841	\begin_inset Formula $u_{k}$
	1842	\end_inset
	1843
	1844	a pozorování
	1845	\begin_inset Formula $z_{k}$
	1846	\end_inset
	1847
	1848	lze pak chápat jako náhodné poruchy.
	1849	Dále rozdělení pravděpodobnosti
	1850	\begin_inset Formula $z_{k+1}$
	1851	\end_inset
	1852
	1853	závisí explicitně pouze na stavu
	1854	\begin_inset Formula $I_{k}$
	1855	\end_inset
	1856
	1857	a řízení
	1858	\begin_inset Formula $u_{k}$
	1859	\end_inset
	1860
	1861	.
	1862	Ztrátovou funkci vyjádřenou pro nový systém je možno zapsat jako
	1863	\begin_inset Formula \[
	1864	\mathbf{E}\left\{ g_{k}\left(x_{k},u_{k},w_{k}\right)\right\} =\mathbf{E}\left\{ \mathbf{E}_{x_{k},w_{k}}\left\{ g_{k}\left(x_{k},u_{k},w_{k}\right)\mid I_{k},u_{k}\right\} \right\} .\]
	1865
	1866	\end_inset
	1867
	1868	Tedy ztráta během jednoho kroku vyjádřená jako funkce nového stavu
	1869	\begin_inset Formula $I_{k}$
	1870	\end_inset
	1871
	1872	a řízení
	1873	\begin_inset Formula $u_{k}$
	1874	\end_inset
	1875
	1876	je
	1877	\begin_inset Formula \begin{equation}
	1878	\tilde{g}_{k}(I_{k,}u_{k})=\mathbf{E}_{x_{k},w_{k}}\left\{ g_{k}\left(x_{k},u_{k},w_{k}\right)\mid I_{k},u_{k}\right\} .\label{eq:rednewztrata}\end{equation}
	1879
	1880	\end_inset
	1881
	1882	Původní základní problém s neúplnou stavovou informací byl tedy převeden
	1883	na úlohu s úplnou stavovou informací s rovnicí popisující systém
	1884	\begin_inset CommandInset ref
	1885	LatexCommand ref
	1886	reference "eq:rednewsystem"
	1887
	1888	\end_inset
	1889
	1890	a ztrátou během jednoho kroku
	1891	\begin_inset CommandInset ref
	1892	LatexCommand ref
	1893	reference "eq:rednewztrata"
	1894
	1895	\end_inset
	1896
	1897	.
	1898	Nyní je pro něj možno napsat algoritmus dynamického programování.
	1899
	1900	\color blue
	1901	(možná sem dát i rovnice DP)
	1902	\end_layout
	1903
	1904	\begin_layout Subsubsection
	1905	Postačující statistika
	1906	\end_layout
	1907
	1908	\begin_layout Standard
	1909	Při užití algoritmu dynamického programování za neúplné stavové informace
	1910	je hlavní problém v jeho vyhodnocování ve stavovém prostoru, jehož dimenze
	1911	neustále roste.
	1912	S každým dalším měřením dimenze stavu a tedy informační vektor
	1913	\begin_inset Formula $I_{k}$
	1914	\end_inset
	1915
	1916	narůstá, proto se snažíme redukovat množství dat skutečně potřebných pro
	1917	účely řízení.
	1918	Hledáme tedy popis známý jako
	1919	\emph on
	1920	postačující statistika
	1921	\emph default
	1922	, který bude mít menší dimenzi než
	1923	\begin_inset Formula $I_{k}$
	1924	\end_inset
	1925
	1926	ale současně zahrne veškerý důležitý obsah
	1927	\begin_inset Formula $I_{k}$
	1928	\end_inset
	1929
	1930	potřebný pro řízení.
	1931	Jako postačující statistiku označme funkci
	1932	\begin_inset Formula $S_{k}$
	1933	\end_inset
	1934
	1935	informačního vektoru
	1936	\begin_inset Formula $I_{k}$
	1937	\end_inset
	1938
	1939	, tedy
	1940	\begin_inset Formula $S_{k}(I_{k})$
	1941	\end_inset
	1942
	1943	takovou, že minimalizuje ztrátu v algoritmu dynamického programování přes
	1944	všechna přípustná řízení.
	1945	Což můžeme zapsat pro vhodnou funkci
	1946	\begin_inset Formula $H_{k}$
	1947	\end_inset
	1948
	1949	jako
	1950	\begin_inset Formula \begin{eqnarray*}
	1951	J_{k}(I_{k}) & = & \min_{u_{k}\in U_{k}}H_{k}(S_{k}(I_{k}),u_{k}).\end{eqnarray*}
	1952
	1953	\end_inset
	1954
	1955	Po funkci
	1956	\begin_inset Formula $S_{k}$
	1957	\end_inset
	1958
	1959	samozřejmě chceme, aby byla charakterizována menší množinou čísel, než
	1960	informační vektor
	1961	\begin_inset Formula $I_{k}$
	1962	\end_inset
	1963
	1964	, abychom získaly výhody z jejího použití.
	1965	Obecně existuje mnoho funkcí, které mohou sloužit jako postačující statistika.
	1966	Triviálním příkladem může být identita
	1967	\begin_inset Formula $S_{k}(I_{k})=I_{k}$
	1968	\end_inset
	1969
	1970	.
	1971
	1972	\end_layout
	1973
	1974	\begin_layout Standard
	1975	Závisí-li rozdělení pravděpodobnosti poruchy pozorování
	1976	\begin_inset Formula $v_{k}$
	1977	\end_inset
	1978
	1979	explicitně pouze na bezprostředně předcházejícím stavu, řízení a poruše
	1980	systému, tedy na
	1981	\begin_inset Formula $x_{k},u_{k},w_{k}$
	1982	\end_inset
	1983
	1984	a nezávisí na předchozích hodnotách
	1985	\begin_inset Formula $x_{k-1},\ldots,x_{0},u_{k-1},\ldots,u_{0},w_{k-1},\ldots,w_{0},v_{k-1},\ldots,v_{0}$
	1986	\end_inset
	1987
	1988	můžeme za postačující statistiku volit podmíněné rozdělení pravděpodobnosti
	1989
	1990	\begin_inset Formula $P_{x_{k}\|I_{k}}$
	1991	\end_inset
	1992
	1993	, o kterém lze ukázat (viz
	1994	\begin_inset CommandInset citation
	1995	LatexCommand cite
	1996	key "BertsekasDPOC"
	1997
	1998	\end_inset
	1999
	2000	), že
	2001	\begin_inset Formula \[
	2002	J_{k}(I_{k})=\min_{u_{k}\in U_{k}}H_{k}(P_{x_{k}\|I_{k}},u_{k})=\overline{J}_{k}(P_{x_{k}\|I_{k}}),\]
	2003
	2004	\end_inset
	2005
	2006	kde
	2007	\begin_inset Formula $H_{k}$
	2008	\end_inset
	2009
	2010	a
	2011	\begin_inset Formula $\overline{J}_{k}$
	2012	\end_inset
	2013
	2014	jsou vhodné funkce.
	2015	Optimální řízení pak získáme ve tvaru funkcí podmíněného rozdělení pravděpodobn
	2016	osti
	2017	\begin_inset Formula $\mu_{k}(I_{k})=\overline{\mu}_{k}(P_{x_{k}\|I_{k}})$
	2018	\end_inset
	2019
	2020	pro
	2021	\begin_inset Formula $k=0,\ldots,N-1$
	2022	\end_inset
	2023
	2024	.
	2025	Tato reprezentace může být velmi užitečná, protože nám umožňuje rozložit
	2026	optimální řízení na dvě nezávislé časti:
	2027	\end_layout
	2028
	2029	\begin_layout Enumerate
	2030
	2031	\emph on
	2032	pozorovatel
	2033	\emph default
	2034	(estimátor), který v čase
	2035	\begin_inset Formula $k$
	2036	\end_inset
	2037
	2038	použije měření
	2039	\begin_inset Formula $z_{k}$
	2040	\end_inset
	2041
	2042	a řízení
	2043	\begin_inset Formula $u_{k-1}$
	2044	\end_inset
	2045
	2046	k vygenerování rozdělení pravděpodobnosti
	2047	\begin_inset Formula $P_{x_{k}\|I_{k}}$
	2048	\end_inset
	2049
	2050
	2051	\end_layout
	2052
	2053	\begin_layout Enumerate
	2054
	2055	\emph on
	2056	ovladač
	2057	\emph default
	2058	(regulátor), který generuje vstupy (řízení) pro systém jako funkci rozdělení
	2059	pravděpodobnosti
	2060	\begin_inset Formula $P_{x_{k}\|I_{k}}$
	2061	\end_inset
	2062
	2063
	2064	\end_layout
	2065
	2066	\begin_layout Standard
	2067	Tento rozklad pak umožňuje navrhovat každou z částí samostatně podle charakteru
	2068	konkrétní úlohy.
	2069	\end_layout
	2070
	2071	\begin_layout Subsection
	2072	Kalmanův filtr
	2073	\end_layout
	2074
	2075	\begin_layout Standard
	2076	Chceme řešit následující problém, viz
	2077	\begin_inset CommandInset citation
	2078	LatexCommand cite
	2079	key "StechaTDS"
	2080
	2081	\end_inset
	2082
	2083	: Máme lineární systém s neúplnou stavovou informací a snažíme se odhadnout
	2084	(rekonstruovat, estimovat) stav systému z měřitelných vstupních a výstupních
	2085	veličin.
	2086	Dále předpokládejme, že měření výstupu a popřípadě i vstupu je zatíženo
	2087	chybou měření.
	2088	Tyto nepřesnosti měření můžeme modelovat jako aditivní šum.
	2089	Odhadování (rekonstrukci, estimaci) potom navrhujeme pomocí stochastických
	2090	metod.
	2091	Řešení vede na takzvaný
	2092	\emph on
	2093	Kalmanův filtr
	2094	\emph default
	2095	.
	2096	\end_layout
	2097
	2098	\begin_layout Standard
	2099	\begin_inset VSpace medskip
	2100	\end_inset
	2101
	2102
	2103	\end_layout
	2104
	2105	\begin_layout Standard
	2106	Následující formulace problému a popis algoritmu Kalmanova filtru je převzat
	2107	z
	2108	\begin_inset CommandInset citation
	2109	LatexCommand cite
	2110	key "BertsekasDPOC"
	2111
	2112	\end_inset
	2113
	2114	, kde lze také nalézt odvození příslušných rovnic: Máme dva náhodné vektory
	2115
	2116	\begin_inset Formula $x$
	2117	\end_inset
	2118
	2119	a
	2120	\begin_inset Formula $y$
	2121	\end_inset
	2122
	2123	, které jsou svázány
	2124	\color red
	2125	společným rozdělením pravděpodobnosti
	2126	\color inherit
	2127	(
	2128	\begin_inset Quotes gld
	2129	\end_inset
	2130
	2131	joint probability distribution
	2132	\begin_inset Quotes grd
	2133	\end_inset
	2134
	2135	) tak, že hodnota jednoho poskytuje informaci o hodnotě druhého.
	2136	Známe hodnotu
	2137	\begin_inset Formula $y$
	2138	\end_inset
	2139
	2140	a chceme určit (odhadnout) hodnotu
	2141	\begin_inset Formula $x$
	2142	\end_inset
	2143
	2144	tak, aby střední kvadratická odchylka mezi
	2145	\begin_inset Formula $x$
	2146	\end_inset
	2147
	2148	a jeho odhadem byla minimální.
	2149	\end_layout
	2150
	2151	\begin_layout Standard
	2152	Takový odhad můžeme zístat v nejjednodušším případě metodou nejmenších čtverců,
	2153	ale pro tento způsob je třeba velkého počtu měření.
	2154	Jako lepší způsob se ale jeví využít sekvenční struktury problému a iterativně
	2155	použít Kalmanův filtr, kdy odhad v čase
	2156	\begin_inset Formula $k+1$
	2157	\end_inset
	2158
	2159	získáme na základě jednoduchých rovnic pouze z předchozího odhadu a nového
	2160	měření v čase
	2161	\begin_inset Formula $k$
	2162	\end_inset
	2163
	2164	, žádná předchozí měření nejsou explicitně zahrnuta.
	2165	\end_layout
	2166
	2167	\begin_layout Standard
	2168	V dalším textu označme
	2169	\begin_inset Formula $\hat{x}_{k\|k-1}$
	2170	\end_inset
	2171
	2172	apriorní odhad stavu, tedy odhad stavu v čase
	2173	\begin_inset Formula $k$
	2174	\end_inset
	2175
	2176	na základě informací až do času
	2177	\begin_inset Formula $k-1$
	2178	\end_inset
	2179
	2180	.
	2181	Analogicky
	2182	\begin_inset Formula $\Sigma_{k\|k-1}$
	2183	\end_inset
	2184
	2185	označuje apriorní kovarianční matici.
	2186	Aposteriorní odhad stavu označme
	2187	\begin_inset Formula $\hat{x}_{k\|k}$
	2188	\end_inset
	2189
	2190	, to jest odhad v čase
	2191	\begin_inset Formula $k$
	2192	\end_inset
	2193
	2194	na základě informačí až do času
	2195	\begin_inset Formula $k$
	2196	\end_inset
	2197
	2198	.
	2199	Aposteriorní kovarianční matice je pak označena
	2200	\begin_inset Formula $\Sigma_{k\|k}$
	2201	\end_inset
	2202
	2203	.
	2204
	2205	\end_layout
	2206
	2207	\begin_layout Standard
	2208	\begin_inset VSpace bigskip
	2209	\end_inset
	2210
	2211
	2212	\end_layout
	2213
	2214	\begin_layout Subsubsection
	2215	System
	2216	\end_layout
	2217
	2218	\begin_layout Standard
	2219	Uvažujme lineární dynamický systém bez řízení (
	2220	\begin_inset Formula $u_{k}\equiv0$
	2221	\end_inset
	2222
	2223	) ve tvaru
	2224	\begin_inset Formula \[
	2225	x_{k+1}=A_{k}x_{k}+w_{k},\; k=0,1,\ldots,N-1,\]
	2226
	2227	\end_inset
	2228
	2229	kde
	2230	\begin_inset Formula $x_{k}$
	2231	\end_inset
	2232
	2233	je vektor stavu,
	2234	\begin_inset Formula $w_{k}$
	2235	\end_inset
	2236
	2237	vektor náhodné poruchy a matice
	2238	\begin_inset Formula $A_{k}$
	2239	\end_inset
	2240
	2241	předpokládáme známé.
	2242	Dále rovnice měření je
	2243	\begin_inset Formula \[
	2244	z_{k}=C_{k}x_{k}+v_{k},\; k=0,1,\ldots,N-1,\]
	2245
	2246	\end_inset
	2247
	2248	kde
	2249	\begin_inset Formula $z_{k}$
	2250	\end_inset
	2251
	2252	je vektor pozorování (měřených veličin) a
	2253	\begin_inset Formula $v_{k}$
	2254	\end_inset
	2255
	2256	vektor šumu.
	2257	Nechť
	2258	\begin_inset Formula $x_{0},w_{0},\ldots,w_{N-1},v_{0},\ldots,v_{N-1}$
	2259	\end_inset
	2260
	2261	jsou vektory nezávislých náhodných veličin s daným rozdělením pravděpodobnosti,
	2262	takovým, že
	2263	\begin_inset Formula \[
	2264	\mathrm{E}\{w_{k}\}=\mathrm{E}\{v_{k}\}=0,\; k=0,1,\ldots,N-1.\]
	2265
	2266	\end_inset
	2267
	2268	Označme
	2269	\begin_inset Formula \[
	2270	S=\mathrm{E}\left\{ \left(x_{0}-\mathrm{E}\{x_{0}\}\right)\left(x_{0}-\mathrm{E}\{x_{0}\}\right)^{T}\right\} ,\; M_{k}=\mathrm{E}\{w_{k}w_{k}^{T}\},\; N_{k}=\mathrm{E}\{v_{k}v_{k}^{T}\},\]
	2271
	2272	\end_inset
	2273
	2274	a nechť matice
	2275	\begin_inset Formula $N_{k}$
	2276	\end_inset
	2277
	2278	pozitivně definitní pro všechny časy
	2279	\begin_inset Formula $k$
	2280	\end_inset
	2281
	2282	.
	2283	\end_layout
	2284
	2285	\begin_layout Subsubsection
	2286	Algoritmus Kalmanova filtru
	2287	\end_layout
	2288
	2289	\begin_layout Standard
	2290	Předpokládejme, že máme spočítaný odhad
	2291	\begin_inset Formula $\hat{x}_{k\|k-1}$
	2292	\end_inset
	2293
	2294	společně s kovarianční maticí
	2295	\begin_inset Formula $\Sigma_{k\|k-1}=\mathrm{E}\left\{ \left(x_{k}-\hat{x}_{k\|k-1}\right)\left(x_{k}-\hat{x}_{k\|k-1}\right)^{T}\right\} $
	2296	\end_inset
	2297
	2298	.
	2299	V čase
	2300	\begin_inset Formula $k$
	2301	\end_inset
	2302
	2303	získáme další měření
	2304	\begin_inset Formula $z_{k}=C_{k}x_{k}+v_{k}$
	2305	\end_inset
	2306
	2307	.
	2308	Nyní můžeme získat aposteriorní odhad stavu
	2309	\begin_inset Formula $\hat{x}_{k\|k}$
	2310	\end_inset
	2311
	2312	v čase
	2313	\begin_inset Formula $k$
	2314	\end_inset
	2315
	2316	jako
	2317	\begin_inset Formula \begin{equation}
	2318	\hat{x}_{k\|k}=\hat{x}_{k\|k-1}+\Sigma_{k\|k-1}C_{k}^{T}\left(C_{k}\Sigma_{k\|k-1}C_{k}^{T}+N_{k}\right)^{-1}\left(z_{k}-C_{k}\hat{x}_{k\|k-1}\right),\label{eq:kalmanaposkk}\end{equation}
	2319
	2320	\end_inset
	2321
	2322	dále pak apriorní odhad stavu
	2323	\begin_inset Formula $\hat{x}_{k+1\|k}$
	2324	\end_inset
	2325
	2326	v čase
	2327	\begin_inset Formula $k+1,$
	2328	\end_inset
	2329
	2330	tedy
	2331	\begin_inset Formula $\hat{x}_{k+1\|k}=A_{k}\hat{x}_{k\|k}$
	2332	\end_inset
	2333
	2334	.
	2335	Apriorní kovarianční matici v čase
	2336	\begin_inset Formula $k+1$
	2337	\end_inset
	2338
	2339	vypočítáme z
	2340	\begin_inset Formula \[
	2341	\Sigma_{k+1\|k}=A_{k}\Sigma_{k\|k}A_{k}^{T}+M_{k},\]
	2342
	2343	\end_inset
	2344
	2345	kde aposteriorní kovarianční matici
	2346	\begin_inset Formula $\Sigma_{k\|k}=\mathrm{E}\left\{ \left(x_{k}-\hat{x}_{k\|k}\right)\left(x_{k}-\hat{x}_{k\|k}\right)^{T}\right\} $
	2347	\end_inset
	2348
	2349	můžeme získat z rovnice
	2350	\begin_inset Formula \[
	2351	\Sigma_{k\|k}=\Sigma_{k\|k-1}-\Sigma_{k\|k-1}C_{k}^{T}\left(C_{k}\Sigma_{k\|k-1}C_{k}^{T}+N_{k}\right)^{-1}C_{k}\Sigma_{k\|k-1}.\]
	2352
	2353	\end_inset
	2354
	2355	Přidáním počátečních podmínek
	2356	\begin_inset Formula $\hat{x}_{0\|-1}=\mathrm{E}\{x_{0}\}$
	2357	\end_inset
	2358
	2359	a
	2360	\begin_inset Formula $\Sigma_{0\|-1}=S$
	2361	\end_inset
	2362
	2363	získáme
	2364	\emph on
	2365	algoritmus Kalmanova filtru
	2366	\emph default
	2367	, který ve své podstatě rekurzivně generuje posloupnost lineárních odhadů
	2368	založených na metodě nejmenších čtverců.
	2369	\end_layout
	2370
	2371	\begin_layout Standard
	2372	Dále je možno vyjádřit rovnici
	2373	\begin_inset CommandInset ref
	2374	LatexCommand ref
	2375	reference "eq:kalmanaposkk"
	2376
	2377	\end_inset
	2378
	2379	ve tvaru
	2380	\begin_inset Formula \[
	2381	\hat{x}_{k\|k}=A_{k-1}\hat{x}_{k-1\|k-1}+\Sigma_{k\|k}C_{k}^{T}N_{k}^{-1}\left(z_{k}-C_{k}A_{k-1}\hat{x}_{k-1\|k-1}\right),\]
	2382
	2383	\end_inset
	2384
	2385	který při uvažování systému se vstupem
	2386	\begin_inset Formula \[
	2387	x_{k+1}=A_{k}x_{k}+B_{k}u_{k}+w_{k},\; k=0,1,\ldots,N-1,\]
	2388
	2389	\end_inset
	2390
	2391	umožňuje vypočítat rekurzivně aposteriorní odhady stavů
	2392	\begin_inset Formula $\hat{x}_{k\|k}$
	2393	\end_inset
	2394
	2395	v časech
	2396	\begin_inset Formula $k$
	2397	\end_inset
	2398
	2399	z rovnice
	2400	\begin_inset Formula \[
	2401	\hat{x}_{k\|k}=A_{k-1}\hat{x}_{k-1\|k-1}+B_{k-1}u_{k-1}+\Sigma_{k\|k}C_{k}^{T}N_{k}^{-1}\left(z_{k}-C_{k}A_{k-1}\hat{x}_{k-1\|k-1}\right),\]
	2402
	2403	\end_inset
	2404
	2405	přičemž rovnice pro výpočet aposteriorní kovarianční matice
	2406	\begin_inset Formula $\Sigma_{k\|k}$
	2407	\end_inset
	2408
	2409	zůstávají nezměněny.
	2410	\end_layout
	2411
	2412	\begin_layout Subsection
	2413	Deterministické systémy se spojitým časem
	2414	\end_layout
	2415
	2416	\begin_layout Standard
	2417	I když zpravidla pracujeme s diskrétními systémy, zejména z důvodů výpočtů
	2418	na počítači, teorie optimálního řízení spojitých systémů může být velmi
	2419	užitečná.
	2420	Poskytuje totiž důležité principy, které jsou velmi často používány při
	2421	návrhu algoritmů pro duální řízení.
	2422	Konkrétně se jedná o Hamilton-Jacobi-Bellmanovu rovnost a Pontryaginův
	2423	princip minima.
	2424	\end_layout
	2425
	2426	\begin_layout Subsubsection
	2427	Spojitý systém
	2428	\end_layout
	2429
	2430	\begin_layout Standard
	2431	Dynamický systém se spojitým časem uvažujeme dle
	2432	\begin_inset CommandInset citation
	2433	LatexCommand cite
	2434	key "BertsekasDPOC"
	2435
	2436	\end_inset
	2437
	2438	ve tvaru
	2439	\begin_inset Formula \begin{eqnarray}
	2440	\dot{x}(t) & = & f(x(t),u(t)),\;0\leq t\leq T,\label{eq:spojsystemHJBP}\\
	2441	x(0) & = & x_{0},\nonumber \end{eqnarray}
	2442
	2443	\end_inset
	2444
	2445	kde
	2446	\begin_inset Formula $x(t)$
	2447	\end_inset
	2448
	2449	je stavový vektor v čase
	2450	\begin_inset Formula $t$
	2451	\end_inset
	2452
	2453	,
	2454	\begin_inset Formula $\dot{x}(t)$
	2455	\end_inset
	2456
	2457	je vektor prvních derivací podle času v čase
	2458	\begin_inset Formula $t$
	2459	\end_inset
	2460
	2461	,
	2462	\begin_inset Formula $u(t)\in U$
	2463	\end_inset
	2464
	2465	je řídící vektor v čase
	2466	\begin_inset Formula $t$
	2467	\end_inset
	2468
	2469	,
	2470	\begin_inset Formula $U$
	2471	\end_inset
	2472
	2473	je množina omezení řízení a
	2474	\begin_inset Formula $T$
	2475	\end_inset
	2476
	2477	je časový horizont.
	2478	O funkci
	2479	\begin_inset Formula $f$
	2480	\end_inset
	2481
	2482	předpokládáme, že je spojitě diferencovatelná vzhledem k
	2483	\begin_inset Formula $x$
	2484	\end_inset
	2485
	2486	a spojitá vzhledem k
	2487	\begin_inset Formula $u$
	2488	\end_inset
	2489
	2490	.
	2491	Rovnice
	2492	\begin_inset CommandInset ref
	2493	LatexCommand ref
	2494	reference "eq:spojsystemHJBP"
	2495
	2496	\end_inset
	2497
	2498	představuje soustavu
	2499	\begin_inset Formula $n$
	2500	\end_inset
	2501
	2502	diferenciálních rovnic prvního řádu.
	2503	Naším cílem je nalézení přípustné řídící trajektorie
	2504	\begin_inset Formula $\left\{ u(t)\mid t\in[0,T]\right\} $
	2505	\end_inset
	2506
	2507	a odpovídající stavové trajektorie
	2508	\family roman
	2509	\series medium
	2510	\shape up
	2511	\size normal
	2512	\emph off
	2513	\bar no
	2514	\noun off
	2515	\color none
	2516
	2517	\begin_inset Formula $\left\{ x(t)\mid t\in[0,T]\right\} $
	2518	\end_inset
	2519
	2520	takové, že minimalizují ztrátovou funkci ve tvaru
	2521	\begin_inset Formula \[
	2522	h(x(T))+\int_{0}^{T}g\left(x(t),u(t)\right)dt,\]
	2523
	2524	\end_inset
	2525
	2526	o funkcích
	2527	\begin_inset Formula $g$
	2528	\end_inset
	2529
	2530	a
	2531	\begin_inset Formula $h$
	2532	\end_inset
	2533
	2534	předpokládáme, že jsou spojitě diferencovatelné vzhledem k
	2535	\begin_inset Formula $x$
	2536	\end_inset
	2537
	2538	a
	2539	\begin_inset Formula $g$
	2540	\end_inset
	2541
	2542	je spojitá vzhledem k
	2543	\begin_inset Formula $u$
	2544	\end_inset
	2545
	2546	.
	2547	\end_layout
	2548
	2549	\begin_layout Subsubsection
	2550	Hamilton-Jacobi-Bellmanova rovnost
	2551	\end_layout
	2552
	2553	\begin_layout Standard
	2554	Hamilton-Jacobi-Bellmanova rovnost je parciální diferenciální rovnicí, která
	2555	je splněna optimální funkcí nákladů na pokračování
	2556	\begin_inset Formula $J^{*}(t,x)$
	2557	\end_inset
	2558
	2559	.
	2560	Tato rovnice je analogií algoritmu dynamického programování ve spojitém
	2561	čase.
	2562	Rovnici lze psát podle
	2563	\begin_inset CommandInset citation
	2564	LatexCommand cite
	2565	key "BertsekasDPOC"
	2566
	2567	\end_inset
	2568
	2569	ve tvaru
	2570	\begin_inset Formula \begin{eqnarray}
	2571	0 & = & \min_{u\in U}\left[g(x,u)+\nabla_{t}J^{}(t,x)+\nabla_{x}J^{}(t,x)^{T}f(x,u)\right],\quad\forall t,x,\label{eq:hjbrovnostJ}\\
	2572	J^{*}(T,x) & = & h(x).\nonumber \end{eqnarray}
	2573
	2574	\end_inset
	2575
	2576	Jedná se tedy o parciální diferenciální rovnici s okrajovou podmínkou.
	2577	O funkci
	2578	\begin_inset Formula $J^{*}(t,x)$
	2579	\end_inset
	2580
	2581	jsme předpokládali diferencovatelnost, apriorně ale její diferencovatelnost
	2582	neznáme a tedy nevíme, jestli
	2583	\begin_inset Formula $J^{*}(t,x)$
	2584	\end_inset
	2585
	2586	řeší rovnici
	2587	\begin_inset CommandInset ref
	2588	LatexCommand ref
	2589	reference "eq:hjbrovnostJ"
	2590
	2591	\end_inset
	2592
	2593	.
	2594	Můžeme však použít následující tvrzení, jehož formulaci i důkaz lze nalézt
	2595	v
	2596	\begin_inset CommandInset citation
	2597	LatexCommand cite
	2598	key "BertsekasDPOC"
	2599
	2600	\end_inset
	2601
	2602	:
	2603	\end_layout
	2604
	2605	\begin_layout Description
	2606	Věta
	2607	\begin_inset space \space{}
	2608	\end_inset
	2609
	2610	o
	2611	\begin_inset space \space{}
	2612	\end_inset
	2613
	2614	dostatečnosti:
	2615	\begin_inset ERT
	2616	status open
	2617
	2618	\begin_layout Plain Layout
	2619
	2620	~
	2621	\end_layout
	2622
	2623	\end_inset
	2624
	2625
	2626	\begin_inset Newline newline
	2627	\end_inset
	2628
	2629	Nechť je funkce
	2630	\begin_inset Formula $V(t,x)$
	2631	\end_inset
	2632
	2633	spojitě diferencovatelná vzhledem k
	2634	\begin_inset Formula $t$
	2635	\end_inset
	2636
	2637	a
	2638	\begin_inset Formula $x$
	2639	\end_inset
	2640
	2641	a nechť je řešením Hamilton-Jacobi-Bellmanovy rovnosti:
	2642	\begin_inset Formula \begin{eqnarray}
	2643	0 & = & \min_{u\in U}\left[g(x,u)+\nabla_{t}V(t,x)+\nabla_{x}V(t,x)^{T}f(x,u)\right],\quad\forall t,x,\label{eq:hjbrovnostV}\\
	2644	V(T,x) & = & h(x),\quad\forall x.\nonumber \end{eqnarray}
	2645
	2646	\end_inset
	2647
	2648	Předpokládejme dále, že
	2649	\begin_inset Formula $\mu^{*}(t,x)$
	2650	\end_inset
	2651
	2652	dosáhne minima v rovnosti
	2653	\begin_inset CommandInset ref
	2654	LatexCommand ref
	2655	reference "eq:hjbrovnostV"
	2656
	2657	\end_inset
	2658
	2659	pro všechna
	2660	\begin_inset Formula $t$
	2661	\end_inset
	2662
	2663	a
	2664	\begin_inset Formula $x$
	2665	\end_inset
	2666
	2667	.
	2668	Nechť
	2669	\family roman
	2670	\series medium
	2671	\shape up
	2672	\size normal
	2673	\emph off
	2674	\bar no
	2675	\noun off
	2676	\color none
	2677
	2678	\begin_inset Formula $\left\{ x^{*}(t)\mid t\in[0,T]\right\} $
	2679	\end_inset
	2680
	2681	označuje stavovou trajektorii získanou při dané počáteční podmínce
	2682	\begin_inset Formula $x^{*}(0)=x_{0}$
	2683	\end_inset
	2684
	2685	a řídící trajektorii
	2686	\family default
	2687	\series default
	2688	\shape default
	2689	\size default
	2690	\emph default
	2691	\bar default
	2692	\noun default
	2693	\color inherit
	2694
	2695	\begin_inset Formula $u^{}(t)=\mu^{}(t,x^{*}(t)),\; t\in[0,T]$
	2696	\end_inset
	2697
	2698	.
	2699	Pak
	2700	\begin_inset Formula $V$
	2701	\end_inset
	2702
	2703	je rovno optimální funkci nákladů na pokračování, tedy
	2704	\begin_inset Formula \[
	2705	V(t,x)=J^{*}(t,x),\quad\forall t,x.\]
	2706
	2707	\end_inset
	2708
	2709	Navíc řídící trajektorie
	2710	\begin_inset Formula $\left\{ u^{*}(t)\mid t\in[0,T]\right\} $
	2711	\end_inset
	2712
	2713	je optimální.
	2714
	2715	\end_layout
	2716
	2717	\begin_layout Subsubsection
	2718	Pontryaginův princip minima
	2719	\end_layout
	2720
	2721	\begin_layout Standard
	2722	Pontryaginův princip minima je důležitým teorémem optimálního řízení.
	2723	Poskytuje nutnou (ne však postačující) podmínku pro optimální trajektorii,
	2724	je úzce spřízněn s Hamilton-Jacobi-Bellmanovou rovností a lze ho z ní podle
	2725
	2726	\begin_inset CommandInset citation
	2727	LatexCommand cite
	2728	key "BertsekasDPOC"
	2729
	2730	\end_inset
	2731
	2732	také odvodit.
	2733	Princip minima je výhodné formulovat pomocí Hamiltoniánu.
	2734	Označme
	2735	\begin_inset Formula $p$
	2736	\end_inset
	2737
	2738	gradient optimální funkce nákladů na pokračování pro optimální stavovou
	2739	trajektorii
	2740	\begin_inset Formula $p(t)=\nabla_{x}J^{}\left(t,x^{}(t)\right)$
	2741	\end_inset
	2742
	2743	a definujme Hamiltonián jako funkci zobrazující trojice vektorů
	2744	\begin_inset Formula $(x,u,p)$
	2745	\end_inset
	2746
	2747	do reálných čísel
	2748	\begin_inset Formula \[
	2749	H(x,u,p)=g(x,u)+p^{T}f(x,u).\]
	2750
	2751	\end_inset
	2752
	2753	Rovnice pro systém pak může být zapsána v kompaktním tvaru
	2754	\begin_inset Formula \[
	2755	\dot{x}^{}(t)=\nabla_{p}H\left(x^{}(t),u^{*}(t),p(t)\right).\]
	2756
	2757	\end_inset
	2758
	2759	Obdobně může být zapsána pro
	2760	\begin_inset Formula $p$
	2761	\end_inset
	2762
	2763	takzvaná
	2764	\emph on
	2765	adjungovaná rovnice
	2766	\emph default
	2767
	2768	\begin_inset Formula \[
	2769	\dot{p}(t)=-\nabla_{x}H\left(x^{}(t),u^{}(t),p(t)\right).\]
	2770
	2771	\end_inset
	2772
	2773	Pontryaginův princip minima je podle
	2774	\begin_inset CommandInset citation
	2775	LatexCommand cite
	2776	key "BertsekasDPOC"
	2777
	2778	\end_inset
	2779
	2780	formulován následovně:
	2781	\end_layout
	2782
	2783	\begin_layout Description
	2784	Princip
	2785	\begin_inset space \space{}
	2786	\end_inset
	2787
	2788	minima:
	2789	\begin_inset ERT
	2790	status open
	2791
	2792	\begin_layout Plain Layout
	2793
	2794	~
	2795	\end_layout
	2796
	2797	\end_inset
	2798
	2799
	2800	\begin_inset Newline newline
	2801	\end_inset
	2802
	2803	Nechť
	2804	\family roman
	2805	\series medium
	2806	\shape up
	2807	\size normal
	2808	\emph off
	2809	\bar no
	2810	\noun off
	2811	\color none
	2812
	2813	\begin_inset Formula $\left\{ u^{*}(t)\mid t\in[0,T]\right\} $
	2814	\end_inset
	2815
	2816	je optimální řídící trajektorie a nechť
	2817	\begin_inset Formula $\left\{ x^{*}(t)\mid t\in[0,T]\right\} $
	2818	\end_inset
	2819
	2820	je odpovídající stavová trajektorie, to jest
	2821	\begin_inset Formula \[
	2822	\dot{x}^{}(t)=f\left(x^{}(t),u^{}(t)\right),\quad x^{}(0)=x_{0}.\]
	2823
	2824	\end_inset
	2825
	2826	Nechť dále
	2827	\begin_inset Formula $p(t)$
	2828	\end_inset
	2829
	2830	je řešením adjungované rovnice
	2831	\begin_inset Formula \[
	2832	\dot{p}(t)=-\nabla_{x}H\left(x^{}(t),u^{}(t),p(t)\right),\]
	2833
	2834	\end_inset
	2835
	2836	s okrajovou podmínkou
	2837	\begin_inset Formula $p(T)=\nabla h\left(x^{*}(T)\right)$
	2838	\end_inset
	2839
	2840	.
	2841	Pak pro všechna
	2842	\begin_inset Formula $t\in[0,T]$
	2843	\end_inset
	2844
	2845
	2846	\begin_inset Formula \[
	2847	u^{}(t)=\arg\min_{u\in U}H\left(x^{}(t),u,p(t)\right).\]
	2848
	2849	\end_inset
	2850
	2851	Navíc existuje konstanta
	2852	\begin_inset Formula $C$
	2853	\end_inset
	2854
	2855	taková, že
	2856	\begin_inset Formula \[
	2857	H\left(x^{}(t),u^{}(t),p(t)\right)=C,\quad\forall t\in[0,T].\]
	2858
	2859	\end_inset
	2860
	2861
	2862	\end_layout
	2863
	2864	\begin_layout Subsection
	2865	Algoritmy pro duální řízení
	2866	\end_layout
	2867
	2868	\begin_layout Standard
	2869	Metody pro nalezení optimálního řízení lze obecně rozdělit do dvou základních
	2870	kategorií na
	2871	\emph on
	2872	globální
	2873	\emph default
	2874	a
	2875	\emph on
	2876	lokální
	2877	\emph default
	2878	viz
	2879	\begin_inset CommandInset citation
	2880	LatexCommand cite
	2881	key "TodorovWeiweiILQG,TodorovTassaILDP"
	2882
	2883	\end_inset
	2884
	2885
	2886	\emph on
	2887	.
	2888
	2889	\emph default
	2890
	2891	\end_layout
	2892
	2893	\begin_layout Standard
	2894	Globální metody, používané zejména v posilovaném učení
	2895	\color black
	2896	(
	2897	\begin_inset Quotes gld
	2898	\end_inset
	2899
	2900	Reinforcement Learning
	2901	\color inherit
	2902
	2903	\begin_inset Quotes grd
	2904	\end_inset
	2905
	2906	), jsou založeny na na
	2907	\color black
	2908	Bellmanově principu optimality, Hamilton-Jacobi-Bellmanově rovnosti
	2909	\color inherit
	2910	a dynamickém programování.
	2911	Tyto algoritmy hledají globálně optimální zpětnovazební řízení pro všechny
	2912	stavy obecného stochastického systému a proto podléhají nebezpečí
	2913	\begin_inset Quotes gld
	2914	\end_inset
	2915
	2916	problému dimenzionality
	2917	\begin_inset Quotes grd
	2918	\end_inset
	2919
	2920	nebo také rozměrnosti (z anglického
	2921	\begin_inset Quotes eld
	2922	\end_inset
	2923
	2924	curse of dimensionality
	2925	\begin_inset Quotes erd
	2926	\end_inset
	2927
	2928	doslovně -
	2929	\emph on
	2930	kletba rozměrnosti
	2931	\emph default
	2932	).
	2933	Jednoduše můžeme tento problém chápat tak, že při numerickém řešení úlohy
	2934	jsou počítačem procházeny všechny body diskretizovaného stavového a řídícího
	2935	prostoru jejichž počet s rostoucím počtem dimenzí extrémně (exponenciálně)
	2936	rychle roste.
	2937	Výpočet pro mnohadimenzionální úlohy se pak stává co do paměťových nároků,
	2938	ale hlavně z hlediska výpočetního času prakticky nerealizovatelným.
	2939	\end_layout
	2940
	2941	\begin_layout Standard
	2942	Lokální metody, častěji studované v teorii řízení, souvisí s
	2943	\color black
	2944	Pontryaginovým principem maxima
	2945	\color inherit
	2946	.
	2947	Jejich podstatou je nalezení řízení, které je pouze lokálně optimální v
	2948	okolí nějaké
	2949	\begin_inset Quotes gld
	2950	\end_inset
	2951
	2952	extremalní
	2953	\begin_inset Quotes grd
	2954	\end_inset
	2955
	2956	trajektorie.
	2957	Většinou je užito deterministických prostředků jako řešení soustavy obyčejných
	2958	diferenciálních rovnic (střelbou, relaxací,
	2959	\color red
	2960	uspořádáním - collocation
	2961	\color inherit
	2962	nebo
	2963	\color red
	2964	spádem gradientu - gradient descent
	2965	\color inherit
	2966	).
	2967	Tento přístup ale vede na přímovazební
	2968	\color red
	2969
	2970	\color black
	2971	řízení
	2972	\color red
	2973
	2974	\color inherit
	2975	a nezle užít pro stochastické úlohy, vyhýbá se ale problému dimenzionality,
	2976	což umožňuje řešit i komplexnější problémy.
	2977	\end_layout
	2978
	2979	\begin_layout Standard
	2980	V poslední době je snaha vyvíjet nové algoritmy, které kombinují výhody
	2981	obou výše zmíněných přístupů.
	2982	Příkladem může být
	2983	\emph on
	2984	diferenciální dynamické programování
	2985	\emph default
	2986	(DDP).
	2987	Tento algoritmus zůstává lokální metodou ve smyslu, že uchovává pouzve
	2988	jedinou trajektorii, která je lokálně vylepšována.
	2989	Vylepšení však není založeno na řešení soustavy obyčejných diferenciálních
	2990	rovnic, ale na dynamickém programování aplikovaném na okolí -
	2991	\begin_inset Quotes eld
	2992	\end_inset
	2993
	2994	trubici
	2995	\begin_inset Quotes erd
	2996	\end_inset
	2997
	2998	podél současné trajektorie.
	2999	Jedná se o algoritmus s konvergencí druhého řádu.
	3000	Ještě efektivnější je metoda podobná DDP,
	3001	\emph on
	3002	iterativní LQG
	3003	\emph default
	3004	(iLQG).
	3005	Tento algoritmus je založen na linearizaci nelineární úlohy v každém bodě
	3006	reprezentativní trajektorie a následném řešení modifikované Riccatiho rovnice.
	3007	Výhodou DDP i iLQG je, že jejich výsledkem je zpětnovazební řízení.
	3008	Obě metody jsou ale stále deterministické a nedokáží se vypořádat s nekvadratic
	3009	kými ztrátovými funkcemi a požadavky na omezené řízení.
	3010
	3011	\end_layout
	3012
	3013	\begin_layout Standard
	3014	S výše zmíněnými problémy se snaží vypořádat modifikovaná iLQG, která bude
	3015
	3016	\color red
	3017	možná
	3018	\color inherit
	3019	použita pro srovnání s ústřední metodou této práce iLDP.
	3020	Dále pak do kategorie smíšených metod spadá právě i metoda iLDP, která
	3021	bude podrobně popsána dále.
	3022
	3023	\end_layout
	3024
	3025	\begin_layout Section
	3026	Výběr konkrétních algoritmů pro srovnání
	3027	\end_layout
	3028
	3029	\begin_layout Subsection
	3030	LQG
	3031	\end_layout
	3032
	3033	\begin_layout Standard
	3034
	3035	\color blue
	3036	(iLQG)
	3037	\end_layout
	3038
	3039	\begin_layout Subsection
	3040	Princip separace
	3041	\end_layout
	3042
	3043	\begin_layout Section
	3044	Algoritmus iterativního lokálního dynamického programování
	3045	\end_layout
	3046
	3047	\begin_layout Standard
	3048	Algoritmus iLDP byl vytvořen pro účely nalezení stochastického optimálního
	3049	řízení v mnohadimenzionálních stavových a řídících prostorech.
	3050	Tento případ je častý zejména při řízení biologických pohybů.
	3051	Metoda je popsána autory v článku
	3052	\begin_inset CommandInset citation
	3053	LatexCommand cite
	3054	key "TodorovTassaILDP"
	3055
	3056	\end_inset
	3057
	3058
	3059	\emph on
	3060
	3061	\emph default
	3062	a z tohoto zdroje je také převzata
	3063	\emph on
	3064	.
	3065
	3066	\end_layout
	3067
	3068	\begin_layout Standard
	3069	Základní popis algoritmu, tak jak ho autoři podali, je však pouze šablonou
	3070	a mnoho detailů a dílčích částí je ponecháno na vyřešení při konkrétní
	3071	realizaci.
	3072	To se týká zejména použitých aproximací pro jednotlivé funkce, zejména
	3073	aproximace Bellmanovy funkce a aproximace hledaného regulátoru.
	3074	Dále, protože algoritmus využívá hledání minima, není v základním popisu
	3075	algoritmu vyřešen konkrétní typ minimalizace.
	3076	Použitý minimalizační algoritmus se samozřejmě liší podle konkrétního problému,
	3077	zejména jedná-li se o minimalizaci omezenou nebo neomezenou.
	3078	Ještě je třeba zmínil, že pro algoritmus je nutno zvolit parametr
	3079	\begin_inset Quotes gld
	3080	\end_inset
	3081
	3082	velikosti
	3083	\begin_inset Quotes grd
	3084	\end_inset
	3085
	3086	okolí, protože se jedná o lokální metodu.
	3087	\end_layout
	3088
	3089	\begin_layout Standard
	3090	\begin_inset VSpace defskip
	3091	\end_inset
	3092
	3093
	3094	\end_layout
	3095
	3096	\begin_layout Subsection
	3097	Formulace problému
	3098	\end_layout
	3099
	3100	\begin_layout Standard
	3101	Naším úkolem je nalézt řízení
	3102	\begin_inset Formula $\mathbf{u}=\pi(t,\mathbf{\, x})$
	3103	\end_inset
	3104
	3105	, které minimalizuje očekávanou ztrátu
	3106	\end_layout
	3107
	3108	\begin_layout Standard
	3109	\align center
	3110	\begin_inset Formula \[
	3111	J(\pi)=E_{\omega}\left(h(\mathbf{x},\pi(t,\mathbf{x}))+\int_{0}^{T}l(\mathbf{x},\pi(t,\mathbf{x}))dt\right)\]
	3112
	3113	\end_inset
	3114
	3115
	3116	\end_layout
	3117
	3118	\begin_layout Standard
	3119	obecně pro spojitý systém:
	3120	\end_layout
	3121
	3122	\begin_layout Standard
	3123	\begin_inset Formula \begin{eqnarray}
	3124	d\mathbf{x} & = & \mathbf{f}(\mathbf{x},\mathbf{u})dt+F(\mathbf{x},\mathbf{u})d\omega\nonumber \\
	3125	\mathbf{x}(0) & = & \mathbf{x}_{0}\label{eq:systemSpoj}\\
	3126	t & \in & [0,T]\nonumber \end{eqnarray}
	3127
	3128	\end_inset
	3129
	3130
	3131	\end_layout
	3132
	3133	\begin_layout Standard
	3134	v diskrétním tvaru:
	3135	\end_layout
	3136
	3137	\begin_layout Standard
	3138	\begin_inset Formula \begin{eqnarray}
	3139	\mathbf{x}_{k+1}-\mathbf{x}_{k} & = & \mathbf{f}(\mathbf{x},\mathbf{u})\cdot\Delta k+F(\mathbf{x},\mathbf{u})e_{k}\nonumber \\
	3140	\mathbf{x}_{(k=0)} & = & \mathbf{x}_{0}\label{eq:systemDis}\\
	3141	k & \in & \{0,1,\ldots,N\}\nonumber \\
	3142	\Delta k & = & (k+1)-(k)\nonumber \end{eqnarray}
	3143
	3144	\end_inset
	3145
	3146
	3147	\end_layout
	3148
	3149	\begin_layout Standard
	3150	kde hledáme řízení
	3151	\begin_inset Formula $\mathbf{u}=\pi(k,\mathbf{\, x})$
	3152	\end_inset
	3153
	3154	, které minimalizuje očekávanou ztrátu
	3155	\series bold
	3156	\emph on
	3157	\color red
	3158	asi
	3159	\end_layout
	3160
	3161	\begin_layout Standard
	3162	\begin_inset Formula \[
	3163	J(\pi)=E\left(h(\mathbf{x},\pi(N,\mathbf{x}))+\sum_{k=0}^{N-1}l_{k}(\mathbf{x},\pi(k,\mathbf{x}))\Delta k\right)\]
	3164
	3165	\end_inset
	3166
	3167
	3168	\end_layout
	3169
	3170	\begin_layout Subsection
	3171	Osnova algoritmu
	3172	\end_layout
	3173
	3174	\begin_layout Standard
	3175	Algoritmus pracuje iteračně, každá iterace začne s řízením
	3176	\begin_inset Formula $\pi$
	3177	\end_inset
	3178
	3179	a vytvoří zlepšení
	3180	\begin_inset Formula $\pi'$
	3181	\end_inset
	3182
	3183	.
	3184	Přičemž prvotní řešení
	3185	\begin_inset Formula $\pi_{0}$
	3186	\end_inset
	3187
	3188	musíme algoritmu dodat jako apriorní informaci.
	3189	Pro zajištění globální konvergence je možno nové řešení hledat jako konvexní
	3190	kombinaci starého a algoritmem nalezeného řešení
	3191	\begin_inset Formula \[
	3192	\pi^{nové}=\alpha\pi'+(1-\alpha)\pi;\;0<\alpha\leq1;\; J(\pi^{nové})<J(\pi)\]
	3193
	3194	\end_inset
	3195
	3196
	3197	\end_layout
	3198
	3199	\begin_layout Standard
	3200	V každé iteraci proběhne nejprve přípravná fáze, kdy z řízení
	3201	\begin_inset Formula $\pi(k,\mathbf{x})$
	3202	\end_inset
	3203
	3204	generuje průměrnou trajektorii
	3205	\begin_inset Formula $\bar{x}(k)$
	3206	\end_inset
	3207
	3208	řešením rovnice
	3209	\begin_inset CommandInset ref
	3210	LatexCommand ref
	3211	reference "eq:systemSpoj"
	3212
	3213	\end_inset
	3214
	3215	respektive
	3216	\begin_inset CommandInset ref
	3217	LatexCommand ref
	3218	reference "eq:systemDis"
	3219
	3220	\end_inset
	3221
	3222
	3223	\emph on
	3224	.
	3225
	3226	\emph default
	3227	Následně se počítá aproximace
	3228	\begin_inset Formula $\tilde{V}(k,\mathbf{x})$
	3229	\end_inset
	3230
	3231	Bellmanovy funkce
	3232	\begin_inset Formula $V(k,\mathbf{x})$
	3233	\end_inset
	3234
	3235	v čase odzadu, tj.
	3236	od
	3237	\begin_inset Formula $N$
	3238	\end_inset
	3239
	3240	k
	3241	\begin_inset Formula $1$
	3242	\end_inset
	3243
	3244	.
	3245	Současně počítáme i aproximaci řízení
	3246	\begin_inset Formula $\pi'(k,\mathbf{x})\ldots\pi'(N-1,\mathbf{x})$
	3247	\end_inset
	3248
	3249	.
	3250	Tedy pro každý čas
	3251	\begin_inset Formula $k$
	3252	\end_inset
	3253
	3254	takový, že
	3255	\begin_inset Formula $k=N-1\ldots1$
	3256	\end_inset
	3257
	3258	jdeme zpět, přičemž pokládáme v koncovém čase
	3259	\begin_inset Formula $N$
	3260	\end_inset
	3261
	3262	hodnotu aproximace Bellmanovy funkce
	3263	\begin_inset Formula $\tilde{V}(N,\mathbf{x})=h(\mathbf{x})$
	3264	\end_inset
	3265
	3266	a provádíme následující čtyři kroky:
	3267	\end_layout
	3268
	3269	\begin_layout Enumerate
	3270	Generujeme množinu stavů
	3271	\begin_inset Formula $\left\{ \mathbf{x}^{(n)}\right\} _{n=1\ldots M}$
	3272	\end_inset
	3273
	3274	shromážděných kolem průměrného stavu
	3275	\begin_inset Formula $\bar{\mathbf{x}}(k)$
	3276	\end_inset
	3277
	3278	.
	3279	\end_layout
	3280
	3281	\begin_deeper
	3282	\begin_layout Standard
	3283	Zde se projevuje lokálnost metody.
	3284	Množina stavů
	3285	\begin_inset Formula $\left\{ \mathbf{x}^{(n)}\right\} $
	3286	\end_inset
	3287
	3288	je vybrána z okolí průměrného stavu
	3289	\begin_inset Formula $\bar{\mathbf{x}}(k)$
	3290	\end_inset
	3291
	3292	.
	3293	Toto okolí a způsob výběru množiny je třeba konkrétně specifikovat.
	3294	Pro účely implementace tohoto algoritmu bylo okolí specifikováno parametrem
	3295
	3296	\begin_inset Formula $\rho^{2}$
	3297	\end_inset
	3298
	3299	.
	3300	Množina stavů
	3301	\begin_inset Formula $\left\{ \mathbf{x}^{(n)}\right\} $
	3302	\end_inset
	3303
	3304	pak byla generována náhodně jako náhodná veličina s normálním rozdělením
	3305	se střední hodnotou rovnou průměrnému stavu
	3306	\begin_inset Formula $\bar{\mathbf{x}}(k)$
	3307	\end_inset
	3308
	3309	a rozptylem specifikovaným parametrem
	3310	\begin_inset Formula $\rho^{2}$
	3311	\end_inset
	3312
	3313	.
	3314	\begin_inset Newline newline
	3315	\end_inset
	3316
	3317	Počet vzorků
	3318	\begin_inset Formula $M$
	3319	\end_inset
	3320
	3321	je nutno zvolit při implementaci algoritmu.
	3322	Obecně je nejlepší volit maximální možné číslo, ovšem s rostoucím počtem
	3323	vzorků rostou i paměťové nároky a výpočetní čas algoritmu.
	3324	\end_layout
	3325
	3326	\end_deeper
	3327	\begin_layout Enumerate
	3328	Pro každé
	3329	\begin_inset Formula $\mathbf{x}^{(n)}$
	3330	\end_inset
	3331
	3332	vypočítáme optimální řízení
	3333	\begin_inset Formula $\mathbf{u}^{(n)}$
	3334	\end_inset
	3335
	3336	minimalizací Hamiltoniánu
	3337	\begin_inset Formula \[
	3338	H(k,\mathbf{x},\mathbf{u})=\mathbf{l}(\mathbf{x},\mathbf{u})+\mathbf{f}(\mathbf{x},\mathbf{u})^{T}\tilde{V}_{x}(k+1,\mathbf{x})+\frac{1}{2}\mathbf{tr}\left(\sum(\mathbf{x},\mathbf{u})\tilde{V}_{xx}(k+1,\mathbf{x})\right)\]
	3339
	3340	\end_inset
	3341
	3342	s inicializačním bodem
	3343	\begin_inset Formula $\pi(k,\mathbf{x}^{(n)})$
	3344	\end_inset
	3345
	3346	.
	3347	Kde
	3348	\begin_inset Formula $\Sigma(\mathbf{x},\mathbf{u})=\mathbf{F}(\mathbf{x},\mathbf{u})\mathbf{F}(\mathbf{x},\mathbf{u})^{T}$
	3349	\end_inset
	3350
	3351	.
	3352	Tedy optimální řízení v čase
	3353	\begin_inset Formula $k$
	3354	\end_inset
	3355
	3356	pro stav
	3357	\begin_inset Formula $n$
	3358	\end_inset
	3359
	3360	hledáme jako
	3361	\begin_inset Formula $\mathbf{u}^{(n)}=\arg\min_{\mathbf{u}}H(k,\mathbf{x},\mathbf{u})$
	3362	\end_inset
	3363
	3364	.
	3365	\end_layout
	3366
	3367	\begin_deeper
	3368	\begin_layout Standard
	3369	Pro minimalizaci lze použít například minimalizační funkce programu
	3370	\emph on
	3371	Matlab
	3372	\emph default
	3373	z balíku
	3374	\emph on
	3375	Optimization Toolbox
	3376	\emph default
	3377	, konkrétně se jedná o funkce
	3378	\family typewriter
	3379	fminunc
	3380	\family default
	3381	respektive
	3382	\family typewriter
	3383	fmincon
	3384	\family default
	3385	pro neomezenou respektive omezenou minimalizaci.
	3386	V případě, že by bylo možno spočítat minimalizaci analyticky, jedná se
	3387	samozřejmě o nejlepší způsob.
	3388	\end_layout
	3389
	3390	\end_deeper
	3391	\begin_layout Enumerate
	3392	Pro každé
	3393	\begin_inset Formula $\mathbf{x}(k)$
	3394	\end_inset
	3395
	3396	aproximovat
	3397	\begin_inset Formula $v^{(n)}=V(k,\mathbf{x}^{(n)})$
	3398	\end_inset
	3399
	3400	použitím Hamolton-Jacobi-Bellmanovi rovnosti
	3401	\begin_inset Formula \[
	3402	V(k,\mathbf{x}^{(n)})\approx\Delta k\cdot H(k,\mathbf{x}^{(n)},\mathbf{u}^{(n)})+\tilde{V}(k+1,\mathbf{x}^{(n)})\]
	3403
	3404	\end_inset
	3405
	3406
	3407	\end_layout
	3408
	3409	\begin_layout Enumerate
	3410	Vypočítat novou aporximaci funkce
	3411	\begin_inset Formula $\tilde{V}(k,\mathbf{x})$
	3412	\end_inset
	3413
	3414	z množiny bodů
	3415	\begin_inset Formula $\left\{ \mathbf{x}^{(n)},v^{(n)}\right\} $
	3416	\end_inset
	3417
	3418	a aproximaci řízení
	3419	\begin_inset Formula $\pi'(k,\mathbf{x}^{(n)})$
	3420	\end_inset
	3421
	3422	definované pro všechna
	3423	\begin_inset Formula $x$
	3424	\end_inset
	3425
	3426	jako z množiny bodů
	3427	\begin_inset Formula $\left\{ \mathbf{x}^{(n)},\mathbf{u}^{(n)}\right\} $
	3428	\end_inset
	3429
	3430	.
	3431	\end_layout
	3432
	3433	\begin_layout Subsection
	3434	Detaily implementace
	3435	\end_layout
	3436
	3437	\begin_layout Subsection
	3438	Konkrétní použité aproximace
	3439	\end_layout
	3440
	3441	\begin_layout Standard
	3442	Výpočet hodnot a aproximace
	3443	\begin_inset Formula $\tilde{V}\;(\tilde{V}_{x},\tilde{V}_{xx})$
	3444	\end_inset
	3445
	3446	je opakovaný.
	3447	Je tedy třeba vysoké optimalizace, proto je použita lineární aproximace
	3448	ve tvaru lineární kombinace dvakrát diferencovatelných základních funkcí
	3449
	3450	\begin_inset Formula $\phi(x)\in\mathbf{R}^{P}$
	3451	\end_inset
	3452
	3453	kde
	3454	\begin_inset Formula $P<N$
	3455	\end_inset
	3456
	3457	.
	3458	Jako základní funkce jsou voleny funkce
	3459	\begin_inset Formula $1,\: x_{i},\: x_{i}x_{j},\: x_{i}^{2}x_{j}$
	3460	\end_inset
	3461
	3462	.
	3463	Aproximace je volena jako časově proměnná, kdy
	3464	\begin_inset Formula $\tilde{V}(k,\mathbf{x})=\phi(\mathbf{x}-\bar{\mathbf{x}}(k))^{T}\mathbf{w}(k)$
	3465	\end_inset
	3466
	3467	, kde
	3468	\begin_inset Formula $\mathbf{w}(k)$
	3469	\end_inset
	3470
	3471	je parametrický vektor závislý na čase
	3472	\begin_inset Formula $k$
	3473	\end_inset
	3474
	3475	.
	3476
	3477	\end_layout
	3478
	3479	\begin_layout Standard
	3480	Označme
	3481	\begin_inset Formula $\tilde{V}_{x}=\phi_{x}^{T}\mathbf{w}$
	3482	\end_inset
	3483
	3484	a
	3485	\begin_inset Formula $\tilde{V}_{xx}=\phi_{xx}^{T}\mathbf{w}$
	3486	\end_inset
	3487
	3488	první a druhou derivaci aproximace Bellmanovy funkce podle proměnné
	3489	\begin_inset Formula $\mathbf{x}$
	3490	\end_inset
	3491
	3492	respektive
	3493	\emph on
	3494	vektor
	3495	\emph default
	3496	a
	3497	\emph on
	3498	matici
	3499	\emph default
	3500	parciálních derivací podle složek vektoru
	3501	\begin_inset Formula $\mathbf{x}$
	3502	\end_inset
	3503
	3504	.
	3505	Parametry aproximace pro jednotlivé časy
	3506	\begin_inset Formula $\mathbf{w}$
	3507	\end_inset
	3508
	3509	se určí lineární regresí.
	3510	Pro
	3511	\begin_inset Formula $\mathbf{v}=\left[v^{(1)}\ldots v^{(M)}\right]$
	3512	\end_inset
	3513
	3514	vektor cílových hodnot a matici
	3515	\begin_inset Formula $\mathbf{\Phi}=\left[\phi(\mathbf{x}^{(1)}-\bar{\mathbf{x}}(k))\ldots\phi(\mathbf{x}^{(M)}-\bar{\mathbf{x}}(k))\right]$
	3516	\end_inset
	3517
	3518	je minimální kvadratická odchylka
	3519	\begin_inset Formula $\parallel\mathbf{v}-\mathbf{\Phi}^{T}\mathbf{w}\parallel^{2}$
	3520	\end_inset
	3521
	3522	pro volbu parametru
	3523	\begin_inset Formula $\mathbf{w}=\left(\mathbf{\Phi\Phi}^{T}\right)^{-1}\mathbf{\Phi v}$
	3524	\end_inset
	3525
	3526	.
	3527
	3528	\end_layout
	3529
	3530	\begin_layout Standard
	3531	Protože je průměrná trajektorie
	3532	\begin_inset Formula $\bar{\mathbf{x}}(k)$
	3533	\end_inset
	3534
	3535	konstantní v iteraci algoritmu, je z důvodu urychlení výpočtu aproximace
	3536	vycentrována v tomto bodě.
	3537	Množina
	3538	\begin_inset Formula $\left\{ \mathbf{x}^{(n)}\right\} $
	3539	\end_inset
	3540
	3541	je časově proměnná, abychom nemuseli v každém kroku počítat
	3542	\begin_inset Formula $\left(\mathbf{\Phi\Phi}^{T}\right)^{-1}\mathbf{\Phi}$
	3543	\end_inset
	3544
	3545	, položíme
	3546	\begin_inset Formula $\mathbf{x}^{(n)}=\bar{\mathbf{x}}(k)+\varepsilon^{(n)}$
	3547	\end_inset
	3548
	3549	, kde
	3550	\begin_inset Formula $\left\{ \varepsilon^{(n)}\right\} $
	3551	\end_inset
	3552
	3553	je stejná pro všechny časy
	3554	\begin_inset Formula $k$
	3555	\end_inset
	3556
	3557	.
	3558	Množina
	3559	\begin_inset Formula $\left\{ \mathbf{x}^{(n)}\right\} $
	3560	\end_inset
	3561
	3562	se pak jakoby pohybuje podél trajektorie
	3563	\begin_inset Formula $\bar{\mathbf{x}}(k)$
	3564	\end_inset
	3565
	3566	.
	3567	Tedy
	3568	\begin_inset Formula $\tilde{V}(k,\mathbf{x}^{(n)})=\phi(\varepsilon^{(n)})^{T}\mathbf{w}(k)$
	3569	\end_inset
	3570
	3571	a
	3572	\begin_inset Formula $\Phi$
	3573	\end_inset
	3574
	3575	je konstantní v nejen čase, ale i v iteracích algoritmu a matici
	3576	\begin_inset Formula $\left(\mathbf{\Phi\Phi}^{T}\right)^{-1}\mathbf{\Phi}$
	3577	\end_inset
	3578
	3579	je možno předpočítat (což by nešlo při závislosti na stavech).
	3580	\end_layout
	3581
	3582	\begin_layout Subsection
	3583	Předběžný odhad vlatností algoritmu
	3584	\end_layout
	3585
	3586	\begin_layout Standard
	3587	\begin_inset Newpage newpage
	3588	\end_inset
	3589
	3590
	3591	\end_layout
	3592
	3593	\begin_layout Chapter
	3594	Systémy pro testování
	3595	\end_layout
	3596
	3597	\begin_layout Section
	3598	Jednoduchý systém
	3599	\end_layout
	3600
	3601	\begin_layout Subsection
	3602	Popis problému
	3603	\end_layout
	3604
	3605	\begin_layout Standard
	3606	Tato úloha byla převzata z článku
	3607	\begin_inset CommandInset citation
	3608	LatexCommand cite
	3609	key "ThompsonCluettSIDP"
	3610
	3611	\end_inset
	3612
	3613	zejména z důvodu, aby mohla být porovnána s algoritmem navrženým ve zmíněném
	3614	zdroji.
	3615	Sami autoři
	3616	\begin_inset CommandInset citation
	3617	LatexCommand cite
	3618	key "ThompsonCluettSIDP"
	3619
	3620	\end_inset
	3621
	3622	pak přejali tento problém z
	3623	\begin_inset CommandInset citation
	3624	LatexCommand cite
	3625	key "AstromHelmerssonDCIUG"
	3626
	3627	\end_inset
	3628
	3629	.
	3630	\end_layout
	3631
	3632	\begin_layout Standard
	3633	Jedná se o integrátor s neznámým ziskem, tedy lineární časově invariantní
	3634	systém s jedním vstupem a jedním výstupem.
	3635	\end_layout
	3636
	3637	\begin_layout Standard
	3638	\begin_inset Formula \begin{eqnarray}
	3639	y_{k+1} & = & y_{k}+b_{k}u_{k}+e_{k+1},\nonumber \\
	3640	b_{k} & \sim & N(\hat{b}_{k},P_{k}),\label{eq:simplesystem}\\
	3641	e_{k} & \sim & N(0,\sigma^{2}),\nonumber \\
	3642	\mathrm{cov}(e_{k},b_{k}) & = & 0,\;\forall k.\nonumber \end{eqnarray}
	3643
	3644	\end_inset
	3645
	3646
	3647	\end_layout
	3648
	3649	\begin_layout Standard
	3650	kde
	3651	\begin_inset Formula $y_{k}$
	3652	\end_inset
	3653
	3654	je výstup nebo také stav procesu v čase
	3655	\begin_inset Formula $k$
	3656	\end_inset
	3657
	3658	,
	3659	\begin_inset Formula $u_{k}$
	3660	\end_inset
	3661
	3662	je řízení v čase
	3663	\begin_inset Formula $k$
	3664	\end_inset
	3665
	3666	.
	3667	Varianci šumu
	3668	\begin_inset Formula $\sigma^{2}$
	3669	\end_inset
	3670
	3671	předpokládáme známou, stejně jako počáteční hodnoty systému
	3672	\begin_inset Formula $y_{0}$
	3673	\end_inset
	3674
	3675	,
	3676	\begin_inset Formula $\hat{b}_{0}$
	3677	\end_inset
	3678
	3679	a
	3680	\begin_inset Formula $P_{0}$
	3681	\end_inset
	3682
	3683	.
	3684	Úkolem je nalézt zpětnovazební řízení
	3685	\begin_inset Formula \[
	3686	u_{k}^{}=u_{k}^{}(y_{k},y_{k-1},\ldots,y_{0},u_{k-1},u_{k-2},\ldots,u_{0}),\;0\leq k\leq N-1\]
	3687
	3688	\end_inset
	3689
	3690	minimalizující očekávanou ztrátu
	3691	\begin_inset Formula \begin{eqnarray*}
	3692	J_{0} & = & \left\{ \sum_{k=0}^{N-1}g_{k}\right\} ,\\
	3693	g_{k} & = & (y_{k+1}-r_{k+1})^{2},\end{eqnarray*}
	3694
	3695	\end_inset
	3696
	3697
	3698	\end_layout
	3699
	3700	\begin_layout Standard
	3701	pro daný časový horizont
	3702	\begin_inset Formula $N$
	3703	\end_inset
	3704
	3705	a referenční signál, tj.
	3706	požadovanou hodnotu výstupu, ve formě posloupnosti
	3707	\begin_inset Formula $\left\{ r_{k}\right\} _{k=1}^{N}$
	3708	\end_inset
	3709
	3710	.
	3711	\end_layout
	3712
	3713	\begin_layout Standard
	3714	Při řešení tohoto problému je výhodné nahlížet na systému jako úlohu s hyperstav
	3715	em
	3716	\begin_inset Formula $H_{k}=[y_{k},\hat{b}_{k},P_{k}].$
	3717	\end_inset
	3718
	3719	Pak první rovnici v
	3720	\begin_inset CommandInset ref
	3721	LatexCommand ref
	3722	reference "eq:simplesystem"
	3723
	3724	\end_inset
	3725
	3726	doplníme rovnicemi, ze kterých mohou být rekurzivně napočítány parametry
	3727
	3728	\begin_inset Formula $\hat{b}_{k}$
	3729	\end_inset
	3730
	3731	a
	3732	\begin_inset Formula $P_{k}$
	3733	\end_inset
	3734
	3735
	3736	\begin_inset Formula \begin{eqnarray*}
	3737	\hat{b}_{k+1} & = & \hat{b}_{k}+K_{k}(y_{k+1}-y_{k}-\hat{b}_{k}u_{k}),\\
	3738	P_{k+1} & = & (1-K_{k}u_{k})P_{k},\\
	3739	K_{k} & = & \frac{u_{k}P_{k}}{u_{k}^{2}P_{k}+\sigma^{2}}.\end{eqnarray*}
	3740
	3741	\end_inset
	3742
	3743	Přičemž ztráta v čase
	3744	\begin_inset Formula $k$
	3745	\end_inset
	3746
	3747	se změní na
	3748	\begin_inset Formula \[
	3749	g_{k}=(y_{k+1}-r_{k+1})^{2}+P_{k}u_{k}^{2}.\]
	3750
	3751	\end_inset
	3752
	3753
	3754	\end_layout
	3755
	3756	\begin_layout Subsection
	3757	Úpravy rovnic
	3758	\end_layout
	3759
	3760	\begin_layout Subsection
	3761	Konkrétní užití
	3762	\end_layout
	3763
	3764	\begin_layout Subsection
	3765	Pozorované výsledky
	3766	\end_layout
	3767
	3768	\begin_layout Section
	3769	Synchronní motor s permanentními magnety
	3770	\end_layout
	3771
	3772	\begin_layout Subsection
	3773	Popis systému
	3774	\end_layout
	3775
	3776	\begin_layout Standard
	3777	Následující model popisuje synchronní elektromotormotor s rotorem tvořeným
	3778	permanentními magnety.
	3779	Systém je popsán standartními rovnicemi synchronního stroje s permanentními
	3780	magnety ve stacionárním tvaru
	3781	\begin_inset Formula \begin{eqnarray}
	3782	\frac{di_{\alpha}}{dt} & = & -\frac{R_{s}}{L_{s}}i_{\alpha}+\frac{\Psi_{PM}}{L_{s}}\omega\sin\vartheta+\frac{u_{\alpha}}{L_{s}},\nonumber \\
	3783	\frac{di_{\beta}}{dt} & = & -\frac{R_{s}}{L_{s}}i_{\beta}-\frac{\Psi_{PM}}{L_{s}}\omega\cos\vartheta+\frac{u_{\beta}}{L_{s}},\label{eq:pmsmspojity}\\
	3784	\frac{d\omega}{dt} & = & \frac{k_{p}p_{p}^{2}\Psi_{PM}}{J}\left(i_{\beta}\cos\vartheta-i_{\alpha}\sin\vartheta\right)-\frac{B}{J}\omega-\frac{p_{p}}{J}T_{L},\nonumber \\
	3785	\frac{d\vartheta}{dt} & = & \omega.\nonumber \end{eqnarray}
	3786
	3787	\end_inset
	3788
	3789
	3790	\end_layout
	3791
	3792	\begin_layout Standard
	3793	Zde
	3794	\begin_inset Formula $i_{\alpha,\beta}$
	3795	\end_inset
	3796
	3797	reprezentují proudy a
	3798	\begin_inset Formula $u_{\alpha,\beta}$
	3799	\end_inset
	3800
	3801	napětí na statoru.
	3802	Poloha (úhel otočení) rotoru je označen
	3803	\begin_inset Formula $\vartheta$
	3804	\end_inset
	3805
	3806	a
	3807	\begin_inset Formula $\omega$
	3808	\end_inset
	3809
	3810	je pak rychlost otáčení.
	3811	Dále
	3812	\begin_inset Formula $R_{s}$
	3813	\end_inset
	3814
	3815	je rezistance a
	3816	\begin_inset Formula $L_{s}$
	3817	\end_inset
	3818
	3819	induktance statoru.
	3820
	3821	\begin_inset Formula $\Psi_{PM}$
	3822	\end_inset
	3823
	3824	má význam magnetického toku permanentních magnetů rotoru,
	3825	\begin_inset Formula $B$
	3826	\end_inset
	3827
	3828	tření a
	3829	\begin_inset Formula $T_{L}$
	3830	\end_inset
	3831
	3832	je zatěžovací moment.
	3833	Konstanta
	3834	\begin_inset Formula $p_{p}$
	3835	\end_inset
	3836
	3837	označuje počet párů polů a
	3838	\begin_inset Formula $k_{p}$
	3839	\end_inset
	3840
	3841	Parkovu konstantu.
	3842	\end_layout
	3843
	3844	\begin_layout Standard
	3845	Cílem je návrh řízení bez senzorů, kdy čidla pro měření polohy a otáček
	3846	nejsou (z různých důvodů) přítomna.
	3847	Tedy jediné měřitelné veličiny jsou:
	3848	\begin_inset Formula \[
	3849	y_{t}=\left[i_{\alpha}(t),i_{\beta}(t),u_{\alpha}(t),u_{\beta}(t)\right].\]
	3850
	3851	\end_inset
	3852
	3853	Které samozřejmě můžeme měřit jen s určitou přesností.
	3854	\end_layout
	3855
	3856	\begin_layout Standard
	3857	Diskretizace modelu
	3858	\begin_inset CommandInset ref
	3859	LatexCommand ref
	3860	reference "eq:pmsmspojity"
	3861
	3862	\end_inset
	3863
	3864	pomocí Eulerovy metody vede na následující diskrétní popis:
	3865	\begin_inset Formula \begin{eqnarray*}
	3866	i_{\alpha,k+1} & = & \left(1-\frac{R_{s}}{L_{s}}\Delta k\right)i_{\alpha,k}+\frac{\Psi_{PM}}{L_{s}}\Delta k\omega_{k}\sin\vartheta_{k}+\frac{\Delta k}{L_{s}}u_{\alpha,k},\\
	3867	i_{\beta,k+1} & = & \left(1-\frac{R_{s}}{L_{s}}\Delta k\right)i_{\beta,k}-\frac{\Psi_{PM}}{L_{s}}\Delta k\omega_{k}\cos\vartheta_{k}+\frac{\Delta k}{L_{s}}u_{\beta,k},\\
	3868	\omega_{k+1} & = & \left(1-\frac{B}{J}\Delta k\right)\omega_{k}+\frac{k_{p}p_{p}^{2}\Psi_{PM}}{J}\Delta k\left(i_{\beta,k}\cos\vartheta_{k}-i_{\alpha,k}\sin\vartheta_{k}\right)-\frac{p_{p}}{J}T_{L}\Delta k,\\
	3869	\vartheta_{k+1} & = & \vartheta_{k}+\omega_{k}\Delta k.\end{eqnarray*}
	3870
	3871	\end_inset
	3872
	3873	Kde
	3874	\begin_inset Formula $\Delta k$
	3875	\end_inset
	3876
	3877	označuje diskrétní časový okamžik.
	3878	Předpokládáme, že paremetry modelu známe, můžeme tedy provést následující
	3879	substituci za účelem zjednodušení:
	3880	\begin_inset Formula $a=1-\frac{R_{s}}{L_{s}}\Delta k$
	3881	\end_inset
	3882
	3883	,
	3884	\begin_inset Formula $b=\frac{\Psi_{PM}}{L_{s}}\Delta k$
	3885	\end_inset
	3886
	3887	,
	3888	\begin_inset Formula $c=\frac{\Delta k}{L_{s}}$
	3889	\end_inset
	3890
	3891	,
	3892	\begin_inset Formula $d=1-\frac{B}{J}\Delta k$
	3893	\end_inset
	3894
	3895	,
	3896	\begin_inset Formula $e=\frac{k_{p}p_{p}^{2}\Psi_{PM}}{J}\Delta k$
	3897	\end_inset
	3898
	3899	.
	3900	Pro jednoduchost uvažujme model bez zatížení, tedy zatěžovací moment
	3901	\begin_inset Formula $T_{L}$
	3902	\end_inset
	3903
	3904	je nulovy a zjednodušený model je:
	3905	\begin_inset Formula \begin{eqnarray}
	3906	i_{\alpha,k+1} & = & ai_{\alpha,k}+b\omega_{k}\sin\vartheta_{k}+cu_{\alpha,k},\nonumber \\
	3907	i_{\beta,k+1} & = & ai_{\beta,k}-b\omega_{k}\cos\vartheta_{k}+cu_{\beta,k},\label{eq:pmsmdiskretni}\\
	3908	\omega_{k+1} & = & d\omega_{k}+e\left(i_{\beta,k}\cos\vartheta_{k}-i_{\alpha,k}\sin\vartheta_{k}\right),\nonumber \\
	3909	\vartheta_{k+1} & = & \vartheta_{k}+\omega_{k}\Delta k.\nonumber \end{eqnarray}
	3910
	3911	\end_inset
	3912
	3913	Tyto rovnice můžeme chápat jako popis systému se stavem
	3914	\begin_inset Formula $x_{k}=\left[i_{\alpha,k},i_{\beta,k},\omega_{k},\vartheta_{k}\right]$
	3915	\end_inset
	3916
	3917	.
	3918	\end_layout
	3919
	3920	\begin_layout Subsection
	3921	Úprava rovnic
	3922	\end_layout
	3923
	3924	\begin_layout Subsection
	3925	Aplikace iLDP
	3926	\end_layout
	3927
	3928	\begin_layout Subsection
	3929	Výsledky jiných metod
	3930	\end_layout
	3931
	3932	\begin_layout Standard
	3933	\begin_inset Newpage newpage
	3934	\end_inset
	3935
	3936
	3937	\end_layout
	3938
	3939	\begin_layout Chapter
	3940	Výsledky
	3941	\end_layout
	3942
	3943	\begin_layout Section
	3944	Výsledky algoritmu iLDP
	3945	\end_layout
	3946
	3947	\begin_layout Subsection
	3948	Různá počáteční nastavení
	3949	\end_layout
	3950
	3951	\begin_layout Section
	3952	Výsledky ostatních použitých metod
	3953	\end_layout
	3954
	3955	\begin_layout Subsection
	3956	LQG
	3957	\end_layout
	3958
	3959	\begin_layout Subsection
	3960	Princip separace
	3961	\end_layout
	3962
	3963	\begin_layout Section
	3964	Srovnání
	3965	\end_layout
	3966
	3967	\begin_layout Subsection
	3968	Získané výsledky
	3969	\end_layout
	3970
	3971	\begin_layout Subsection
	3972	Porovnání algoritmů
	3973	\end_layout
	3974
	3975	\begin_layout Section
	3976	Diskuze pro metodu iLDP
	3977	\end_layout
	3978
	3979	\begin_layout Standard
	3980	\begin_inset Newpage newpage
	3981	\end_inset
	3982
	3983
	3984	\end_layout
	3985
	3986	\begin_layout Addchap
	3987	Závěr
	3988	\end_layout
	3989
	3990	\begin_layout Standard
	3991	\begin_inset Newpage newpage
	3992	\end_inset
	3993
	3994
	3995	\end_layout
	3996
	3997	\begin_layout Standard
	3998	\begin_inset ERT
	3999	status open
	4000
	4001	\begin_layout Plain Layout
	4002
	4003
	4004	\backslash
	4005	addcontentsline{toc}{chapter}{Literatura}
	4006	\end_layout
	4007
	4008	\begin_layout Plain Layout
	4009
	4010
	4011	\backslash
	4012	markboth{Literatura}{Literatura}
	4013	\end_layout
	4014
	4015	\end_inset
	4016
	4017
	4018	\end_layout
	4019
	4020	\begin_layout Standard
	4021	\begin_inset CommandInset bibtex
	4022	LatexCommand bibtex
	4023	btprint "btPrintAll"
	4024	bibfiles "bpzdroje"
	4025	options "czechiso"
	4026
	4027	\end_inset
	4028
	4029
	4030	\end_layout
	4031
	4032	\end_body
	4033	\end_document

Note: See TracBrowser for help on using the browser.

Download in other formats:

Original Format