Context Navigation

← Previous Changeset
Next Changeset →

Changeset 919

Timestamp:

05/02/10 23:05:37 (16 years ago)

Author:

zimamiro

Message:

Location:

applications/dual/SIDP/text

Files:

: 7 modified

baksimple.pdf (modified) (previous)
baksimple.tex (modified) (2 diffs)
ch1.tex (modified) (2 diffs)
ch2.tex (modified) (5 diffs)
ch3.tex (modified) (1 diff)
ch4.tex (modified) (2 diffs)
uvod.tex (modified) (1 diff)

Legend:

: Unmodified
: Added
: Removed

applications/dual/SIDP/text/baksimple.tex

r917	r919
47	47	\chapter{�oha stochastick� ��
48	48	\input{ch1.tex}
49		\chapter{�oha stochastick� �� ne~~p�mi daty~~}
	49	\chapter{�oha stochastick� �� ne�m pozorov�m}
50	50	\input{ch2.tex}
51	51	\chapter{Suboptim��py k � du��
…	…
63	63
64	64	% !!! Literatura se �abecedn�
65		\input{literatura.tex} % text, kter�kl�n z jin� souboru, MَETE ZM�IT N�EV souboru nebo smazat tento � a seznam literatury napsat p�sem
	65	\bibliographystyle{plain}
	66	\bibliography{literatura}
	67	%\input{literatura.bib} % text, kter�kl�n z jin� souboru, MَETE ZM�IT N�EV souboru nebo smazat tento � a seznam literatury napsat p�sem
66	68
67	69	\newpage % SEM NESAHEJTE!

applications/dual/SIDP/text/ch1.tex

r918	r919
1	1	DEFINICNI OBORY
2	2	\section{Formulace � stochastick� ��
3		�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�\emph{v�}. V t� kapitole budeme p�kl�t, �e m� stav syst� m�t p� P�em nep�o m�n� nezn�mi parametry se zab�sleduj� kapitola. �zen�tj. ovliv�n�tavu syst�, m� prov�t pomoc�emph{vstup�
4		Budeme-li p�kl�t diskr��ovahu �u, m� stav syst�v �ov� okam�iku $t$ pod�� horizontu d�y $N$ popsat syst�m rovnic
	3	�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Budeme-li p�kl�t diskr��ovahu �u, stav syst� v �ov� okam�iku $t$ pod�� horizontu d�y $N$ popisuje syst�rovnic
5	4	\begin{equation}
6	5	\label{sys}
7	6	x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1,
8	7	\end{equation}
9		kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu.
	8	kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. V t� kapitole budeme p�kl�t, �e m� stav syst� pozorovat. P�em ne�ho pozorov� se zab�sleduj� kapitola.
10	9
11		~~D� m� p�sanou ztr�vou~~ funkci
	10	V � �� v�dy p�sanou ztr�vou (resp. �vou) funkci
12	11	\begin{equation}
13	12	g(x_{0:N},u_{0:N-1},w_{0:N-1}).
14	13	\end{equation}
15	14
16		Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation}
	15	Ozna� $U(x_t)$ mno�inu p�tn�d�ch z�h� syst�ve stavu $x_t$. Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation}
17	16	\label{con}
18	17	\mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1,
19	18	\end{equation}
20
21		PRIPUSTNE STRATEGIE
	19	kde $u_t \in U(x_t)$ je p�tn�c��h.
22	20
23	21	Pro danou ��trategii ozna� o��nou ztr� jako
24	22	\begin{equation}
25	23	\label{los}
26		J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\}
	24	J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\}.
27	25	\end{equation}
28	26
29	27	�ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation}
30		J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0)
	28	J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0).
31	29	\end{equation}
32	30
33	31	Celkov�e tedy jedn� optimaliza� � nal� takovou posloupnost funkc�eqref{con}, kter�inimalizuje o��nou ztr�vu \eqref{los} za podm�k \eqref{sys}.
34
35	32
36	33	\section{Pou�it�ynamick� programov� p��en�lohy stochastick� �� aditivn�tr�u}
…	…
59	56	J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1
60	57	\end{equation}
61		je optim��osloupnost rozhodnut�~~Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$.~~
	58	je optim��osloupnost rozhodnut�

applications/dual/SIDP/text/ch2.tex

r918	r919
52	52
53	53	\section{�zen�yst� s nezn�mi parametry}
54		Pokud ~~rovnice syst� obsahuje n�k�� parametr $\theta$, m� vyu��znalosti ��robl� s ne�mi informacemi~~.
	54	Pokud chceme � syst� jeho� v�z�s�a n�k�nezn�m konstant�parametru $\theta$, m� vyu��znalosti ��robl� s ne�m pozorov�m.
55	55
56		Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz��n�ref].
57
58		V � du�� v� syst� $y_t$ pops� jako
	56	V t� � m� v� syst� $y_t$ pops� jako
59	57	\begin{equation}
60	58	\label{poz2}
…	…
67	65	\end{equation}
68	66
69		P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci $\theta_0$ a odhadovac�roceduru tvaru
70		\begin{equation}
71		\label{the}
72		\theta_{t+1}=f_t(I_t,\theta_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1.
73		\end{equation}
74		Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $(I_t, \theta_t)$, vstup $u_t$ s �umem $y_{t+1}$. Do rovnice \eqref{poz2} dosad� za $\theta$ jeho aktu��dhad, tedy
75		\begin{equation}
76		\label{poz3}
77		y_0=h_0(\theta_0,v_0),\qquad y_t=h_t(\theta_{t-1}, I_{t-1},u_{t-1},v_t), \qquad t=1,\ldots,N-1,
78		\end{equation}
79
80		Rovnice \eqref{the}, \eqref{poz3} a \eqref{los2} p�avuj�lohu stochastick� �� nep�mi daty.
81
82		\subsection{Bayesovsk��
83		P�ar�up, jak pro nezn� parametr $\theta$ z�at aposteriorn�ustotu pravd�dobnosti $f(\theta_{t+1}\|I_t)$, je-li k dispozici apriorn�ustota pravd�dobnosti $f(\theta_t)$ a informa� vektor $I_t$, je aplikace Bayesova vzorce
	67	Ozna� $\theta_t$ rozlo�en�dhadu pro parametr $\theta$ v �e $t$. P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci v podob�ustoty pravd�dobnosti $f(\theta_0)$. Aposteriorn�ustotu $f(\theta_{t+1}\|I_t)$ z�� pomoc�ayesova vzorce
84	68	\begin{equation}
85	69	\label{bay}
…	…
88	72	Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ je postup Bayesovsk� u��ref].
89	73
90		P�nkr��vypo� m��ak tento p�p dv�ev� 1) nikdy nem� k dispozici $f(I_t\|\theta_{t+1})$, ale pouze aproximaci z m�n�I_t$ a 2) aposteriorn�ustota pravd�dobnosti nemus��analytick�yj�en�co� jej�ou�it� dal��v� komplikuje.
	74	Ozna� $T_t$ doste�u statistiku pro $\theta_t$. Potom dle \eqref{bay} m� ps�
	75	\begin{equation}
	76	\label{the}
	77	T_{t+1}=f_t(I_t,T_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1.
	78	\end{equation}
	79	Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $(I_t, T_t)$, vstup $u_t$ s �umem $y_{t+1}$.
	80
	81	Hustota pravd�dobnosti parametru $\theta$ v rovnici pro v�\eqref{poz2} je v �e $t$ ur�a dostate�u statistikou $T_t$. Rovnice \eqref{the}, \eqref{poz2} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty.
91	82
92	83	\subsection{Kalman�ltr}
93		Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje ~~gausovk�a nezn� parametr je separov�jako line� �n, situace se zna� zjednodu��~~
	84	Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje aditivn�aussovk�a nezn� parametr je separov�jako line� �n, m� vypo�at konkr��var rovnice \eqref{the}, tzv. Kalman�ltr \cite{kalman1960new}.
94	85
95	86	Dle p�kladu m��v �e $t$ tvar
96	87	\begin{equation}
97	88	\label{sys2}
98		y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta_t+v_{t+1}, , \qquad t=0,\ldots,N-1.
	89	y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta+v_{t+1}, , \qquad t=0,\ldots,N-1.
99	90	\end{equation}
100	91
101		kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gausovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem
	92	kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gaussovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem
102	93	\begin{equation}
103	94	v_{t+1}\sim N(0,Q_{t+1}),
104	95	\end{equation}
105		gausovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy
	96	gaussovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy
106	97	\begin{gather}
107		\theta_t\sim N(\hat{\theta},P_t),\\
108		\cov(v_{t+1},\theta)=0.
	98	\theta_t\sim N(\hat{\theta}_t,P_t),\\
	99	\cov(v_{t+1},\theta_t)=0.
109	100	\end{gather}
110	101
111		Budeme po�adovat, aby odhadovac�rocedura \eqref{the} st� hodnoty parametru $\theta_{t+1}$ byla tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e
	102	Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta_{t+1}\|I_t)$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl�
	103	\begin{gather}
	104	K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\
	105	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\
	106	P_{t+1}=(I-K_tA_t)P_t.
	107	\end{gather}
	108	Odvozen�ze nal� v \cite{peterka1981bayesian}.
	109
	110	Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty parametru $\theta_{t+1}$ budeme hledat ve tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e
112	111	\begin{equation}
113	112	\label{opr}
114		\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\~~tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t~~),
	113	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\E_{\theta,v_t}y_{t+1}),
115	114	\end{equation}
116		kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro ni jako funkci $K_t$ m� ps�
	115	kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro �um $v_t$ budeme po�adovat nulovou st� hodnotu a existenci druh� momentu. Matici rozptylu ozna�e op�$Q_t$.
	116
	117	Pro matici $P_{t+1}$ jako funkci $K_t$ m� ps�
117	118	\begin{equation}
118	119	P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T].
…	…
120	121
121	122	Dosazen�za $\hat{\theta}_{t+1}$ z \eqref{opr} a za $y_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$)
122		\begin{align}
123		P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \~~nonumber \~~\
124		&=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \~~nonumber \~~\
125		&=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\~~nonumber \~~\
	123	\begin{align*}
	124	P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \\
	125	&=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \\
	126	&=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\\
126	127	&-K_t\cov(\theta,v_t)(I-K_tA_t)^T+K_t\E\left\{v_t^2\right\}K_t^T.
127		\end{align}
	128	\end{align*}
128	129
129	130	Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,v_t)=0$ m�
…	…
157	158	P_{t+1}=(I-K_tA_t)P_t
158	159	\end{equation}
159		Celkov�edy od p�� odhadu parametru $N(\hat{\theta}_t,P_t)$ k nov� $N(\hat{\theta}_{t+1},P_{t+1})$ p�me pomoc�\begin{gather}
160		K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\
161		\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\
162		P_{t+1}=(I-K_tA_t)P_t.
163		\end{gather}
164
165		Tato odhadovac�rocedura se naz�lman�ltr [ref].
	160	Rovnice \eqref{opr}, \eqref{Kt} a \eqref{Pt+12} p�avuj�ovnice Kalmanova filtru.

applications/dual/SIDP/text/ch3.tex

r918	r919
1		A�liv pou�it�ynamick� programov� p��ok v ��lohy ~~du�~~� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty a 2) minimalizace vzhledem k $u_t$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod�
	1	A�liv pou�it�ynamick� programov� p��ok v ��lohy stochastick� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty a 2) minimalizace vzhledem k $u_t$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod�
2	2
3	3	V t� kapitole se p�� popis n�lika mo�n��up�proximativn� ��lohy du�� P�e� �e �u du�� je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr�
4	4	\begin{equation}
5	5	\label{ilos2}
6		J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t,~~\theta~~_t),v_t)\right\},
	6	J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t,T_t),v_t)\right\},
7	7	\end{equation}
8	8	za apriorn�nformace $\theta_0$ a podm�k
9	9	\begin{gather}
10	10	\label{the2}
11		~~\theta_{t+1}=f_t(I_t,\theta~~_t,u_t,y_{t+1}),\\
12		\label{poz4}
13		y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(I_t,\theta_t,u_t,v_{t+1}), \qquad t=0,\ldots,N-1.\\
	11	T_{t+1}=f_t(I_t,T_t,u_t,y_{t+1}),\\
	12	\label{poz3}
	13	y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(I_t,\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1.\\
14	14	v_{t+1}\sim N(0,Q_{t+1})\\
15		\theta_t\sim N(\hat{\theta},P_t),\\
16		\cov(v_{t+1},\theta~~)=0.~~
	15	\theta_t\sim N(\hat{\theta}_t,P_t),\\
	16	\cov(v_{t+1},\theta_t)=0,
17	17	\end{gather}
	18	kde $T_t$ je dostate� statistika pro parametr $\theta$ v �e $t$.
18	19
19	20	�ohu �e pomoc�ynamick� programov�, tedy postupnou minimalizac��n�tr� od konce �� horizontu
20	21	\begin{gather}
21		J_N(I_N,~~\theta~~_N)=\E_{\theta_N,v_N}\left\{g_N(y_N)\right\},\\
	22	J_N(I_N,T_N)=\E_{\theta_N,v_N}\left\{g_N(y_N)\right\},\\
22	23	\label{los3}
23		J_t(I_t,~~\theta_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{g_t(y_t,u_t,v_t)+J_{t+1}((I_t, ,u_t,y_{t+1},\theta_{t+1}))\|I_t,\theta~~_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,
	24	J_t(I_t,T_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{g_t(y_t,u_t,v_t)+J_{t+1}((I_t, ,u_t,y_{t+1},T_{t+1}))\|I_t,T_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,
24	25	\end{gather}
25		kde $~~\theta_{t+1}$ a $y_{t+1}$ se po��le \eqref{the2} a \eqref{poz4~~}.
	26	kde $T_{t+1}$ a $y_{t+1}$ se po��le \eqref{the2} a \eqref{poz3}.
26	27
27	28	\section{Certainty equivalent control}
28		P�u�it�etody Certainty equivalent control (CEC) ~~[ref]~~ se v rovnici pro o��nou ztr� nahrad��dn�eli�y sv��mi hodnotami. O��n�tr� tak p� v
	29	P�u�it�etody Certainty equivalent control (CEC) se v rovnici pro o��nou ztr� nahrad��dn�eli�y sv��mi hodnotami. O��n�tr� tak p� v
29	30	\begin{gather}
30	31	\label{CE}
31		J_N(I_N, ~~\theta~~_N)=g_N(y_N),\\
32		J_t(I_t, ~~\theta_t)=\min_{u_t \in U_t}\left\{g_t(y_t,u_t,\hat{v}_t) +J_{t+1}(I_t,\theta_{t+1},u_t,\hat{y}_{t+1}))\|I_t,\theta~~_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,
	32	J_N(I_N, T_N)=g_N(y_N),\\
	33	J_t(I_t, T_t)=\min_{u_t \in U_t}\left\{g_t(y_t,u_t,\hat{v}_t) +J_{t+1}(I_t,T_{t+1},u_t,\hat{y}_{t+1}))\|I_t,T_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,
33	34	\end{gather}
34	35
	36	Podrobn��ojedn� s diskuz�spekt��it�EC lze nal� v \cite{bertsekas1995dynamic}.
	37
35	38	\section{Metoda separace}
36		P�u�it�etody separace ~~[ref]~~ je proces ��ozd�n do dvou f�: 1) indentifikace nezn�ho parametru a 2) ��a pou�it�dhadu $\hat{\theta}$ z prvn��.
	39	P�u�it�etody separace je proces ��ozd�n do dvou f�: 1) indentifikace nezn�ho parametru a 2) ��a pou�it�dhadu $\hat{\theta}$ z prvn��.
37	40
38	41	Prvn�� slou�� nez�sl� sb� dat, kter�sou n�edn�ou�ita k odhadu nezn�ho parametru. K odhadu m� pou��nap�d rovnici \eqref{the2}. V druh�� pak po zbytek �� horizontu pou�ijeme pro n�h ��trategie odhad $\hat{\theta}$ z prvn��.
39	42
40		\section{SIDP}
41		Metoda stochastick� iterativn� dynamick� programov� (SIDP) [ref] spo�� sou�n�pou�it�metody Monte Carlo k z�� aproximace pro o��nou ztr� a iterativn� dynamick� programov� k nalezen�ptim��trategie.
	43	%\section{Du��n�
	44	%Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz��n�ref].
42	45
43		\s~~ubs~~ection{Metoda Monte Carlo}
44		Metoda Monte Carlo ~~je statistick�imula� metoda, kterou navrhl ... [ref]. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty.~~
	46	\section{Metoda Monte Carlo}
	47	Metoda Monte Carlo [ref] je statistick�imula� metoda. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty. V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{ilos2}.
45	48
46		V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{ilos2}. P��n�pou�it�ynamick� programov� m� p�po� $J_t(I_t,\theta_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(I_{t+1},\theta_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal�� uchov�j�\mu_t(I_t,\theta_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�eli�y $(\theta_{t:N-1},v_{t:N})$, tedy
	49	P��n�pou�it�ynamick� programov� m� p�po� $J_t(I_t,T_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(I_{t+1},T_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal�� uchov�j�\mu_t(I_t,T_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�eli�y $(\theta_{t:N-1},v_{t:N})$, tedy
47	50	\begin{equation}
48	51	\label{mon}
49		\frac{1}{n}\sum_{i=1}^n\left(g_N(y_N^i)+\sum_{j=t}^{N-1}g_j(y_j^i,\mu_j(I_j^i,~~\theta~~_j),v_j^i)\right),
	52	\frac{1}{n}\sum_{i=1}^n\left(g_N(y_N^i)+\sum_{j=t}^{N-1}g_j(y_j^i,\mu_j(I_j^i,T_j),v_j^i)\right),
50	53	\end{equation}
51	54	kde $y_{j+1}^i$ se po��odle \eqref{poz3} jako
52	55	\begin{equation}
53		y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu(I_j^i, ~~\theta~~_j),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n,
	56	y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu(I_j^i, T_j),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n,
54	57	\end{equation}
55		a index $i$ ozna�e $i$-tou realizaci dan�eli�y. Realizace $\theta_{t:N-1}$ se generuj�od�trajektorie \eqref{poz~~4}. To znamen��e dan�$\theta_{k+1}$ se generuje a� ve chv�, kdy je zn� $I_k$, $u_k$, rozd�n�\theta_k$ a $y_{k+1}$ a tedy p�eqref{the2} i rozd�n�\theta_{k+1}~~$.
	58	a index $i$ ozna�e $i$-tou realizaci dan�eli�y. Realizace $\theta_{t:N-1}$ se generuj�od�trajektorie \eqref{poz3}. To znamen��e dan�$\theta_{k+1}$ se generuje a� ve chv�, kdy je zn� $I_k$, $u_k$, posta�� statistika $T_k$ a $y_{k+1}$ a tedy p�eqref{the2} i hustota pravd�dobnosti $f(\theta_{k+1})$.
56	59
57		Tento jednoduch�up lze vylep�it v��ov�ovn�m. Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�f]. V tomto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na z�ad�ealizac�e vyberou ti kandid�, na kter�abyto minima s pravd�dobnost��e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraveny algoritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m��u��ouze k odfiltrov� zjevn�or�� kandid� na ��Pro � t� pr� nicm� posta�e z�adn�erze metody Monte Carlo a je proto v n�eduj� implementaci SIDP pou�ita.
	60	Tento jednoduch�up lze vylep�it v��ov�ovn�m kandid� na ��Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�ite{nelson2001simple}. V prvn�� tohoto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na jejich z�ad�e vyberou ti, na kter�abyto minima s pravd�dobnost��e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraven�ritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m��u��ouze k odfiltrov� zjevn�or�� kandid� na ��
58	61
59		\s~~ubs~~ection{Iterativn�ynamick�rogramov�}
60		Iterativn�ynamick�rogramov� ~~[ref]~~ je jedn� p�p�alezen�ptim��trategie, kter�inimalizuje o��nou ztr� \eqref{ilos2}. Oproti dynamick� programov� se probl��iterativn�Na za�ku se zvol��k�priorn�trategie. V ka�d�teraci se potom vych� ze strategie spo�n� p�oz�kroku a prost�ctv�perturbac�ohoto (suboptim��) ��e hled�trategie, pro kterou bude o�van�tr� ni��Tato se pou�ije v n�eduj� iteraci.
	62	\section{Iterativn�ynamick�rogramov�}
	63	Iterativn�ynamick�rogramov� \cite{luus2000iterative} je jedn� p�p�alezen�ptim��trategie, kter�inimalizuje o��nou ztr� \eqref{ilos2}. Oproti dynamick� programov� se probl��iterativn�Na za�ku se zvol��k�priorn�trategie. V ka�d�teraci se potom vych� ze strategie spo�n� p�oz�kroku a prost�ctv�perturbac�ohoto (suboptim��) ��e hled�trategie, pro kterou bude o�van�tr� ni��Tato se pou�ije v n�eduj� iteraci.
61	64
62	65	\subsection{Diskretizace prostoru}
63		P�ed� optim��trategie $\mu_t(I_t,\theta_t)$ bychom pro p� vy�len��n�tr� \eqref{mon} na � �� horizontu $t:N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(I_t,\theta_t)$ a po�at $\mu_t(I_t,\theta_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci). V t� pr� vol� druhou zm�nou metodu. Poznamenejme, �e d� p�kladu gaussovsk� rozd�n�arametru ${\theta_t}$, diskretizace vyhledem k ${\theta_t}$ znamen�iskretizaci vzhledem k ${(\hat{\theta}_t,P_t)}$.
	66	P�ed� optim��trategie $\mu_t(I_t,T_t)$ bychom pro p� vy�len��n�tr� \eqref{mon} na � �� horizontu $t:N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(I_t,T_t)$ a po�at $\mu_t(I_t,T_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci).
64	67
65		Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov��st v� rychle stoupat (o �ov��sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $(I,~~\theta~~)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena.
	68	Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov��st v� rychle stoupat (o �ov��sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $(I,T)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena.
66	69
67		V t� pr� je volena jednoduch�etoda v kter�e spo� nejmen��yperkv� kolem zasa�en�ak, �e se vezme nejmen��yperkv� orientovan�m� sou�ch os, do kter� se vygenerovan�ody vejdou. Prostor se pot�iskretizuje pouze v t� oblasti. Metodu k ur��yperkv�u s obecnou orientac�ze naj�v [ref].
	70	V t� pr� je volena jednoduch�etoda v kter�e spo� nejmen��yperkv� kolem zasa�en�ak, �e se vezme nejmen��yperkv� orientovan�m� sou�ch os, do kter� se vygenerovan�ody vejdou. Prostor se pot�iskretizuje pouze v t� oblasti. Metodu k ur��yperkv�u s obecnou orientac�ze naj�v \cite{bh-eamvb-01}.
	71
	72	\section{SIDP}
	73	Metoda stochastick� iterativn� dynamick� programov� (SIDP) \cite{thompson2005stochastic} spo�� sou�n�pou�it�metody Monte Carlo k z�� aproximace pro o��nou ztr� a iterativn� dynamick� programov� k nalezen�ptim��trategie. Pro � t� posta�e z�adn�erze metody Monte Carlo a je proto v n�eduj� implementaci SIDP pou�ita. P�u�it�terativn� dynamick� programov� se uch�k diskretizovat prostoru hyperstav�udeme pou��t interpolaci (pop��xtrapolaci) napo�n�dnot. Poznamenejme, �e d� p�kladu gaussovsk� rozd�n�arametru ${\theta_t}$, diskretizace vzhledem k ${T_t}$ znamen�iskretizaci vzhledem k ${(\hat{\theta}_t,P_t)}$.
68	74
69	75	\subsection{Algoritmus SIDP}

applications/dual/SIDP/text/ch4.tex

r918	r919
1		V t� kapitole je pops�jednoduch��~~popsan�ef]~~. Na n�jsou porovn� ��lgoritmy uveden� p�l�apitole.
	1	V t� kapitole je pops�jednoduch��diskutovan�ite{astrom1986dual}. Na n�jsou porovn� ��lgoritmy uveden� p�l�apitole.
2	2
3	3	\section{Popis syst�}
…	…
59	59
60	60	\subsection{SIDP}
61		Dle \eqref{dos} je optim��u_t$ z�sl�a $(y_t,\hat{\theta}_t,P_t)$. P�mulaci m� tedy v ka�d��ov�okam�iku $t$ diskretizovat t�enzion��rostor nez�sle prom��le ~~[ref]~~ je v�ak p�amotnou simulac�hodn�� k transformaci prostoru $(y_t,\hat{\theta}_t,P_t,u_t)$ do nov�om��\eta_t,\beta_t,\zeta_t,\nu_t)$ dle
	61	Dle \eqref{dos} je optim��u_t$ z�sl�a $(y_t,\hat{\theta}_t,P_t)$. P�mulaci m� tedy v ka�d��ov�okam�iku $t$ diskretizovat t�enzion��rostor nez�sle prom��le \cite{astrom1986dual} je v�ak p�amotnou simulac�hodn�� k transformaci prostoru $(y_t,\hat{\theta}_t,P_t,u_t)$ do nov�om��\eta_t,\beta_t,\zeta_t,\nu_t)$ dle
62	62	\begin{gather}
63	63	\eta_t=\frac{y_t}{\sigma} \\

applications/dual/SIDP/text/uvod.tex

r891	r919
2	2
3	3	Za �m ��yst�, kter�sou bu�atolik slo�it��e jejich deterministick�s je nemo�n�o obsahuj��dn�rvky ji� ze sv�odstaty, vzniklo stochastick��n�nebo-li optim��n�a neur�osti. C�m stochastick� ��e minimalizovat velikost odchylek syst� od po�adovan� stavu optimalizac��c� z�h�
4		Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman[]. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce.
5
6		Tento p�p m�nalytick�e�en�ouze v p��nalosti v�ech parametr�t�, co� je v�inou nemo�n�V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr�
	4	Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman \cite{bellman1957dynamic}. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce.
7	5
8	6	P�aplikace tohoto postupu je v�ak bohu�el i u pom��ednoduch�a� komplikov� slo�itost��. K ��lohy je proto vhodn�o��aproxima�ch metod.
9		\newline
	7
	8	V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� cite{feldbaum1965optimal}. Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr�
10	9
11	10	Tato bakal�k�r� si klade n�eduj� c�
12	11	\begin{itemize}
13		\item
14		Formulace � stochastick� ��\item
15		��en�lohy stochastick� �� aditivn�tr�uvou funkc�omoc�u�� \item
16		Formulace � stochastick� ��a ne�ch informac� jej��en�a � s �mi znalostmi syst�
17		\item
18		P�aven��er�roxima�ch p�p�u�� zejm� pak stochastick� iterativn� dynamick� programov�
19		\item
20		Aplixace du�� nalezen�ptim��trategie na jednoduch�syst�
21		\item
22		Porovn� uveden�roxima�ch p�p�jednoduch�syst�
	12	\item Formulace � stochastick� ��\item ��en�lohy stochastick� �� aditivn�tr�uvou funkc�omoc�ynamick� programov�
	13	\item Formulace � stochastick� �� ne�m pozorov�m a jej��en�a � s �mi znalostmi syst�
	14	\item P�aven��er�boptim�� p�p�loze stochastick� ��\item Aplikace a porovn� zm�n�tod k nalezen�ptim��trategie na jednoduch�syst�
23	15	\end{itemize}

Download in other formats: