root/applications/dual/SIDP/text/ch1.tex @ 930

Revision 919, 3.7 kB (checked in by zimamiro, 15 years ago)
Line 
1DEFINICNI OBORY
2\section{Formulace � stochastick� ��
3�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Budeme-li p�kl�t diskr��ovahu �u, stav syst� v �ov� okam�iku $t$ pod��� horizontu d�y $N$ popisuje syst�rovnic
4\begin{equation}
5\label{sys}
6x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1,
7\end{equation}
8kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. V t� kapitole budeme p�kl�t, �e m� stav syst� pozorovat. P�em ne�ho pozorov� se zab�sleduj� kapitola.
9
10V � ��� v�dy p�sanou ztr�vou (resp. �vou) funkci
11\begin{equation}
12g(x_{0:N},u_{0:N-1},w_{0:N-1}).
13\end{equation}
14
15Ozna� $U(x_t)$ mno�inu p�tn�d�ch z�h� syst�ve stavu $x_t$. Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation}
16\label{con}
17\mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1,
18\end{equation}
19kde $u_t \in U(x_t)$ je p�tn�c��h.
20
21Pro danou ��trategii ozna� o��nou ztr� jako
22\begin{equation}
23\label{los}
24J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\}.
25\end{equation}
26
27�ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation}
28J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0).
29\end{equation}
30
31Celkov�e tedy jedn� optimaliza� � nal� takovou posloupnost funkc�eqref{con}, kter�inimalizuje o��nou ztr�vu \eqref{los} za podm�k \eqref{sys}.
32
33\section{Pou�it�ynamick� programov� p��en�lohy stochastick� �� aditivn�tr�u}
34�ohu stochastick� ��ak, jak byla definov� v p�oz��i, nelze obecn�e�it. Je tedy pot�� n�k bl� specifikovat. V tomto sm� je mo�n�mezit se na n�k�i��var ztr�v�unkce \eqref{los}. Jako vhodn�e�en�e ukazuje uva�ovat tzv. aditivn�var ztr�v�unkce, tedy �e existuj�unkce $g_t$ takov��e m� ps�
35\begin{equation}
36\label{adi}
37g(x_{0:N},u_{0:N-1},w_{0:N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t)
38\end{equation}
39
40O��nou ztr� \eqref{los} potom m� p�t do tvaru
41\begin{equation}
42J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,\mu_t(x_t),w_t)\right\}
43\end{equation}
44
45Takto specifikovan�loha se d�e�it pou�it�dynamick� programov� []. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality.  Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v [ref].
46
47P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$. M� pro ni ps�
48\begin{gather}
49J_N(x_N)=g_N(x_N)\\
50J_t(x_t)=\min_{u_t \in U(x_t)}\E_{w_t}\left\{g_k(x_t,u_t,w_t)+J_{t+1}(f_t(x_t,u_t,w_t))\right\} \qquad t=0,\ldots,N-1
51\end{gather}
52
53P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(x_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�pl� syst�rovnic
54\begin{equation}
55\label{impl}
56J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1
57\end{equation}
58je optim��osloupnost rozhodnut�
Note: See TracBrowser for help on using the browser.