Show
Ignore:
Timestamp:
04/04/10 15:43:06 (14 years ago)
Author:
zimamiro
Message:
 
Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/dual/SIDP/text/ch1.tex

    r872 r891  
     1DEFINICNI OBORY 
    12\section{Formulace � stochastick� �� 
    2 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�jeho v�. �zen�tj. ovliv�n�tavu syst�, m� prov�t  vstup�t� pr� budeme p�kl�t, �e v� charakterizuj�tav syst� �. To nemus��cn�ravda, postup p�zen� nedokonal�formacemi o stavu syst� je uveden nap�d v []. Obecn�e d�k�t, �e � s ��yst� s ne�mi informacemi o stavu se d�kvivalentn�ransformovat na � ��yst� s �mi informacemi o stavu. 
    3  
    4 Budeme-li p�kl�t diskr��ovahu �u m� syst�v �ov� okam�iku $t$ popsat syst�m rovnic  
     3�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�\emph{v�}. V t� kapitole budeme p�kl�t, �e m� stav syst� m�t p� P�em nep�o m�n� nezn�mi parametry se zab�sleduj� kapitola. �zen�tj. ovliv�n�tavu syst�, m� prov�t pomoc�emph{vstup� 
     4Budeme-li p�kl�t diskr��ovahu �u, m� stav syst�v �ov� okam�iku $t$ pod��� horizontu d�y $N$ popsat syst�m rovnic 
    55\begin{equation} 
    66\label{sys} 
    77x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1, 
    88\end{equation} 
    9 kde $x_t$ je v�v �e $t$, $u_t$ je vstup v �e t a $w_t$ je n�dn�eli�a. 
    10   
    11 D� m� p�su ztr�vou funkci 
     9kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. 
     10 
     11D� m� p�sanou ztr�vou funkci 
    1212\begin{equation} 
    13 g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1}) 
     13g(x_{0:N},u_{0:N-1},w_{0:N-1}). 
    1414\end{equation} 
    1515 
    16 Posloupnost��c� strategi�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$ budeme rozum�posloupnost zobrazen�\begin{equation} 
     16Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation} 
    1717\label{con} 
    1818\mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1, 
    19 \end{equation}  
     19\end{equation} 
     20 
     21PRIPUSTNE STRATEGIE 
    2022 
    2123Pro danou ��trategii ozna� o��nou ztr� jako 
    22 \begin{multline} 
     24\begin{equation} 
    2325\label{los} 
    24 J_\pi(x_0)=\\ 
    25 \E_{w_0,\ldots,w_{N-1}}\left\{g(x_0\ldots,x_N,\mu_0(x_0),\ldots,\mu_{N-1}(x_{N-1}),w_0,\ldots,w_{N-1})\right\} 
    26 \end{multline}  
     26J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\} 
     27\end{equation} 
    2728 
    2829�ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation} 
     
    3738\begin{equation} 
    3839\label{adi} 
    39 g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t) 
     40g(x_{0:N},u_{0:N-1},w_{0:N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t) 
    4041\end{equation} 
    4142 
    42 O��nou ztr� \eqref{los} tedy m� p�t do tvaru 
     43O��nou ztr� \eqref{los} potom m� p�t do tvaru 
    4344\begin{equation} 
    44 J_\pi(x_0)=\E_{w_0,\ldots,w_{N-1}}\left\{g_N(x_N)+\sum_{t=0}^N(g_t(x_t,\mu_t(x_t),w_t))\right\} 
     45J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g_N(x_N)+\sum_{t=0}^Ng_t(x_t,\mu_t(x_t),w_t)\right\} 
    4546\end{equation} 
    4647 
    4748Takto specifikovan�loha se d�e�it pou�it�dynamick� programov� []. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality.  Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v []. 
    4849 
    49 P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$ a m� pro ni ps� 
    50  
    51 \begin{equation} 
    52 J_N(x_N)=g_N(x_N) 
    53 \end{equation} 
    54 \begin{equation} 
     50P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$. M� pro ni ps� 
     51\begin{gather} 
     52J_N(x_N)=g_N(x_N)\\ 
    5553J_t(x_t)=\min_{u_t \in U(x_t)}\E_{w_t}\left\{g_k(x_t,u_t,w_t)+J_{t+1}(f_t(x_t,u_t,w_t))\right\} \qquad t=0,\ldots,N-1 
    56 \end{equation} 
     54\end{gather} 
    5755 
    5856P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(x_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�pl� syst�rovnic 
     
    6159J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1 
    6260\end{equation} 
    63 je optim��osloupnost rozhodnut�Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$. 
     61je optim��osloupnost rozhodnut�Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$.