Changeset 919 for applications
- Timestamp:
- 05/02/10 23:05:37 (15 years ago)
- Location:
- applications/dual/SIDP/text
- Files:
-
- 7 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/dual/SIDP/text/baksimple.tex
r917 r919 47 47 \chapter{�oha stochastick� �� 48 48 \input{ch1.tex} 49 \chapter{�oha stochastick� �� ne p�mi daty}49 \chapter{�oha stochastick� �� ne�m pozorov�m} 50 50 \input{ch2.tex} 51 51 \chapter{Suboptim���py k � du�� �� … … 63 63 64 64 % !!! Literatura se �abecedn� 65 \input{literatura.tex} % text, kter�kl�n z jin� souboru, MَETE ZM�IT N�EV souboru nebo smazat tento � a seznam literatury napsat p�sem 65 \bibliographystyle{plain} 66 \bibliography{literatura} 67 %\input{literatura.bib} % text, kter�kl�n z jin� souboru, MَETE ZM�IT N�EV souboru nebo smazat tento � a seznam literatury napsat p�sem 66 68 67 69 \newpage % SEM NESAHEJTE! -
applications/dual/SIDP/text/ch1.tex
r918 r919 1 1 DEFINICNI OBORY 2 2 \section{Formulace � stochastick� �� 3 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�\emph{v�}. V t� kapitole budeme p�kl�t, �e m� stav syst� m�t p� P�em nep�o m�n� nezn�mi parametry se zab�sleduj� kapitola. �zen�tj. ovliv�n�tavu syst�, m� prov�t pomoc�emph{vstup� 4 Budeme-li p�kl�t diskr��ovahu �u, m� stav syst�v �ov� okam�iku $t$ pod��� horizontu d�y $N$ popsat syst�m rovnic 3 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Budeme-li p�kl�t diskr��ovahu �u, stav syst� v �ov� okam�iku $t$ pod��� horizontu d�y $N$ popisuje syst�rovnic 5 4 \begin{equation} 6 5 \label{sys} 7 6 x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1, 8 7 \end{equation} 9 kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. 8 kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. V t� kapitole budeme p�kl�t, �e m� stav syst� pozorovat. P�em ne�ho pozorov� se zab�sleduj� kapitola. 10 9 11 D� m� p�sanou ztr�voufunkci10 V � ��� v�dy p�sanou ztr�vou (resp. �vou) funkci 12 11 \begin{equation} 13 12 g(x_{0:N},u_{0:N-1},w_{0:N-1}). 14 13 \end{equation} 15 14 16 Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation}15 Ozna� $U(x_t)$ mno�inu p�tn�d�ch z�h� syst�ve stavu $x_t$. Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation} 17 16 \label{con} 18 17 \mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1, 19 18 \end{equation} 20 21 PRIPUSTNE STRATEGIE 19 kde $u_t \in U(x_t)$ je p�tn�c��h. 22 20 23 21 Pro danou ��trategii ozna� o��nou ztr� jako 24 22 \begin{equation} 25 23 \label{los} 26 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\} 24 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\}. 27 25 \end{equation} 28 26 29 27 �ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation} 30 J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0) 28 J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0). 31 29 \end{equation} 32 30 33 31 Celkov�e tedy jedn� optimaliza� � nal� takovou posloupnost funkc�eqref{con}, kter�inimalizuje o��nou ztr�vu \eqref{los} za podm�k \eqref{sys}. 34 35 32 36 33 \section{Pou�it�ynamick� programov� p��en�lohy stochastick� �� aditivn�tr�u} … … 59 56 J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1 60 57 \end{equation} 61 je optim��osloupnost rozhodnut� Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$.58 je optim��osloupnost rozhodnut� -
applications/dual/SIDP/text/ch2.tex
r918 r919 52 52 53 53 \section{�zen�yst� s nezn�mi parametry} 54 Pokud rovnice syst� obsahuje n�k�� parametr $\theta$, m� vyu��znalosti ��robl� s ne�mi informacemi.54 Pokud chceme � syst� jeho� v�z�s�a n�k�nezn�m konstant�parametru $\theta$, m� vyu��znalosti ��robl� s ne�m pozorov�m. 55 55 56 Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. 57 58 V � du�� ��� v� syst� $y_t$ pops� jako 56 V t� � m� v� syst� $y_t$ pops� jako 59 57 \begin{equation} 60 58 \label{poz2} … … 67 65 \end{equation} 68 66 69 P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci $\theta_0$ a odhadovac�roceduru tvaru 70 \begin{equation} 71 \label{the} 72 \theta_{t+1}=f_t(I_t,\theta_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1. 73 \end{equation} 74 Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $(I_t, \theta_t)$, vstup $u_t$ s �umem $y_{t+1}$. Do rovnice \eqref{poz2} dosad� za $\theta$ jeho aktu��dhad, tedy 75 \begin{equation} 76 \label{poz3} 77 y_0=h_0(\theta_0,v_0),\qquad y_t=h_t(\theta_{t-1}, I_{t-1},u_{t-1},v_t), \qquad t=1,\ldots,N-1, 78 \end{equation} 79 80 Rovnice \eqref{the}, \eqref{poz3} a \eqref{los2} p�avuj�lohu stochastick� �� nep�mi daty. 81 82 \subsection{Bayesovsk��� 83 P�ar�up, jak pro nezn� parametr $\theta$ z�at aposteriorn�ustotu pravd�dobnosti $f(\theta_{t+1}|I_t)$, je-li k dispozici apriorn�ustota pravd�dobnosti $f(\theta_t)$ a informa� vektor $I_t$, je aplikace Bayesova vzorce 67 Ozna� $\theta_t$ rozlo�en�dhadu pro parametr $\theta$ v �e $t$. P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci v podob�ustoty pravd�dobnosti $f(\theta_0)$. Aposteriorn�ustotu $f(\theta_{t+1}|I_t)$ z�� pomoc�ayesova vzorce 84 68 \begin{equation} 85 69 \label{bay} … … 88 72 Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ je postup Bayesovsk� u��ref]. 89 73 90 P�nkr��vypo� m��ak tento p�p dv�ev� 1) nikdy nem� k dispozici $f(I_t|\theta_{t+1})$, ale pouze aproximaci z m�n�I_t$ a 2) aposteriorn�ustota pravd�dobnosti nemus��analytick�yj�en�co� jej�ou�it� dal��v� komplikuje. 74 Ozna� $T_t$ doste�u statistiku pro $\theta_t$. Potom dle \eqref{bay} m� ps� 75 \begin{equation} 76 \label{the} 77 T_{t+1}=f_t(I_t,T_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1. 78 \end{equation} 79 Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $(I_t, T_t)$, vstup $u_t$ s �umem $y_{t+1}$. 80 81 Hustota pravd�dobnosti parametru $\theta$ v rovnici pro v�\eqref{poz2} je v �e $t$ ur�a dostate�u statistikou $T_t$. Rovnice \eqref{the}, \eqref{poz2} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty. 91 82 92 83 \subsection{Kalman�ltr} 93 Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje gausovk�a nezn� parametr je separov�jako line� �n, situace se zna� zjednodu��84 Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje aditivn�aussovk�a nezn� parametr je separov�jako line� �n, m� vypo�at konkr��var rovnice \eqref{the}, tzv. Kalman�ltr \cite{kalman1960new}. 94 85 95 86 Dle p�kladu m��v �e $t$ tvar 96 87 \begin{equation} 97 88 \label{sys2} 98 y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta _t+v_{t+1}, , \qquad t=0,\ldots,N-1.89 y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta+v_{t+1}, , \qquad t=0,\ldots,N-1. 99 90 \end{equation} 100 91 101 kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gaus ovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem92 kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gaussovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem 102 93 \begin{equation} 103 94 v_{t+1}\sim N(0,Q_{t+1}), 104 95 \end{equation} 105 gaus ovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy96 gaussovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy 106 97 \begin{gather} 107 \theta_t\sim N(\hat{\theta} ,P_t),\\108 \cov(v_{t+1},\theta )=0.98 \theta_t\sim N(\hat{\theta}_t,P_t),\\ 99 \cov(v_{t+1},\theta_t)=0. 109 100 \end{gather} 110 101 111 Budeme po�adovat, aby odhadovac�rocedura \eqref{the} st� hodnoty parametru $\theta_{t+1}$ byla tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e 102 Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta_{t+1}|I_t)$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl� 103 \begin{gather} 104 K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\ 105 \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\ 106 P_{t+1}=(I-K_tA_t)P_t. 107 \end{gather} 108 Odvozen�ze nal� v \cite{peterka1981bayesian}. 109 110 Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty parametru $\theta_{t+1}$ budeme hledat ve tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e 112 111 \begin{equation} 113 112 \label{opr} 114 \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\ tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),113 \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\E_{\theta,v_t}y_{t+1}), 115 114 \end{equation} 116 kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro ni jako funkci $K_t$ m� ps� 115 kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro �um $v_t$ budeme po�adovat nulovou st� hodnotu a existenci druh� momentu. Matici rozptylu ozna�e op�$Q_t$. 116 117 Pro matici $P_{t+1}$ jako funkci $K_t$ m� ps� 117 118 \begin{equation} 118 119 P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T]. … … 120 121 121 122 Dosazen�za $\hat{\theta}_{t+1}$ z \eqref{opr} a za $y_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$) 122 \begin{align }123 P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \ nonumber \\124 &=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \ nonumber \\125 &=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\ nonumber \\123 \begin{align*} 124 P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \\ 125 &=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \\ 126 &=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\\ 126 127 &-K_t\cov(\theta,v_t)(I-K_tA_t)^T+K_t\E\left\{v_t^2\right\}K_t^T. 127 \end{align }128 \end{align*} 128 129 129 130 Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,v_t)=0$ m� … … 157 158 P_{t+1}=(I-K_tA_t)P_t 158 159 \end{equation} 159 Celkov�edy od p�� odhadu parametru $N(\hat{\theta}_t,P_t)$ k nov� $N(\hat{\theta}_{t+1},P_{t+1})$ p�me pomoc�\begin{gather} 160 K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\ 161 \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\ 162 P_{t+1}=(I-K_tA_t)P_t. 163 \end{gather} 164 165 Tato odhadovac�rocedura se naz�lman�ltr [ref]. 160 Rovnice \eqref{opr}, \eqref{Kt} a \eqref{Pt+12} p�avuj�ovnice Kalmanova filtru. -
applications/dual/SIDP/text/ch3.tex
r918 r919 1 A�liv pou�it�ynamick� programov� p����ok v ��lohy du�� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty a 2) minimalizace vzhledem k $u_t$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod�1 A�liv pou�it�ynamick� programov� p����ok v ��lohy stochastick� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty a 2) minimalizace vzhledem k $u_t$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod� 2 2 3 3 V t� kapitole se p�� popis n�lika mo�n��up�proximativn� ��lohy du�� ��P�e� �e �u du�� ��je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr� 4 4 \begin{equation} 5 5 \label{ilos2} 6 J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t, \theta_t),v_t)\right\},6 J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t,T_t),v_t)\right\}, 7 7 \end{equation} 8 8 za apriorn�nformace $\theta_0$ a podm�k 9 9 \begin{gather} 10 10 \label{the2} 11 \theta_{t+1}=f_t(I_t,\theta_t,u_t,y_{t+1}),\\12 \label{poz 4}13 y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(I_t,\theta _t,u_t,v_{t+1}), \qquad t=0,\ldots,N-1.\\11 T_{t+1}=f_t(I_t,T_t,u_t,y_{t+1}),\\ 12 \label{poz3} 13 y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(I_t,\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1.\\ 14 14 v_{t+1}\sim N(0,Q_{t+1})\\ 15 \theta_t\sim N(\hat{\theta} ,P_t),\\16 \cov(v_{t+1},\theta )=0.15 \theta_t\sim N(\hat{\theta}_t,P_t),\\ 16 \cov(v_{t+1},\theta_t)=0, 17 17 \end{gather} 18 kde $T_t$ je dostate� statistika pro parametr $\theta$ v �e $t$. 18 19 19 20 �ohu �e pomoc�ynamick� programov�, tedy postupnou minimalizac���n�tr� od konce �� horizontu 20 21 \begin{gather} 21 J_N(I_N, \theta_N)=\E_{\theta_N,v_N}\left\{g_N(y_N)\right\},\\22 J_N(I_N,T_N)=\E_{\theta_N,v_N}\left\{g_N(y_N)\right\},\\ 22 23 \label{los3} 23 J_t(I_t, \theta_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{g_t(y_t,u_t,v_t)+J_{t+1}((I_t, ,u_t,y_{t+1},\theta_{t+1}))|I_t,\theta_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,24 J_t(I_t,T_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{g_t(y_t,u_t,v_t)+J_{t+1}((I_t, ,u_t,y_{t+1},T_{t+1}))|I_t,T_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1, 24 25 \end{gather} 25 kde $ \theta_{t+1}$ a $y_{t+1}$ se po��le \eqref{the2} a \eqref{poz4}.26 kde $T_{t+1}$ a $y_{t+1}$ se po��le \eqref{the2} a \eqref{poz3}. 26 27 27 28 \section{Certainty equivalent control} 28 P�u�it�etody Certainty equivalent control (CEC) [ref]se v rovnici pro o��nou ztr� nahrad��dn�eli�y sv��mi hodnotami. O��n�tr� tak p� v29 P�u�it�etody Certainty equivalent control (CEC) se v rovnici pro o��nou ztr� nahrad��dn�eli�y sv��mi hodnotami. O��n�tr� tak p� v 29 30 \begin{gather} 30 31 \label{CE} 31 J_N(I_N, \theta_N)=g_N(y_N),\\32 J_t(I_t, \theta_t)=\min_{u_t \in U_t}\left\{g_t(y_t,u_t,\hat{v}_t) +J_{t+1}(I_t,\theta_{t+1},u_t,\hat{y}_{t+1}))|I_t,\theta_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1,32 J_N(I_N, T_N)=g_N(y_N),\\ 33 J_t(I_t, T_t)=\min_{u_t \in U_t}\left\{g_t(y_t,u_t,\hat{v}_t) +J_{t+1}(I_t,T_{t+1},u_t,\hat{y}_{t+1}))|I_t,T_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1, 33 34 \end{gather} 34 35 36 Podrobn��ojedn� s diskuz�spekt��it�EC lze nal� v \cite{bertsekas1995dynamic}. 37 35 38 \section{Metoda separace} 36 P�u�it�etody separace [ref]je proces ��ozd�n do dvou f�: 1) indentifikace nezn�ho parametru a 2) ��a pou�it�dhadu $\hat{\theta}$ z prvn��.39 P�u�it�etody separace je proces ��ozd�n do dvou f�: 1) indentifikace nezn�ho parametru a 2) ��a pou�it�dhadu $\hat{\theta}$ z prvn��. 37 40 38 41 Prvn�� slou�� nez�sl� sb� dat, kter�sou n�edn�ou�ita k odhadu nezn�ho parametru. K odhadu m� pou��nap�d rovnici \eqref{the2}. V druh�� pak po zbytek �� horizontu pou�ijeme pro n�h ��trategie odhad $\hat{\theta}$ z prvn��. 39 42 40 \section{SIDP} 41 Metoda stochastick� iterativn� dynamick� programov� (SIDP) [ref] spo�� sou�n�pou�it�metody Monte Carlo k z�� aproximace pro o��nou ztr� a iterativn� dynamick� programov� k nalezen�ptim��trategie.43 %\section{Du���n� 44 %Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. 42 45 43 \s ubsection{Metoda Monte Carlo}44 Metoda Monte Carlo je statistick�imula� metoda, kterou navrhl ... [ref]. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty.46 \section{Metoda Monte Carlo} 47 Metoda Monte Carlo [ref] je statistick�imula� metoda. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty. V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{ilos2}. 45 48 46 V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{ilos2}. P��n�pou�it�ynamick� programov� m� p�po� $J_t(I_t,\theta_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(I_{t+1},\theta_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal��� uchov�j�\mu_t(I_t,\theta_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�eli�y $(\theta_{t:N-1},v_{t:N})$, tedy49 P��n�pou�it�ynamick� programov� m� p�po� $J_t(I_t,T_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(I_{t+1},T_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal��� uchov�j�\mu_t(I_t,T_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�eli�y $(\theta_{t:N-1},v_{t:N})$, tedy 47 50 \begin{equation} 48 51 \label{mon} 49 \frac{1}{n}\sum_{i=1}^n\left(g_N(y_N^i)+\sum_{j=t}^{N-1}g_j(y_j^i,\mu_j(I_j^i, \theta_j),v_j^i)\right),52 \frac{1}{n}\sum_{i=1}^n\left(g_N(y_N^i)+\sum_{j=t}^{N-1}g_j(y_j^i,\mu_j(I_j^i,T_j),v_j^i)\right), 50 53 \end{equation} 51 54 kde $y_{j+1}^i$ se po��odle \eqref{poz3} jako 52 55 \begin{equation} 53 y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu(I_j^i, \theta_j),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n,56 y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu(I_j^i, T_j),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n, 54 57 \end{equation} 55 a index $i$ ozna�e $i$-tou realizaci dan�eli�y. Realizace $\theta_{t:N-1}$ se generuj�od�trajektorie \eqref{poz 4}. To znamen��e dan�$\theta_{k+1}$ se generuje a� ve chv�, kdy je zn� $I_k$, $u_k$, rozd�n�\theta_k$ a $y_{k+1}$ a tedy p�eqref{the2} i rozd�n�\theta_{k+1}$.58 a index $i$ ozna�e $i$-tou realizaci dan�eli�y. Realizace $\theta_{t:N-1}$ se generuj�od�trajektorie \eqref{poz3}. To znamen��e dan�$\theta_{k+1}$ se generuje a� ve chv�, kdy je zn� $I_k$, $u_k$, posta�� statistika $T_k$ a $y_{k+1}$ a tedy p�eqref{the2} i hustota pravd�dobnosti $f(\theta_{k+1})$. 56 59 57 Tento jednoduch�up lze vylep�it v��ov�ovn�m . Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�f]. V tomto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na z�ad�ealizac�e vyberou ti kandid�, na kter�abyto minima s pravd�dobnost���e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraveny algoritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m������u��ouze k odfiltrov� zjevn�or�� kandid� na ��Pro � t� pr� nicm� posta�e z�adn�erze metody Monte Carlo a je proto v n�eduj� implementaci SIDP pou�ita.60 Tento jednoduch�up lze vylep�it v��ov�ovn�m kandid� na ��Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�ite{nelson2001simple}. V prvn�� tohoto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na jejich z�ad�e vyberou ti, na kter�abyto minima s pravd�dobnost���e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraven�ritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m������u��ouze k odfiltrov� zjevn�or�� kandid� na �� 58 61 59 \s ubsection{Iterativn�ynamick�rogramov�}60 Iterativn�ynamick�rogramov� [ref]je jedn� p�p�alezen�ptim��trategie, kter�inimalizuje o��nou ztr� \eqref{ilos2}. Oproti dynamick� programov� se probl��iterativn�Na za�ku se zvol��k�priorn�trategie. V ka�d�teraci se potom vych� ze strategie spo�n� p�oz�kroku a prost�ctv�perturbac�ohoto (suboptim��) ��e hled�trategie, pro kterou bude o�van�tr� ni���Tato se pou�ije v n�eduj� iteraci.62 \section{Iterativn�ynamick�rogramov�} 63 Iterativn�ynamick�rogramov� \cite{luus2000iterative} je jedn� p�p�alezen�ptim��trategie, kter�inimalizuje o��nou ztr� \eqref{ilos2}. Oproti dynamick� programov� se probl��iterativn�Na za�ku se zvol��k�priorn�trategie. V ka�d�teraci se potom vych� ze strategie spo�n� p�oz�kroku a prost�ctv�perturbac�ohoto (suboptim��) ��e hled�trategie, pro kterou bude o�van�tr� ni���Tato se pou�ije v n�eduj� iteraci. 61 64 62 65 \subsection{Diskretizace prostoru} 63 P�ed� optim��trategie $\mu_t(I_t, \theta_t)$ bychom pro p� vy�len���n�tr� \eqref{mon} na � �� horizontu $t:N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(I_t,\theta_t)$ a po�at $\mu_t(I_t,\theta_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci). V t� pr� vol� druhou zm�nou metodu. Poznamenejme, �e d� p�kladu gaussovsk� rozd�n�arametru ${\theta_t}$, diskretizace vyhledem k ${\theta_t}$ znamen�iskretizaci vzhledem k ${(\hat{\theta}_t,P_t)}$.66 P�ed� optim��trategie $\mu_t(I_t,T_t)$ bychom pro p� vy�len���n�tr� \eqref{mon} na � �� horizontu $t:N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(I_t,T_t)$ a po�at $\mu_t(I_t,T_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci). 64 67 65 Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov���st v� rychle stoupat (o �ov���sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $(I, \theta)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena.68 Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov���st v� rychle stoupat (o �ov���sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $(I,T)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena. 66 69 67 V t� pr� je volena jednoduch�etoda v kter�e spo� nejmen��yperkv� kolem zasa�en�ak, �e se vezme nejmen��yperkv� orientovan�m� sou�ch os, do kter� se vygenerovan�ody vejdou. Prostor se pot�iskretizuje pouze v t� oblasti. Metodu k ur��yperkv�u s obecnou orientac�ze naj�v [ref]. 70 V t� pr� je volena jednoduch�etoda v kter�e spo� nejmen��yperkv� kolem zasa�en�ak, �e se vezme nejmen��yperkv� orientovan�m� sou�ch os, do kter� se vygenerovan�ody vejdou. Prostor se pot�iskretizuje pouze v t� oblasti. Metodu k ur��yperkv�u s obecnou orientac�ze naj�v \cite{bh-eamvb-01}. 71 72 \section{SIDP} 73 Metoda stochastick� iterativn� dynamick� programov� (SIDP) \cite{thompson2005stochastic} spo�� sou�n�pou�it�metody Monte Carlo k z�� aproximace pro o��nou ztr� a iterativn� dynamick� programov� k nalezen�ptim��trategie. Pro � t� posta�e z�adn�erze metody Monte Carlo a je proto v n�eduj� implementaci SIDP pou�ita. P�u�it�terativn� dynamick� programov� se uch�k diskretizovat prostoru hyperstav�udeme pou��t interpolaci (pop��xtrapolaci) napo�n�dnot. Poznamenejme, �e d� p�kladu gaussovsk� rozd�n�arametru ${\theta_t}$, diskretizace vzhledem k ${T_t}$ znamen�iskretizaci vzhledem k ${(\hat{\theta}_t,P_t)}$. 68 74 69 75 \subsection{Algoritmus SIDP} -
applications/dual/SIDP/text/ch4.tex
r918 r919 1 V t� kapitole je pops�jednoduch�� popsan�ef]. Na n�jsou porovn� ��lgoritmy uveden� p�l�apitole.1 V t� kapitole je pops�jednoduch��diskutovan�ite{astrom1986dual}. Na n�jsou porovn� ��lgoritmy uveden� p�l�apitole. 2 2 3 3 \section{Popis syst�} … … 59 59 60 60 \subsection{SIDP} 61 Dle \eqref{dos} je optim��u_t$ z�sl�a $(y_t,\hat{\theta}_t,P_t)$. P�mulaci m� tedy v ka�d��ov�okam�iku $t$ diskretizovat t�enzion��rostor nez�sle prom��le [ref]je v�ak p�amotnou simulac�hodn�� k transformaci prostoru $(y_t,\hat{\theta}_t,P_t,u_t)$ do nov�om��\eta_t,\beta_t,\zeta_t,\nu_t)$ dle61 Dle \eqref{dos} je optim��u_t$ z�sl�a $(y_t,\hat{\theta}_t,P_t)$. P�mulaci m� tedy v ka�d��ov�okam�iku $t$ diskretizovat t�enzion��rostor nez�sle prom��le \cite{astrom1986dual} je v�ak p�amotnou simulac�hodn�� k transformaci prostoru $(y_t,\hat{\theta}_t,P_t,u_t)$ do nov�om��\eta_t,\beta_t,\zeta_t,\nu_t)$ dle 62 62 \begin{gather} 63 63 \eta_t=\frac{y_t}{\sigma} \\ -
applications/dual/SIDP/text/uvod.tex
r891 r919 2 2 3 3 Za �m ��yst�, kter�sou bu�atolik slo�it��e jejich deterministick�s je nemo�n�o obsahuj��dn�rvky ji� ze sv�odstaty, vzniklo stochastick��n�nebo-li optim���n�a neur�osti. C�m stochastick� ��e minimalizovat velikost odchylek syst� od po�adovan� stavu optimalizac��c� z�h� 4 Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman[]. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce. 5 6 Tento p�p m�nalytick�e�en�ouze v p��nalosti v�ech parametr�t�, co� je v�inou nemo�n�V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� ��Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr� 4 Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman \cite{bellman1957dynamic}. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce. 7 5 8 6 P�aplikace tohoto postupu je v�ak bohu�el i u pom��ednoduch�a� komplikov� slo�itost��. K ��lohy je proto vhodn�o��aproxima�ch metod. 9 \newline 7 8 V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� ��cite{feldbaum1965optimal}. Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr� 10 9 11 10 Tato bakal�k�r� si klade n�eduj� c� 12 11 \begin{itemize} 13 \item 14 Formulace � stochastick� ��\item 15 ��en�lohy stochastick� �� aditivn�tr�uvou funkc�omoc�u�� ��\item 16 Formulace � stochastick� ��a ne�ch informac� jej��en�a � s �mi znalostmi syst� 17 \item 18 P�aven��er�roxima�ch p�p�u�� ��zejm� pak stochastick� iterativn� dynamick� programov� 19 \item 20 Aplixace du�� �� nalezen�ptim��trategie na jednoduch�syst� 21 \item 22 Porovn� uveden�roxima�ch p�p�jednoduch�syst� 12 \item Formulace � stochastick� ��\item ��en�lohy stochastick� �� aditivn�tr�uvou funkc�omoc�ynamick� programov� 13 \item Formulace � stochastick� �� ne�m pozorov�m a jej��en�a � s �mi znalostmi syst� 14 \item P�aven��er�boptim�� p�p�loze stochastick� ��\item Aplikace a porovn� zm�n�tod k nalezen�ptim��trategie na jednoduch�syst� 23 15 \end{itemize}