Changeset 1090 for applications/dual
- Timestamp:
- 06/13/10 17:27:15 (15 years ago)
- Location:
- applications/dual/SIDP/text
- Files:
-
- 5 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/dual/SIDP/text/ch1.tex
r919 r1090 1 1 DEFINICNI OBORY 2 2 \section{Formulace � stochastick� �� 3 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Budeme-li p�kl�t diskr��ovahu �u, stav syst� v �ov� 3 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Budeme-li p�kl�t diskr��ovahu �u, stav syst� v �ov�okam�iku $t$ pod��� horizontu d�y $N$ popisuje syst�rovnic 4 4 \begin{equation} 5 5 \label{sys} … … 10 10 V � ��� v�dy p�sanou ztr�vou (resp. �vou) funkci 11 11 \begin{equation} 12 g(x_{ 0:N},u_{0:N-1},w_{0:N-1}).12 g(x_{1:N},u_{0:N-1}). 13 13 \end{equation} 14 14 15 Ozna� $U(x_t)$ mno�inu p�tn�d�ch z�h� syst�ve stavu $x_t$. P osloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation}15 Ozna� $U(x_t)$ mno�inu p�tn�d�ch z�h� syst�ve stavu $x_t$. P�tnou ��trategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation} 16 16 \label{con} 17 17 \mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1, … … 22 22 \begin{equation} 23 23 \label{los} 24 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{ 0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\}.24 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{1:N},\mu_{0:N-1}(x_{0:N-1}))\right\}. 25 25 \end{equation} 26 26 27 27 �ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation} 28 J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0) .28 J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0), 29 29 \end{equation} 30 kde $\Pi$ zna�mno�inu v�ech p�tn�d�ch strategi� 30 31 31 32 Celkov�e tedy jedn� optimaliza� � nal� takovou posloupnost funkc�eqref{con}, kter�inimalizuje o��nou ztr�vu \eqref{los} za podm�k \eqref{sys}. 32 33 33 34 \section{Pou�it�ynamick� programov� p��en�lohy stochastick� �� aditivn�tr�u} 34 �ohu stochastick� ��ak, jak byla definov� v p�oz��i, nelze obecn�e�it. Je tedy pot�� n�k bl� specifikovat. V tomto sm� je mo�n�mezit se na n�k�i��var ztr�v�unkce \eqref{los}. Jako vhodn�e �en�eukazuje uva�ovat tzv. aditivn�var ztr�v�unkce, tedy �e existuj�unkce $g_t$ takov��e m� ps�35 �ohu stochastick� ��ak, jak byla definov� v p�oz��i, nelze obecn�e�it. Je tedy pot�� n�k bl� specifikovat. V tomto sm� je mo�n�mezit se na n�k�i��var ztr�v�unkce \eqref{los}. Jako vhodn�e ukazuje uva�ovat tzv. aditivn�var ztr�v�unkce, tedy �e existuj�unkce $g_t$ takov��e m� ps� 35 36 \begin{equation} 36 37 \label{adi} 37 g(x_{ 0:N},u_{0:N-1},w_{0:N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t)38 g(x_{1:N},u_{0:N-1})=\sum_{t=1}^{N-1}g_t(x_{t+1},u_t). 38 39 \end{equation} 39 40 40 41 O��nou ztr� \eqref{los} potom m� p�t do tvaru 41 42 \begin{equation} 42 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{ g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,\mu_t(x_t),w_t)\right\}43 J_\pi(x_0)=\E_{w_{0:N-1}}\left\{\sum_{t=0}^{N-1}g_t(x_{t+1},\mu_t(x_t))\right\}. 43 44 \end{equation} 44 45 45 Takto specifikovan�loha se d�e�it pou�it�dynamick� programov� []. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality. Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v [ref].46 Takto specifikovan�loha se d�e�it pou�it�dynamick� programov� \cite{bellman1957dynamic}. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality. Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v \cite{bertsekas1995dynamic}. 46 47 47 48 P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$. M� pro ni ps� 48 49 \begin{gather} 49 J_N(x_N)= g_N(x_N)\\50 J_t(x_t)=\min_{u_t \in U(x_t)}\E_{w_t}\left\{g_k(x_ t,u_t,w_t)+J_{t+1}(f_t(x_t,u_t,w_t))\right\} \qquad t=0,\ldots,N-150 J_N(x_N)=0\\ 51 J_t(x_t)=\min_{u_t \in U(x_t)}\E_{w_t}\left\{g_k(x_{t+1},u_t)+J_{t+1}(x_{t+1})\right\} \qquad t=0,\ldots,N-1. 51 52 \end{gather} 52 53 53 P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(x_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�pl� syst�rovnic 54 P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(x_t)$. Pro v� $x_{t+1}$ se pou�ije rovnice \eqref{sys}. 55 Libovolnou ��trategii $\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�pl� syst�rovnic 54 56 \begin{equation} 55 57 \label{impl} 56 58 J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1 57 59 \end{equation} 58 je optim��osloupnost rozhodnut�60 pak nazveme optim��osloupnost�ozhodnut� -
applications/dual/SIDP/text/ch2.tex
r930 r1090 1 P�likaci matematick� modelov� na ���k�onkr��lohy se obvykle pot�s probl�m, jak ur� konstanty, kter�an�l ur��Zkoum�-li nap�d n�k�k��yst� z rozboru fyzik�� z�nitost�bvykle zn� tvar rovnic, kter�r��eho v� �e, nicm� po�e� podm�y �parametry, kter� rovnic� vystupuj� jsou pro dan��charakteristick�m� z�at pouze nep� obvykle m�n�vhodn�li�. Modifikac�lohy stochastick� ��ro p� p�nosti nezn�ch parametr�zab�to kapitola. 2 1 P�likaci matematick� modelov� na ���k�onkr��lohy se obvykle pot�s probl�m, jak ur� konstanty, kter�an�l ur��Zkoum�-li nap�d n�k�k��yst� z rozboru fyzik�� z�nitost�bvykle zn� tvar rovnic, kter�r��eho v� �e, nicm� po�e� podm�y �parametry, kter� rovnic� vystupuj� jsou pro dan��charakteristick�m� z�at pouze nep� obvykle m�n�vhodn�li�. Tato kapitola se zab�difikac�lohy stochastick� ��ro p� p�nosti nezn�ch parametr� 3 2 \section{Formulace � stochastick� �� nep�mi daty} 4 3 Informace o stavu syst� $x_t$ v �e $t$ z��me pomoc�� $y_t$, kter��jako 5 4 \begin{equation} 6 5 \label{poz} 7 y_0=h_0(x_0,v_0),\qquad y_ t=h_t(x_t,u_{t-1},v_t), \qquad t=1,\ldots,N-1,6 y_0=h_0(x_0,v_0),\qquad y_{t+1}=h_{t+1}(x_{t+1},u_t,v_{t+1}), \qquad t=1,\ldots,N-1, 8 7 \end{equation} 9 8 kde $v_t$ je n�dn�eli�a charakterizuj� chybu m�n�Po�e� stav $x_0$ je d�rozd�n�pravd�dobnosti $P^{x_0}$ a dal���yst� ur�e soustava \eqref{sys}. … … 11 10 Informace, kter�sou v pr� �� dispozici je zvykem ps�ve form�zv. \emph{informa�ho vektoru}, kter�var 12 11 \begin{equation} 13 I_0=y_0,\qquad I_ t=(y_{0:t},u_{0:t-1}), \qquad t=1,\ldots,N-1.12 I_0=y_0,\qquad I_{t+1}=(y_{0:t+1},u_{0:t}), \qquad t=1,\ldots,N-1. 14 13 \end{equation} 15 14 16 �d� strategie $\pi=\mu_{0:N-1}$ nyn�em�xplicitn��set na stavu syst�, proto�e m� k dispozici pouze informa� vektor. Hled� tedy15 �d� z�h nyn�em�xplicitn��set na stavu syst�, proto�e m� k dispozici pouze informa� vektor. Podobn�ako v p�l�apitole proto zav�me mno�inu $U(I_t)$ v�ech p�tn�d�ch z�h�informace $I_t$ a p�tnou ��trategi�ude $\pi=\mu_{0:N-1}$ 17 16 \begin{equation} 18 17 \label{icon} 19 18 \mu_t(I_t)=u_t \, \qquad t=0,1,\ldots,N-1, 20 19 \end{equation} 20 kde $u_t \in U(I_t)$ je p�tn�c��h. 21 21 22 PRIPUSTNE STRATEGIE 23 24 �olem je naj�p�tnou strategii \eqref{icon}, kter�y minimalizovala o��nou ztr� 22 �olem je naj�p�tnou strategii, kter�y minimalizovala o��nou ztr� 25 23 \begin{equation} 26 24 \label{ilos} 27 J_\pi=\E_{\substack{x_0,\ w_{0:N-1},\\ v_{0:N-1}}}\left\{ g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,\mu_t(I_t),w_t)\right\},25 J_\pi=\E_{\substack{x_0,\ w_{0:N-1},\\ v_{0:N-1}}}\left\{\sum_{t=0}^{N-1}g_t(x_{t+1},\mu_t(x_t))\right\}, 28 26 \end{equation} 29 27 za podm�k \eqref{sys} a \eqref{poz}. … … 39 37 40 38 D� p�me k nov�tr�v�unkci, kterou definujeme jako 41 \begin{gather} 42 \tilde{g}_N(I_N)=\E_{x_N}\left\{g_N(x_N)|I_N\right\}, \\ \tilde{g}_t(I_t,u_t,w_t)=\E_{x_t}\left\{g_t(x_t,u_t,w_t)|I_t,u_t\right\}, \qquad t=1,\ldots,N-1. 43 \end{gather} 39 \begin{equation} 40 \tilde{g}_t(I_{t+1},u_t)=\E_{x_{t+1}}\left\{g_t(x_{t+1},u_t)|I_t,u_t\right\}, \qquad t=1,\ldots,N-1, 41 \end{equation} 42 kde $x_{t+1}$ se po��le \eqref{sys} a $x_t$ se pova�uje za n�dnou veli�u podm�nou informa�m vektorem $I_t$. 44 43 45 44 O��nou ztr� nyn�� ps�ve tvaru 46 45 \begin{gather} 47 J_N(I_N)= \tilde{g}_N(I_N)\\48 J_t(I_t)=\min_{u_t \in U_t}\E_{w_t,y_{t+1}}\left\{\tilde{g}_t(I_ t,u_t,w_t)+J_{t+1}((I_t,u_t,y_{t+1}))|I_t,u_t\right\} \qquad t=0,\ldots,N-146 J_N(I_N)=0\\ 47 J_t(I_t)=\min_{u_t \in U_t}\E_{w_t,y_{t+1}}\left\{\tilde{g}_t(I_{t+1},u_t)+J_{t+1}(I_{t+1})|I_t,u_t\right\} \qquad t=0,\ldots,N-1 49 48 \end{gather} 50 49 51 Tato � ji� m��ena pomoc�ynamick� programov�. P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(I_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�ab�nim����n�tr� $J_0(y_0)$ je optim�� osloupnost rozhodnut�50 Tato � ji� m��ena pomoc�ynamick� programov�. P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(I_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�ab�nim����n�tr� $J_0(y_0)$ je optim���c�trategie. 52 51 53 52 \section{�zen�yst� s nezn�mi parametry} … … 57 56 \begin{equation} 58 57 \label{poz2} 59 y_0=h_0(\theta,v_0),\qquad y_ t=h_t(I_{t-1},\theta,u_{t-1},v_t), \qquad t=1,\ldots,N-1,58 y_0=h_0(\theta,v_0),\qquad y_{t+1}=h_t(I_t^{(d)},\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1, 60 59 \end{equation} 60 kde $I_t^{(d)}=(y_{t:t-d},u_{t-1:t-d})$ a �lo $d$ se naz�d modelu. 61 61 62 Ztr�v�unkce je nyn�\begin{equation} 63 \label{los2} 64 g(y_{0:N},u_{0:N-1},v_{0:N-1})=g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,u_t,v_t). 65 \end{equation} 66 67 Ozna� $T_t$ testovac�tatistiku pro parametr $\theta$ zalo�enou na informac� dostupn� �e $t$. Do $T_t$ zahrneme rovnez ty cleny $I_t$, kter�ystupuj� \eqref{poz2}, abychom mohli ps� 68 \begin{equation} 69 \label{poz3} 70 y_{t+1}=h_t(T_t,\theta,u_t,v_{t+1}). 71 \end{equation} 62 Ozna� $T_t$ dostate�u statistiku pro parametr $\theta$ zalo�enou na informac� dostupn� �e $t$. Pokud dostate� statistika neexistuje, pak bude $T_t$ ozna�at n�kou jej�hodnou aproximaci. Ozna� d� $H_t=(I_t^{(d)},T_t)$ tzv. hyperstav syst�. 72 63 73 64 P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci v podob�ustoty pravd�dobnosti $f(\theta|T_0)$. Aposteriorn�ustotu $f(\theta|T_{t+1})$ z�� pomoc�ayesova vzorce 74 65 \begin{equation} 75 66 \label{bay} 76 f(\theta|T_{t+1})=\frac{f(T_{t+1}|\theta,T_t)f(\theta|T_t)}{\int f(T_{t+1}|\theta,T_t)f(\theta|T_t)\mathrm{d}\theta} 67 f(\theta|T_{t+1}) = \frac{f(y_{t+1} | \theta, I_t^{(d)},u_t) f(\theta| T_t)} 68 {\int f(y_{t+1} | \theta, I_t^{(d)},u_t) f(\theta| T_t)\mathrm{d}\theta} 77 69 \end{equation} 78 Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ je postup Bayesovsk� u��cite{peterka1981bayesian}.70 Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ se naz�stup Bayesovsk� u��cite{peterka1981bayesian}. 79 71 80 Pro v� estovac�tatistiky v �e m� podle \eqref{bay} ps�72 Pro v�yperstavu $H_t$ v �e m� na z�ad�eqref{bay} ps� 81 73 \begin{equation} 82 74 \label{the} 83 T_{t+1}=f_t(T_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1.75 H_{t+1}=f_t(H_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1. 84 76 \end{equation} 85 Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $ T_t$ a vstup $u_t$ s �umem $y_{t+1}$.77 Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $H_t$ a vstup $u_t$ s �umem $y_{t+1}$. 86 78 87 Hustota pravd�dobnosti pro odhad parametru $\theta$ v rovnici pro v�\eqref{poz3} je v �e $t$ ur�a testovac�tatistikou $T_t$. Rovnice \eqref{the}, \eqref{poz3} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty. 79 Ztr�v�unkce je nyn�\begin{equation} 80 \label{los2} 81 g(y_{1:N},u_{0:N-1})=\sum_{t=0}^{N-1}g_t(y_{t+1},u_t). 82 \end{equation} 83 84 �ohou je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr� 85 \begin{equation} 86 \label{ilos2} 87 J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{\sum_{t=0}^{N-1}g_t(y_{t+1},\mu_t(H_t))\right\}, 88 \end{equation} 89 za apriorn�nformace $f(\theta|T_0)$, zn�ho rozd�n�umu $v_t$ a podm�k \eqref{the} a \eqref{poz2}. 90 91 Rovnice \eqref{the}, \eqref{poz2} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty. 92 93 �ohu �e pomoc�ynamick� programov�, tedy postupnou minimalizac���n�tr� od konce �� horizontu 94 \begin{gather} 95 J_N(H_N)=0\\ 96 \label{los3} 97 J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{g_t(y_{t+1},u_t)+J_{t+1}(H_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1, 98 \end{gather} 99 kde $H_{t+1}$ se po��le \eqref{the}. St� hodnota vzhledem k $y_{t+1}$ se po��omoc�eqref{poz2} a $f(\theta|T_t)$ jako�to aktu�� odhadu na parametr $\theta$. 88 100 89 101 \subsection{Kalman�ltr} … … 93 105 \begin{equation} 94 106 \label{sys2} 95 y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t) )\theta+v_{t+1}, , \qquad t=0,\ldots,N-1.107 y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t)\theta+v_{t+1}, , \qquad t=0,\ldots,N-1. 96 108 \end{equation} 97 109 … … 106 118 \end{gather} 107 119 108 Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta _{t+1}|I_t)$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl�120 Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta|T_{t+1})$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl� rovnice 109 121 \begin{gather} 110 122 K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\ … … 114 126 Odvozen�ze nal� v \cite{peterka1981bayesian}. 115 127 116 Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty parametru $\theta_{t+1}$ budeme hledat ve tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e128 Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty $\hat{\theta}_{t+1}$ nezn�ho parametru $\theta$ budeme hledat ve tvaru line��pravy st� hodnoty $\hat{\theta}_t$ ��eur�osti v syst�. Tedy �e 117 129 \begin{equation} 118 130 \label{opr} -
applications/dual/SIDP/text/ch3.tex
r930 r1090 3 3 V t� kapitole se p�� popis n�lika mo�n��up�proximativn� ��lohy du�� ��P�e� �e �u du�� ��je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr� 4 4 \begin{equation} 5 \label{ilos 2}6 J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{ g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t,T_t),v_t)\right\},5 \label{ilos3} 6 J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{\sum_{t=0}^{N-1}g_t(y_{t+1},\mu_t(H_t))\right\}, 7 7 \end{equation} 8 8 za apriorn�nformace $\theta_0$ a podm�k 9 9 \begin{gather} 10 10 \label{the2} 11 T_{t+1}=f_t(I_t,T_t,u_t,y_{t+1}),\\11 H_{t+1}=f_t(H_t,u_t,y_{t+1}),\\ 12 12 \label{poz4} 13 y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(I_t,\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1.\\ 14 v_{t+1}\sim N(0,Q_{t+1})\\ 15 \theta_t\sim N(\hat{\theta}_t,P_t),\\ 16 \cov(v_{t+1},\theta_t)=0, 13 y_0=h_0(\theta,v_0),\qquad y_{t+1}=h_t(I_t^{(d)},\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1, 17 14 \end{gather} 18 kde $ T_t$ je dostate� statistika proparametr $\theta$ v �e $t$.15 kde $H_t=(I_t^{(d)},T_t)$ je hyperstav syst� a $T_t$ dostate� statistika pro nezn� parametr $\theta$ v �e $t$. 19 16 20 17 �ohu �e pomoc�ynamick� programov�, tedy postupnou minimalizac���n�tr� od konce �� horizontu 21 \begin{gather} 22 J_N(I_N,T_N)=\E_{\theta_N,v_N}\left\{g_N(y_N)\right\},\\ 18 \begin{equation} 23 19 \label{los3} 24 J_t( I_t,T_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{g_t(y_t,u_t,v_t)+J_{t+1}((I_t, ,u_t,y_{t+1},T_{t+1}))|I_t,T_t,u_t\right\}, \\\qquad t=0,\ldots,N-1,25 \end{ gather}20 J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{g_t(y_{t+1},u_t)+J_{t+1}(H_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1, 21 \end{equation} 26 22 kde $T_{t+1}$ a $y_{t+1}$ se po��le \eqref{the2} a \eqref{poz4}. 27 23 28 24 \section{Certainty equivalent control} 29 P�u�it�etody Certainty equivalent control (CEC) se v rovnici pro o��nou ztr� nahrad��dn�eli� y sv��mi hodnotami. O��n�tr�tak p� v25 P�u�it�etody Certainty equivalent control (CEC) se v rovnici pro o��nou ztr� nahrad��dn�eli�a $y_{t+1}$ st� hodnotou $\hat{y}_{t+1}$. Ta se vypo�� \eqref{poz4} pomoc�n�ch rozd�n�a $v_t$ a posta�� statistiky $T_t$. O��n�tr� \eqref{los} tak p� v 30 26 \begin{gather} 31 27 \label{CE} 32 J_N(I_N, T_N)=g_N(y_N),\\ 33 J_t(I_t, T_t)=\min_{u_t \in U_t}\left\{g_t(y_t,u_t,\hat{v}_t) +J_{t+1}(I_t,T_{t+1},u_t,\hat{y}_{t+1}))|I_t,T_t,u_t\right\}, \\ \qquad t=0,\ldots,N-1, 28 J_t(H_t)=\min_{u_t \in U_t}\left\{g_t(\hat{y}_t,u_t)+J_{t+1}(\hat{H}_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1, 34 29 \end{gather} 35 30 … … 41 36 Prvn�� slou�� nez�sl� sb� dat, kter�sou n�edn�ou�ita k odhadu nezn�ho parametru. K odhadu m� pou��nap�d rovnici \eqref{the2}. V druh�� pak po zbytek �� horizontu pou�ijeme pro n�h ��trategie odhad $\hat{\theta}$ z prvn��. 42 37 43 %\section{Du���n�44 %Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. 38 \section{Du���n� 39 Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. ODKAZ NA FILDEBAUMA, POPIS PRINCIPU... (napr JEDNOKROKOVA OPTIMALIZACE S BUZENIM - FILATOV) 45 40 46 41 \section{Metoda Monte Carlo} 47 Metoda Monte Carlo [ref] je statistick�imula� metoda. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty. V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{ilos2}.42 Metoda Monte Carlo \cite{hammersley1964monte} je statistick�imula� metoda. Jej�rincip spo��e vzorkov� n�k��dn�eli�y za �m odhadu jej�ledan�harakteristiky, nap�� hodnoty. V t� pr� je metoda Monte Carlo pou�ita k v� o��n�tr� \eqref{los3}. 48 43 49 P��n�pou�it�ynamick� programov� m� p�po� $J_t( I_t,T_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(I_{t+1},T_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal��� uchov�j�\mu_t(I_t,T_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�eli�y$(\theta_{t:N-1},v_{t:N})$, tedy44 P��n�pou�it�ynamick� programov� m� p�po� $J_t(H_t)$ k dispozici p�s pro n�eduj� o��nou ztr� $J_{t+1}(H_{t+1})$. Metoda monte Carlo n�v�ak d� dispozici pouze odhad o��n�tr� a pou�it��to aproximac� dal��v� by chybu v� navy�ovalo. Nam�o toho se pro dal��� uchov�j�\mu_t(H_t)$ a o��n�tr� v �e $t$ se pak po��ako pr�p�n$ realizac��dn�li�y p�ter�e prov�na st� hodnota $(\theta_{t:N-1},v_{t:N})$, tedy 50 45 \begin{equation} 51 46 \label{mon} 52 \frac{1}{n}\sum_{i=1}^n\left( g_N(y_N^i)+\sum_{j=t}^{N-1}g_j(y_j^i,\mu_j(I_j^i,T_j),v_j^i)\right),47 \frac{1}{n}\sum_{i=1}^n\left(\sum_{j=t}^{N-1}g_j(y_{j+1}^i,\mu_j(H_j^i)\right), 53 48 \end{equation} 54 49 kde $y_{j+1}^i$ se po��odle \eqref{poz4} jako 55 50 \begin{equation} 56 y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu( I_j^i, T_j),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n,51 y_{j+1}^i=h_j( I_j^i,\theta_j^i,\mu(H_j^i),v_{j+1}^i), \qquad j=t,\ldots,N-1, \qquad i=1\ldots,n, 57 52 \end{equation} 58 53 a index $i$ ozna�e $i$-tou realizaci dan�eli�y. Realizace $\theta_{t:N-1}$ se generuj�od�trajektorie \eqref{poz4}. To znamen��e dan�$\theta_{k+1}$ se generuje a� ve chv�, kdy je zn� $I_k$, $u_k$, posta�� statistika $T_k$ a $y_{k+1}$ a tedy p�eqref{the2} i hustota pravd�dobnosti $f(\theta_{k+1})$. 59 54 60 Tento jednoduch�up lze vylep�it v��ov�ovn�m kandid� na ��Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�ite{nelson2001simple}. V prvn�� tohoto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na jejich z�ad�e vyberou ti, na kter�abyto minima s pravd�dobnost���e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraven�ritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m������u��ouze k odfiltrov� zjevn�or�� kandid� na ��55 Tento jednoduch�up lze vylep�it v��ov�ovn�m kandid� na optim���n�Jedn�z mo�n�lep�en� je dvou�ov�ritmus poposan�ite{nelson2001simple}. V prvn�� tohoto algoritmu se nejprve pro ka�d� kandid� vygeneruje $n_0$ realizac�Na jejich z�ad�e vyberou ti, na kter�abyto minima s pravd�dobnost���e� je dan�ez $\alpha_0$. Pro tyto se v druh�� vygeneruje dostate� po� realizac�ak, aby bylo mo�n�ejlep��ozhodnut�volit s pravd�dobnost�lespo�vn�adan�ezi $\alpha_1$. Takto upraven�ritmus metody Monte Carlo je robustn�� umo�� porovn� v�� mno�stv�andid�, nebo� po� realizac� prvn�� m������u��ouze k odfiltrov� zjevn�or�� kandid� na �� 61 56 62 57 \section{Iterativn�ynamick�rogramov�} … … 64 59 65 60 \subsection{Diskretizace prostoru} 66 P�ed� optim��trategie $\mu_t( I_t,T_t)$ bychom pro p� vy�len���n�tr� \eqref{mon} na � �� horizontu $t:N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(I_t,T_t)$ a po�at $\mu_t(I_t,T_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci).61 P�ed� optim��trategie $\mu_t(H_t)$ bychom pro p� vy�len���n�tr� \eqref{mon} na � �� horizontu $t\!:\!N$ pot�ali jej�nalytick�yj�en�To ale nen�bvykle mo�n�Je proto nutn�� k n�k�proximaci, nap�d 1) p�kl�t n�k� optim��trategie a p�po� ur� pouze konstanty, kter��ou strategii ur�jednozna�, nebo 2) diskretizovat prostor $(H_t)$ a po�at $\mu_t(H_t)$ jen v bodech diskretizace a jinde se uch� interpolaci (pop��xtrapolaci). 67 62 68 Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov���st v� rychle stoupat (o �ov���sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $( I,T)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena.63 Jak�sobem efektivn�iskretizovat prostor nez�sl�om��o aproximativn�� o��n�tr� \eqref{mon} je p�u�it�ynamick� programov� obt��t�a. Bude-li bod�iskretizaci p� m�, bude v� nespolehliv�pak pro p� jemnou diskretizaci bude �ov���st v� rychle stoupat (o �ov���sti SIDP viz d�). Zde se ukazuje v�st pou�it�terativn� dynamick� programov�, nebo� sta�diskretizovat jen tu �t prostoru kter�ude pot� v n�eduj� iteraci. Pomoc�trategie spo�n� p�oz�kroku a n�dn�alizac�umu $v_{0:N}$ a nezn�ho parametru $\theta_{0:N}$ vygenerujeme trajektorie v $(H)_{0:N}$. V ka�d�asov�rovni pak diskretizujeme jen tu �t prostoru, kter�yla zasa�ena. 69 64 70 65 V t� pr� je volena jednoduch�etoda v kter�e spo� nejmen��yperkv� kolem zasa�en�ak, �e se vezme nejmen��yperkv� orientovan�m� sou�ch os, do kter� se vygenerovan�ody vejdou. Prostor se pot�iskretizuje pouze v t� oblasti. Metodu k ur��yperkv�u s obecnou orientac�ze naj�v \cite{bh-eamvb-01}. … … 74 69 75 70 \subsection{Algoritmus SIDP} 76 V tomto od� je pops�algoritmus SIDP. Jeho parametry jsou71 V tomto od� je sch�ticky pops�algoritmus SIDP. Jeho parametry jsou 77 72 78 73 \begin{itemize} … … 87 82 \end{itemize} 88 83 89 Jak plyne z n�eduj�ho popisu, �ov�lo�itost SIDP vzhledem k jeho parametr� $O(n_{pass}n_{iter}N^2mn _g^{\dim H_N})$ (�ov���st metody Monte Carlo je ��zd�nosti od konce horizontu).84 Jak plyne z n�eduj�ho popisu, �ov�lo�itost SIDP vzhledem k jeho parametr� $O(n_{pass}n_{iter}N^2mnn_g^{\dim H_N})$ (�ov���st metody Monte Carlo je ��zd�nosti od konce horizontu, proto je �ov�lo�itost ��ruh�ocnin�N$). 90 85 91 86 \begin{algorithm} -
applications/dual/SIDP/text/ch4.tex
r930 r1090 1 V t� kapitole je pops�jednoduch�� na kter�jsou porovn� ��lgoritmy uveden� p�l�apitole. Syst�byl podrobn�koum�v \cite{astrom1986dual}. Pro srovn� uv�me tam���y.1 V t� kapitole je pops�jednoduch��zkouman�ite{astrom1986dual}. Na n�jsou porovn� ��lgoritmy uveden� p�l�apitole. 2 2 3 3 \section{Popis syst�} … … 5 5 \begin{gather} 6 6 \label{simple} 7 y_{t+1}=y_t+\theta_tu_t+v_{t+1} \qquad t=0,\ldots,N-1,\\ 8 v_t\sim N(0,\sigma^2).\\ 9 \theta_t\sim N(\hat{\theta},P_t),\\ 7 y_{t+1}=y_t+\theta u_t+v_{t+1} \qquad t=0,\ldots,N-1,\\ 8 v_{t+1}\sim N(0,\sigma^2), 9 \end{gather} 10 kde rozptyl �umu $\sigma$ je zn� 11 12 O nezn�m parametru $\theta$ m� v �e $t$ informaci v podob�ostate� statistiky $T_t=(\hat{\theta},P_t)$, tvo�st� hodnotou a rozptylem. P�kl�me nekorelovanost $\theta$ s �umem, tedy �e 13 \begin{equation} 10 14 \cov(v_{t+1},\theta)=0. 11 \end{ gather}15 \end{equation} 12 16 13 17 Ztr�vou funkci vol� kvadratickou, tedy 14 18 \begin{equation} 15 g(y_{0:N},u_{0:N-1} ,v_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2.19 g(y_{0:N},u_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2. 16 20 \end{equation} 17 21 … … 24 28 \end{gather} 25 29 26 O��n�tr� je30 Hyperstav syst� $H_t$ tvo�ktor $(y_t,\hat{\theta}_t,P_t)$. O��n�tr� je 27 31 \begin{equation} 28 J_t( y_t,\theta_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{y_{t+1}^2+J_{t+1}(y_{t+1},\theta_{t+1})|y_t,\theta_t,u_t\right\}, \qquad t=0,\ldots,N-1.32 J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{y_{t+1}^2+J_{t+1}(H_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1. 29 33 \end{equation} 30 34 … … 35 39 \end{gather} 36 40 37 ZDE BY MEL BYT ANGSTROM+...38 39 41 \section{Specifika jednotliv��up� tomto odd� jsou pops� n�er�spekty algoritm�er�udeme srovn�t, p�likaci na syst�\eqref{simple}. 40 42 … … 42 44 O��n�tr� \eqref{CE} prejde v 43 45 \begin{gather} 44 J_t( y_t, \theta_t)=\min_{u_t \in U_t}\left\{\hat{y}_{t+1}^2 +J_{t+1}(y_{t+1},\theta_{t+1})|I_t,\theta_t,u_t\right\}.46 J_t(H_t)=\min_{u_t \in U_t}\left\{\hat{y}_t^2 +J_{t+1}(\hat{H}_{t+1})|I_t,\theta_t,u_t\right\}. 45 47 \end{gather} 46 48 St� hodnota v� je