Changeset 891 for applications/dual

Show
Ignore:
Timestamp:
04/04/10 15:43:06 (14 years ago)
Author:
zimamiro
Message:
 
Location:
applications/dual/SIDP/text
Files:
2 added
6 modified

Legend:

Unmodified
Added
Removed
  • applications/dual/SIDP/text/baksimple.tex

    r872 r891  
    3535\newpage % SEM NESAHEJTE! 
    3636 
     37\chapter*{Zna�� 
     38\input{znaceni.tex} 
     39 
    3740\chapter*{�od} \addcontentsline{toc}{chapter}{�od} % SEM NESAHEJTE! 
    3841\input{uvod.tex}  % text � (bez nadpisu) je vkl�n z jin� souboru; lze upravit jm� souboru, resp. smazat tento � a text � napsat p�sem (ale znep�dn�e to) 
     
    4144\chapter{�oha stochastick� �� 
    4245\input{ch1.tex} 
    43 \chapter{Suboptim���py k � stochastick� �� 
     46\chapter{�oha stochastick� �� nep�mi daty} 
    4447\input{ch2.tex} 
     48\chapter{Suboptim���py k � du�� �� 
     49\input{ch3.tex} 
    4550\chapter{Srovn� suboptim���p� ��ednoduch� syst�} 
    46 \input{ch3.tex} 
     51\input{ch4.tex} 
    4752 
    4853\chapter*{Z�r} \addcontentsline{toc}{chapter}{Z�r}   % SEM NESAHEJTE! 
  • applications/dual/SIDP/text/ch1.tex

    r872 r891  
     1DEFINICNI OBORY 
    12\section{Formulace � stochastick� �� 
    2 �t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�jeho v�. �zen�tj. ovliv�n�tavu syst�, m� prov�t  vstup�t� pr� budeme p�kl�t, �e v� charakterizuj�tav syst� �. To nemus��cn�ravda, postup p�zen� nedokonal�formacemi o stavu syst� je uveden nap�d v []. Obecn�e d�k�t, �e � s ��yst� s ne�mi informacemi o stavu se d�kvivalentn�ransformovat na � ��yst� s �mi informacemi o stavu. 
    3  
    4 Budeme-li p�kl�t diskr��ovahu �u m� syst�v �ov� okam�iku $t$ popsat syst�m rovnic  
     3�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�\emph{v�}. V t� kapitole budeme p�kl�t, �e m� stav syst� m�t p� P�em nep�o m�n� nezn�mi parametry se zab�sleduj� kapitola. �zen�tj. ovliv�n�tavu syst�, m� prov�t pomoc�emph{vstup� 
     4Budeme-li p�kl�t diskr��ovahu �u, m� stav syst�v �ov� okam�iku $t$ pod��� horizontu d�y $N$ popsat syst�m rovnic 
    55\begin{equation} 
    66\label{sys} 
    77x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1, 
    88\end{equation} 
    9 kde $x_t$ je v�v �e $t$, $u_t$ je vstup v �e t a $w_t$ je n�dn�eli�a. 
    10   
    11 D� m� p�su ztr�vou funkci 
     9kde $x_t$ je stav syst� v �e $t$, $u_t$ je vstup v �e $t$ a $w_t$ n�dn�eli�a reprezentuj� p�nost �umu. 
     10 
     11D� m� p�sanou ztr�vou funkci 
    1212\begin{equation} 
    13 g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1}) 
     13g(x_{0:N},u_{0:N-1},w_{0:N-1}). 
    1414\end{equation} 
    1515 
    16 Posloupnost��c� strategi�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$ budeme rozum�posloupnost zobrazen�\begin{equation} 
     16Posloupnost��c� strategi�\pi=\mu_{0:N-1}$ budeme rozum�posloupnost zobrazen�\begin{equation} 
    1717\label{con} 
    1818\mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1, 
    19 \end{equation}  
     19\end{equation} 
     20 
     21PRIPUSTNE STRATEGIE 
    2022 
    2123Pro danou ��trategii ozna� o��nou ztr� jako 
    22 \begin{multline} 
     24\begin{equation} 
    2325\label{los} 
    24 J_\pi(x_0)=\\ 
    25 \E_{w_0,\ldots,w_{N-1}}\left\{g(x_0\ldots,x_N,\mu_0(x_0),\ldots,\mu_{N-1}(x_{N-1}),w_0,\ldots,w_{N-1})\right\} 
    26 \end{multline}  
     26J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g(x_{0:N},\mu_{0:N-1}(x_{0:N-1}),w_{0:N-1})\right\} 
     27\end{equation} 
    2728 
    2829�ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation} 
     
    3738\begin{equation} 
    3839\label{adi} 
    39 g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t) 
     40g(x_{0:N},u_{0:N-1},w_{0:N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t) 
    4041\end{equation} 
    4142 
    42 O��nou ztr� \eqref{los} tedy m� p�t do tvaru 
     43O��nou ztr� \eqref{los} potom m� p�t do tvaru 
    4344\begin{equation} 
    44 J_\pi(x_0)=\E_{w_0,\ldots,w_{N-1}}\left\{g_N(x_N)+\sum_{t=0}^N(g_t(x_t,\mu_t(x_t),w_t))\right\} 
     45J_\pi(x_0)=\E_{w_{0:N-1}}\left\{g_N(x_N)+\sum_{t=0}^Ng_t(x_t,\mu_t(x_t),w_t)\right\} 
    4546\end{equation} 
    4647 
    4748Takto specifikovan�loha se d�e�it pou�it�dynamick� programov� []. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality.  Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v []. 
    4849 
    49 P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$ a m� pro ni ps� 
    50  
    51 \begin{equation} 
    52 J_N(x_N)=g_N(x_N) 
    53 \end{equation} 
    54 \begin{equation} 
     50P��en�lohy stochastick� �� aditivn�tr�u je tedy mo�n�ostupovat, jak je u ���moc�ynamick� programov� zvykem. Minim��odnotu st� ztr� od okam�iku $t$ do $N$ v z�slosti na $x_t$ ozna�e $J_t(x_t)$. M� pro ni ps� 
     51\begin{gather} 
     52J_N(x_N)=g_N(x_N)\\ 
    5553J_t(x_t)=\min_{u_t \in U(x_t)}\E_{w_t}\left\{g_k(x_t,u_t,w_t)+J_{t+1}(f_t(x_t,u_t,w_t))\right\} \qquad t=0,\ldots,N-1 
    56 \end{equation} 
     54\end{gather} 
    5755 
    5856P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(x_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�pl� syst�rovnic 
     
    6159J_t(x_t)=\E_{w_t}\left\{g_k(x_t,\mu_t(x_t),w_t)+J_{t+1}(f_t(x_t,\mu_t(x_t),w_t))\right\} \qquad t=0,\ldots,N-1 
    6260\end{equation} 
    63 je optim��osloupnost rozhodnut�Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$. 
     61je optim��osloupnost rozhodnut�Na syst�rovnic \eqref{impl} se tedy m� d�t jako na implicitn��s pro $\pi$.  
  • applications/dual/SIDP/text/ch2.tex

    r872 r891  
    1 \section{Nutnost p� k suboptim��metod� 
    2 A�liv dynamick� programov� p����ok v ��lohy stochastick� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty vzhledem k $w_k$ a 2) n�edn�inimalizace vzhledem k $u_k$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod�   
     1P�likaci matematick� modelov� na ���k�onkr��lohy se obvykle pot�s probl�m, jak ur� konstanty, kter�an�l ur��Zkoum�-li nap�d n�k�k��yst� z rozboru fyzik�� z�nitost�bvykle zn� tvar rovnic, kter�r��eho v� �e, nicm� po�e� podm�y �parametry, kter� rovnic� vystupuj� jsou pro dan��charakteristick�m� z�at pouze nep� obvykle m�n�vhodn�li�. Modifikac�lohy stochastick� ��ro p� p�nosti nezn�ch parametr�zab�to kapitola. 
    32 
    4 \section{Du���n� 
    5 �stou situac� � stochastick� ��e, �e syst�popsan��m rovnic \eqref{sys} obvykle z�s�a n�k�parametru $\theta$, o kter�m� k dispozici pouze n�kou apriorn�nformaci. K �n� ��e tedy vhodn�ejen inimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. 
     3\section{Formulace � stochastick� �� nep�mi daty} 
     4Informace o stavu syst� $x_t$ v �e $t$ z��me pomoc�� $y_t$, kter��jako 
     5\begin{equation} 
     6\label{poz} 
     7y_0=h_0(x_0,v_0),\qquad y_t=h_t(x_t,u_{t-1},v_t), \qquad t=1,\ldots,N-1, 
     8\end{equation} 
     9kde $v_t$ je n�dn�eli�a charakterizuj� chybu m�n�Po�e� stav $x_0$ je d�rozd�n�pravd�dobnosti $P^{x_0}$ a dal���yst� ur�e soustava \eqref{sys}. 
     10 
     11Informace, kter�sou v pr� �� dispozici je zvykem ps�ve form�zv. \emph{informa�ho vektoru}, kter�var 
     12\begin{equation} 
     13I_0=y_0,\qquad I_t=(y_{0:t},u_{0:t-1}), \qquad  t=1,\ldots,N-1. 
     14\end{equation} 
     15 
     16�d� strategie $\pi=\mu_{0:N-1}$ nyn�em�xplicitn��set na stavu syst�, proto�e m� k dispozici pouze informa� vektor. Hled� tedy 
     17\begin{equation} 
     18\label{icon} 
     19\mu_t(I_t)=u_t \, \qquad t=0,1,\ldots,N-1, 
     20\end{equation} 
     21 
     22PRIPUSTNE STRATEGIE 
     23 
     24�olem je naj�p�tnou strategii \eqref{icon}, kter�y minimalizovala o��nou ztr� 
     25\begin{equation} 
     26\label{ilos} 
     27J_\pi=\E_{\substack{x_0,\ w_{0:N-1},\\ v_{0:N-1}}}\left\{g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,\mu_t(I_t),w_t)\right\}, 
     28\end{equation} 
     29za podm�k \eqref{sys} a \eqref{poz}. 
     30 
     31\section{P� na � s �mi daty} 
     32Proto�e v �e $t$ nem� k dispozici p�stav syst� $x_t$, ale pouze informa� vektor $I_t$, nem� pou��postup z p�oz�apitoly. P��je pot�� vhodn�ransformovat. Za t�o �m zap�me informa� vektor ve tvaru 
     33\begin{equation} 
     34I_0=y_0,\qquad I_{t+1}=(I_t,u_t,y_{t+1}), \qquad  t=1,\ldots,N-1. 
     35\end{equation} 
     36 
     37Na tuto rovnost m� pohl�t jako na rovnice syst� \eqref{sys}. Stav v �e $t$ je nyn�I_t$, vstup $u_t$ a $y_{t+1}$ n�dn�eli�a podm�n�I_t$ a $u_t$ p�eqref{poz}. 
     38 
     39D� p�me k nov�tr�v�unkci, kterou definujeme jako 
     40\begin{gather} 
     41\tilde{g}_N(I_N)=\E_{x_N}\left\{g_N(x_N)|I_N\right\}, \\ \tilde{g}_t(I_t,u_t,w_t)=\E_{x_t}\left\{g_t(x_t,u_t,w_t)|I_t,u_t\right\}, \qquad  t=1,\ldots,N-1. 
     42\end{gather} 
     43 
     44O��nou ztr� nyn�� ps�ve tvaru 
     45\begin{equation} 
     46J_N(I_N)=\tilde{g}_N(I_N) 
     47\end{equation} 
     48\begin{equation} 
     49J_t(I_t)=\min_{u_t \in U_t}\E_{w_t,y_{t+1}}\left\{\tilde{g}_t(I_t,u_t,w_t)+J_{t+1}((I_t,u_t,y_{t+1}))|I_t,u_t\right\} \qquad t=0,\ldots,N-1 
     50\end{equation} 
     51 
     52Tato � ji� m��ena pomoc�ynamick� programov�. P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(I_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�ab�nim����n�tr� $J_0(y_0)$ je optim��osloupnost rozhodnut� 
     53 
     54\section{�zen�yst� s nezn�mi parametry} 
     55Pokud rovnice syst� obsahuje n�k�� parametr $\theta$, m� vyu��znalosti ��robl� s ne�mi informacemi.  
     56 
     57Hledan��n�y m� nejen minimalizovat aktu��tr�, ale rovn�z�at o syst� co nejv� informac�ro minimalizaci budouc� ztr� Tento postup se naz����n�ref]. 
     58 
     59V � du�� ��� v� syst� $y_t$ pops� jako  
     60\begin{equation} 
     61\label{poz2} 
     62y_0=h_0(\theta,v_0),\qquad y_t=h_t(\theta, I_{t-1},u_{t-1},v_t), \qquad t=1,\ldots,N-1, 
     63\end{equation} 
     64 
     65Ztr�v�unkce je nyn�\begin{equation} 
     66\label{los2} 
     67g(y_{0:N},u_{0:N-1},w_{0:N-1})=g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,u_t,w_t). 
     68\end{equation} 
     69 
     70P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci $\theta_0$ a  odhadovac�roceduru tvaru 
     71\begin{equation} 
     72\label{the} 
     73\theta_{t+1}=f_t(\theta_t,I_t,y_{t+1},u_t), \qquad  t=1,\ldots,N-1. 
     74\end{equation}  
     75 
     76Rovnici \eqref{the} m� pova�ovat za rovnici syst� \eqref{sys} pro stav $(\theta_t,I_t)$ a vstup $(y_{t+1},u_t)$ bez p�nosti �umu. Do rovnice \eqref{poz2} dosad� za $\theta$ jeho aktu��dhad, tedy 
     77\begin{equation} 
     78\label{poz3} 
     79y_0=h_0(\theta_0,v_0),\qquad y_t=h_t(\theta_{t-1}, I_{t-1},u_{t-1},v_t), \qquad t=1,\ldots,N-1, 
     80\end{equation}  
     81 
     82Rovnice \eqref{the}, \eqref{poz3} a \eqref{los2} p�avuj�lohu stochastick� �� nep�mi daty. 
     83 
    684\subsection{Bayesovsk��� 
    7 P�ar�up jak pro parametr $\theta$ z�at aposteriorn�ustotu pravd�dobnosti $f(\theta|X)$, je-li k dispozici apriorn�ustota pravd�dobnosti $f(\theta)$ a soubor m�n�X$, je aplikace Bayesova vzorce 
     85P�ar�up, jak pro nezn� parametr $\theta$ z�at aposteriorn�ustotu pravd�dobnosti $f(\theta_{t+1}|I_t)$, je-li k dispozici apriorn�ustota pravd�dobnosti $f(\theta_t)$ a informa� vektor $I_t$, je aplikace Bayesova vzorce 
    886\begin{equation} 
    987\label{bay} 
    10 f(\theta|X)=\frac{f(X|\theta)f(\theta)}{\int f(X|\theta)f(\theta)\mathrm{d}\theta} 
     88f(\theta_{t+1}|I_t)=\frac{f(I_t|\theta_{t+1})f(\theta_t)}{\int f(I_t|\theta_{t+1})f(\theta_t)\mathrm{d}\theta_t} 
    1189\end{equation} 
    1290Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ je postup Bayesovsk� u��ref]. 
    13   
    14 P�nkr��vypo� m��ak tento p�p dv�ev� 1) nikdy nem� k dispozici $f(X|\theta)$, ale pouze jej�proximaci z m�n� a 2) aposteriorn�ustota pravd�dobnosti nemus��analytick�yj�en�co� jej�ou�it� dal��v� komplikuje. 
     91 
     92P�nkr��vypo� m��ak tento p�p dv�ev� 1) nikdy nem� k dispozici $f(I_t|\theta_{t+1})$, ale pouze aproximaci z m�n�I_t$ a 2) aposteriorn�ustota pravd�dobnosti nemus��analytick�yj�en�co� jej�ou�it� dal��v� komplikuje. 
    1593 
    1694\subsection{Kalman�ltr} 
    17 Pokud je p�tem ��yst� s gausovk�em, ve kter�nezn� parametry vystupuj�ako line� �ny situace se zna� zjednodu��ref]. Syst�\eqref{sys} m� �e $t$ tedy tvar 
     95Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje gausovk�a nezn� parametr je separov�jako line� �n, situace se zna� zjednodu�� 
    1896 
     97Dle p�kladu m��v �e $t$ tvar 
    1998\begin{equation} 
    2099\label{sys2} 
    21 x_{t+1}=f_k(x_t,u_t)+A_t(x_t,u_t)\theta_t+w_t 
     100y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta_t+v_{t+1}, , \qquad t=0,\ldots,N-1. 
    22101\end{equation} 
    23102 
    24 , kde $A_t(x_t,u_t)$ je zn� matice z�s� na p�oz�stavu syst� a vstupu. D� p�kl�jme gausovsk�ozlo�en�umu $w_t$ se zn�m rozptylem, gausovsk�ozlo�en�ezn�ho parametru $\theta$ a jejich nekorelovanost, tedy 
     103kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gausovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem 
    25104\begin{equation} 
    26 \theta_t\sim N(\hat{\theta},P_t), 
     105v_{t+1}\sim N(0,Q_{t+1}), 
    27106\end{equation} 
     107gausovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy 
     108\begin{gather} 
     109\theta_t\sim N(\hat{\theta},P_t),\\ 
     110\cov(v_{t+1},\theta)=0. 
     111\end{gather} 
     112 
     113Budeme po�adovat, aby odhadovac�rocedura \eqref{the} st� hodnoty parametru $\theta_{t+1}$ byla tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e 
    28114\begin{equation} 
    29 w_t\sim N(0,Q_t), 
     115\label{opr} 
     116\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t), 
    30117\end{equation} 
     118kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro ni jako funkci $K_t$ m� ps� 
    31119\begin{equation} 
    32 \cov(w_t,\theta_t)=0. 
     120P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T]. 
    33121\end{equation} 
    34122 
    35 Na z�ad�dezvy syst� $x_{t+1}$ a $\theta_t$ chceme z�at n�k� odhad parametru $\theta_{t+1}$. Budeme p�kl�t, �e $\theta_{t+1}$ z�� line��pravou $\theta_t$ �ou neur�osti v syst�. Tedy �e 
    36 \begin{equation} 
    37 \label{opr} 
    38 \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(x_{t+1}-f_t(x_t,u_t)-A_t\hat{\theta}_t) 
    39 \end{equation} 
    40 , kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro ni jako funkci $K_t$ m� ps� 
    41 \begin{equation} 
    42 P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T]. 
    43 \end{equation}  
    44 Dosazen�za $\hat{\theta}_{t+1}$ ze \eqref{opr} a za $x_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$) 
     123Dosazen�za $\hat{\theta}_{t+1}$ z \eqref{opr} a za $y_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$) 
    45124\begin{align} 
    46 P_{t+1}(K_t)&=\E[(\theta-\theta_t-K_t(x_{t+1}-f_t(x_t,u_t)-A_t\hat{\theta}_t))^2] \nonumber \\ 
    47 &=\E[((I-K_tA_t)(\theta-\theta_t)-K_tw_t)^2] \nonumber \\ 
    48 &=(I-K_tA_t)\E[(\theta-\theta_t)^2](I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,w_t)K_t^T-\nonumber \\ 
    49 &-K_t\cov(\theta,w_t)(I-K_tA_t)^T+K_t\E[w_t^2]K_t^T. 
     125P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \nonumber \\ 
     126&=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \nonumber \\ 
     127&=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\nonumber \\ 
     128&-K_t\cov(\theta,v_t)(I-K_tA_t)^T+K_t\E\left\{v_t^2\right\}K_t^T. 
    50129\end{align} 
    51130 
    52 Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,w_t)=0$ m� 
     131Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,v_t)=0$ m� 
    53132\begin{equation} 
    54133\label{Pt+1} 
     
    57136Proto�e po�adujeme minim��ozptyl odhadu $\hat{\theta}_{t+1}$, ur�e $K_t$ z rovnice 
    58137\begin{equation} 
    59 \frac{\partial \tr( P_t)}{\partial K_t}. 
     138\frac{\partial \tr( P_t)}{\partial K_t}=0. 
    60139\end{equation} 
    61 K proveden�derivace pou�ijeme vzorce*ODVOZENI BUDE ASI AZ V DODATKU*  
    62 \begin{equation} 
    63 \frac{\partial\tr(MXN)}{\partial X}=M^TN^T 
    64 \end{equation} 
    65 \begin{equation} 
    66 \frac{\partial\tr(MXNX^TO)}{\partial X}=M^TO^TXN+OMXN. 
    67 \end{equation} 
     140 
     141K proveden�derivace pou�ijeme vzorce*ODVOZENI BUDE ASI AZ V DODATKU* 
     142\begin{gather} 
     143\frac{\partial\tr(MXN)}{\partial X}=M^TN^T,\\ 
     144\frac{\partial\tr(MXNX^TO)}{\partial X}=M^TO^TXN+OMXN, 
     145\end{gather} 
     146kde $M,N$ a $O$ jsou konstantn�atice. 
     147 
    68148T�z�� line��ovnici pro $K_t$ tvaru 
    69149\begin{equation} 
    70 -P_t^TA_t-P_tA_t+K_tA_tP_tK_t+K_tA_t^TP_tK_t+2QK_t=0, 
     150-P_t^TA_t-P_tA_t+K_tA_tP_tK_t+K_tA_t^TP_tK_t+2Q_tK_t=0, 
    71151\end{equation} 
    72152kter��e�en�\begin{equation} 
    73153\label{Kt} 
    74 K_t=\frac{P_tA_t}{A_t^TP_tA_t+Q} 
     154K_t=\frac{P_tA_t}{A_t^TP_tA_t+Q_t} 
    75155\end{equation} 
    76 Dosazen�\eqref{Kt} do \eqref{Pt+1} po uprav�ostaneme 
     156Dosazen�\eqref{Kt} do \eqref{Pt+1} po �ostaneme 
    77157\begin{equation} 
    78158\label{Pt+12} 
     
    89169\end{equation} 
    90170 
    91 \section{P�py k du�� �� 
    92 nektere mozne pristupy, jak odhaduji suboptimalni $u_t$ 
    93 \subsection{Certainty equivalecnce control} 
    94 \subsection{Metoda separace} 
    95 \subsection{SIDP} 
     171Tato odhadovac�rocedura se naz�lman�ltr. 
  • applications/dual/SIDP/text/ch3.tex

    r872 r891  
    1 \section{Popis syst�} 
    2 \section{Transformace syst�} 
    3 \section{Srovn� jednotliv��up� 
     1A�liv pou�it�ynamick� programov� p����ok v ��lohy du�� ��analytick�e�en�bvykle nen�o�n��at. V ka�d��ov�kroku se toti� pot�se dv� obecn�bt��obl�my: 1) v� st� hodnoty a 2) minimalizace vzhledem k $u_t$. Oba probl� obecn�emaj�nalytick�e�en� bez dal��pecifikace � je proto t�p� k aproxima�m metod� 
     2 
     3V t� kapitole p��me popis n�lika mo�n��up�proximativn� ��lohy du�� ��P�e� �e �u du�� ��je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr� 
     4\begin{equation} 
     5\label{ilos} 
     6J_\pi=\E_{y_0,w_{0:N-1}}\left\{g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,\mu_t(I_t),w_t)\right\}, 
     7\end{equation} 
     8za podm�k 
     9\begin{gather} 
     10\label{the2} 
     11\theta_{t+1}=h_t(\theta_t,I_t,y_{t+1},u_t),\\ 
     12\label{poz3} 
     13y_0=h_0(\theta_0,v_0),\qquad y_{t+1}=h_t(\theta_t, I_t,u_t,v_{t+1}), \qquad t=0,\ldots,N-1, 
     14\end{gather} 
     15 
     16\section{Certainty equivalecnce control} 
     17\section{Metoda separace} 
     18\section{SIDP}  
  • applications/dual/SIDP/text/uvod.tex

    r872 r891  
    1 V technick�raxi, stejn�ako b���ivot�jsme nuceni d�t rozhodnut�A� u� se jedn� ��� linky �hled� opti�� spojen�ezi dv� m�y, na�e rozhodnut�ych�j�e znalost�kter� sv� m�. Chceme-li �it �n�ozhodnut�je t�vy� dv�lohy: 1) ��kt co nejl� poznat a 2) dos�ut c�, kter� si vyty�i. Tyto dva � jsou v�ak v�inou v rozporu: syst�se nejl� pozn�kdy� se nechov�odle na�ich po�adavk�re��sv� nav�existuj��dn�evy, poruchy a nep�v�n�ituace, kter�ednotn�az�neur�ost�Tato skute�st zp�je, �e na�e znalost syst� nebude nikdy dokonal� 
     1V technick�raxi, stejn�ako b���ivot�jsme nuceni d�t rozhodnut�A� u� se jedn� ��� linky �hled� optim�� spojen�ezi dv� m�y, na�e rozhodnut�ych�j�e znalost�kter� sv� m�. Chceme-li �it �n�ozhodnut�je t�vy� dv�lohy: 1) ��kt co nejl� poznat a 2) dos�out c�, kter� si vyty�i. Tyto dva � jsou v�ak v�inou v rozporu: syst�se nejl� pozn�kdy� se nechov�odle na�ich po�adavk�re��sv� nav�existuj��dn�evy, poruchy a nep�dan�ituace, kter�ednotn�az�neur�ost�Tato skute�st zp�je, �e na�e znalost syst� nen�ikdy dokonal� 
    22 
    3 Za �m ��yst�, kter�sou bu�atolik slo�it��e jejich deterministick�s je nemo�n�o obsahuj�ch n�dn�rvky ji� ze sv�odstaty, vzniklo stochastick��n�nebo-li optim���n�a neur�osti. C�m stochastick� ��e minimalizovat velikost  odchylek syst� od po�adovan� stavu optimalizac��c� z�h� 
    4 Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman[]. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce. Tento p�p m�nalytick�e�en�ouze v p��nalosti v�ech parametr�t�. V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� ��Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr� 
     3Za �m ��yst�, kter�sou bu�atolik slo�it��e jejich deterministick�s je nemo�n�o obsahuj��dn�rvky ji� ze sv�odstaty, vzniklo stochastick��n�nebo-li optim���n�a neur�osti. C�m stochastick� ��e minimalizovat velikost  odchylek syst� od po�adovan� stavu optimalizac��c� z�h� 
     4Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman[]. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce.  
     5 
     6Tento p�p m�nalytick�e�en�ouze v p��nalosti v�ech parametr�t�, co� je v�inou nemo�n�V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� ��Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr� 
    57 
    68P�aplikace tohoto postupu je v�ak bohu�el i u pom��ednoduch�a� komplikov� slo�itost��.  K ��lohy je proto vhodn�o��aproxima�ch metod. 
     
    1113\item 
    1214Formulace � stochastick� ��\item 
    13 ��en�lohy stochastick� ��omoc�u�� ��\item 
     15��en�lohy stochastick� �� aditivn�tr�uvou funkc�omoc�u�� ��\item 
     16Formulace � stochastick� ��a ne�ch informac� jej��en�a � s �mi znalostmi syst� 
     17\item 
    1418P�aven��er�roxima�ch p�p�u�� ��zejm� pak stochastick� iterativn� dynamick� programov� 
    1519\item