root/applications/dual/SIDP/text/ch2.tex @ 995

Revision 930, 8.7 kB (checked in by zimamiro, 15 years ago)
Line 
1P�likaci matematick� modelov� na ���k�onkr��lohy se obvykle pot�s probl�m, jak ur� konstanty, kter�an�l ur��Zkoum�-li nap�d n�k�k��yst� z rozboru fyzik�� z�nitost�bvykle zn� tvar rovnic, kter�r��eho v� �e, nicm� po�e� podm�y �parametry, kter� rovnic� vystupuj� jsou pro dan��charakteristick�m� z�at pouze nep� obvykle m�n�vhodn�li�. Modifikac�lohy stochastick� ��ro p� p�nosti nezn�ch parametr�zab�to kapitola.
2
3\section{Formulace � stochastick� �� nep�mi daty}
4Informace o stavu syst� $x_t$ v �e $t$ z��me pomoc�� $y_t$, kter��jako
5\begin{equation}
6\label{poz}
7y_0=h_0(x_0,v_0),\qquad y_t=h_t(x_t,u_{t-1},v_t), \qquad t=1,\ldots,N-1,
8\end{equation}
9kde $v_t$ je n�dn�eli�a charakterizuj� chybu m�n�Po�e� stav $x_0$ je d�rozd�n�pravd�dobnosti $P^{x_0}$ a dal���yst� ur�e soustava \eqref{sys}.
10
11Informace, kter�sou v pr� �� dispozici je zvykem ps�ve form�zv. \emph{informa�ho vektoru}, kter�var
12\begin{equation}
13I_0=y_0,\qquad I_t=(y_{0:t},u_{0:t-1}), \qquad  t=1,\ldots,N-1.
14\end{equation}
15
16�d� strategie $\pi=\mu_{0:N-1}$ nyn�em�xplicitn��set na stavu syst�, proto�e m� k dispozici pouze informa� vektor. Hled� tedy
17\begin{equation}
18\label{icon}
19\mu_t(I_t)=u_t \, \qquad t=0,1,\ldots,N-1,
20\end{equation}
21
22PRIPUSTNE STRATEGIE
23
24�olem je naj�p�tnou strategii \eqref{icon}, kter�y minimalizovala o��nou ztr�
25\begin{equation}
26\label{ilos}
27J_\pi=\E_{\substack{x_0,\ w_{0:N-1},\\ v_{0:N-1}}}\left\{g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,\mu_t(I_t),w_t)\right\},
28\end{equation}
29za podm�k \eqref{sys} a \eqref{poz}.
30
31\section{P� na � s �mi daty}
32Proto�e v �e $t$ nem� k dispozici p�stav syst� $x_t$, ale pouze informa� vektor $I_t$, nem� pou��postup z p�oz�apitoly. P��je pot�� vhodn�ransformovat. Za t�o �m zap�me informa� vektor ve tvaru
33\begin{equation}
34\label{nep}
35I_0=y_0,\qquad I_{t+1}=(I_t,u_t,y_{t+1}), \qquad  t=1,\ldots,N-1.
36\end{equation}
37
38Na tuto rovnost m� pohl�t jako na rovnice syst� \eqref{sys}. Stav v �e $t$ je nyn�I_t$, vstup $u_t$ a $y_{t+1}$ n�dn�eli�a podm�n�I_t$ a $u_t$ p�eqref{poz}.
39
40D� p�me k nov�tr�v�unkci, kterou definujeme jako
41\begin{gather}
42\tilde{g}_N(I_N)=\E_{x_N}\left\{g_N(x_N)|I_N\right\}, \\ \tilde{g}_t(I_t,u_t,w_t)=\E_{x_t}\left\{g_t(x_t,u_t,w_t)|I_t,u_t\right\}, \qquad  t=1,\ldots,N-1.
43\end{gather}
44
45O��nou ztr� nyn�� ps�ve tvaru
46\begin{gather}
47J_N(I_N)=\tilde{g}_N(I_N)\\
48J_t(I_t)=\min_{u_t \in U_t}\E_{w_t,y_{t+1}}\left\{\tilde{g}_t(I_t,u_t,w_t)+J_{t+1}((I_t,u_t,y_{t+1}))|I_t,u_t\right\} \qquad t=0,\ldots,N-1
49\end{gather}
50
51Tato � ji� m��ena pomoc�ynamick� programov�. P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(I_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�ab�nim����n�tr� $J_0(y_0)$ je optim��osloupnost rozhodnut�
52
53\section{�zen�yst� s nezn�mi parametry}
54Pokud chceme � syst� jeho� v�z�s�a n�k�nezn�m konstant�parametru $\theta$, m� vyu��znalosti ��robl� s ne�m pozorov�m. Parametr $\theta$ bude reprezentovat stav syst� $x_t$, kter�yn� �e nem�.
55
56V t� � m� v� syst� $y_t$ pops� jako
57\begin{equation}
58\label{poz2}
59y_0=h_0(\theta,v_0),\qquad y_t=h_t(I_{t-1},\theta,u_{t-1},v_t), \qquad t=1,\ldots,N-1,
60\end{equation}
61
62Ztr�v�unkce je nyn�\begin{equation}
63\label{los2}
64g(y_{0:N},u_{0:N-1},v_{0:N-1})=g_N(y_N)+\sum_{t=0}^{N-1}g_t(y_t,u_t,v_t).
65\end{equation}
66
67Ozna� $T_t$ testovac�tatistiku pro parametr $\theta$ zalo�enou na informac� dostupn� �e $t$. Do $T_t$ zahrneme rovnez ty cleny $I_t$, kter�ystupuj� \eqref{poz2}, abychom mohli ps�
68\begin{equation}
69\label{poz3}
70y_{t+1}=h_t(T_t,\theta,u_t,v_{t+1}).
71\end{equation}
72
73P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci v podob�ustoty pravd�dobnosti $f(\theta|T_0)$. Aposteriorn�ustotu $f(\theta|T_{t+1})$ z�� pomoc�ayesova vzorce
74\begin{equation}
75\label{bay}
76f(\theta|T_{t+1})=\frac{f(T_{t+1}|\theta,T_t)f(\theta|T_t)}{\int f(T_{t+1}|\theta,T_t)f(\theta|T_t)\mathrm{d}\theta}
77\end{equation}
78Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ je postup Bayesovsk� u��cite{peterka1981bayesian}.
79
80Pro v�estovac�tatistiky v �e m� podle \eqref{bay} ps�
81\begin{equation}
82\label{the}
83T_{t+1}=f_t(T_t,u_t,y_{t+1}), \qquad  t=1,\ldots,N-1.
84\end{equation}
85Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $T_t$ a vstup $u_t$ s �umem $y_{t+1}$.
86
87Hustota pravd�dobnosti pro odhad parametru $\theta$ v rovnici pro v�\eqref{poz3} je v �e $t$ ur�a testovac�tatistikou $T_t$. Rovnice \eqref{the}, \eqref{poz3} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty.
88
89\subsection{Kalman�ltr}
90Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje aditivn�aussovk�a nezn� parametr je separov�jako line� �n, m� vypo�at konkr��var rovnice \eqref{the}, tzv. Kalman�ltr \cite{kalman1960new}.
91
92Dle p�kladu m��v �e $t$ tvar
93\begin{equation}
94\label{sys2}
95y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t))\theta+v_{t+1}, , \qquad t=0,\ldots,N-1.
96\end{equation}
97
98kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gaussovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem
99\begin{equation}
100v_{t+1}\sim N(0,Q_{t+1}),
101\end{equation}
102gaussovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy
103\begin{gather}
104\theta_t\sim N(\hat{\theta}_t,P_t),\\
105\cov(v_{t+1},\theta_t)=0.
106\end{gather}
107
108Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta_{t+1}|I_t)$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl�
109\begin{gather}
110K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\
111\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\
112P_{t+1}=(I-K_tA_t)P_t.
113\end{gather}
114Odvozen�ze nal� v \cite{peterka1981bayesian}.
115
116Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty parametru $\theta_{t+1}$ budeme hledat ve tvaru line��pravy st� hodnoty $\theta_t$ ��eur�osti v syst�. Tedy �e
117\begin{equation}
118\label{opr}
119\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\E_{\theta,v_t}y_{t+1}),
120\end{equation}
121kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro �um $v_t$  budeme po�adovat nulovou st� hodnotu a existenci druh� momentu. Matici rozptylu ozna�e op�$Q_t$.
122
123Pro matici $P_{t+1}$ jako funkci $K_t$ m� ps�
124\begin{equation}
125P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T].
126\end{equation}
127
128Dosazen�za $\hat{\theta}_{t+1}$ z \eqref{opr} a za $y_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$)
129\begin{align*}
130P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \\
131&=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \\
132&=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\\
133&-K_t\cov(\theta,v_t)(I-K_tA_t)^T+K_t\E\left\{v_t^2\right\}K_t^T.
134\end{align*}
135
136Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,v_t)=0$ m�
137\begin{equation}
138\label{Pt+1}
139P_{t+1}(K_t)=(I-K_tA_t)P_t(I-K_tA_t)^T+K_tQ_tK_t^T.
140\end{equation}
141Proto�e po�adujeme minim��ozptyl odhadu $\hat{\theta}_{t+1}$, ur�e $K_t$ z rovnice
142\begin{equation}
143\frac{\partial \tr( P_t)}{\partial K_t}=0.
144\end{equation}
145
146K proveden�derivace pou�ijeme vzorce*ODVOZENI BUDE ASI AZ V DODATKU*
147\begin{gather}
148\frac{\partial\tr(MXN)}{\partial X}=M^TN^T,\\
149\frac{\partial\tr(MXNX^TO)}{\partial X}=M^TO^TXN+OMXN,
150\end{gather}
151kde $M,N$ a $O$ jsou konstantn�atice.
152
153T�z�� line��ovnici pro $K_t$ tvaru
154\begin{equation}
155-P_t^TA_t-P_tA_t+K_tA_tP_tK_t+K_tA_t^TP_tK_t+2Q_tK_t=0,
156\end{equation}
157kter��e�en�\begin{equation}
158\label{Kt}
159K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}
160\end{equation}
161Dosazen�\eqref{Kt} do \eqref{Pt+1} po ��ostaneme
162\begin{equation}
163\label{Pt+12}
164P_{t+1}=(I-K_tA_t)P_t
165\end{equation}
166Rovnice \eqref{opr}, \eqref{Kt} a \eqref{Pt+12} p�avuj�ovnice Kalmanova filtru.
Note: See TracBrowser for help on using the browser.