Context Navigation

ch2.tex @ 1103

Revision 1103, 9.9 kB (checked in by zimamiro, 14 years ago)

Rev	Line
[1090]	1	P�likaci matematick� modelov� na ��k�onkr��lohy se obvykle pot�s probl�m, jak ur� konstanty, kter�an�l ur��Zkoum�-li nap�d n�k�k��yst� z rozboru fyzik�� z�nitost�bvykle zn� tvar rovnic, kter�r��eho v� �e, nicm� po�e� podm�y �parametry, kter� rovnic� vystupuj� jsou pro dan��charakteristick�m� z�at pouze nep� obvykle m�n�vhodn�li�. Tato kapitola se zab�difikac�lohy stochastick� ��ro p� p�nosti nezn�ch parametr�
[872]	2	\section{Formulace � stochastick� �� nep�mi daty}
[891]	3	\subsection{V�syst� a infoma� vektor}
[1103]	4	Informace o stavu syst� $x_t$ v �e $t$ z��me pomoc�� $y_t$, kter��jako
[891]	5	\begin{equation}
	6	\label{poz}
	7	y_0=h_0(x_0,v_0),\qquad y_{t+1}=h_{t+1}(x_{t+1},u_t,v_{t+1}), \qquad t=1,\ldots,N-1,
[1090]	8	\end{equation}
[891]	9	kde $v_t$ je n�dn�eli�a charakterizuj� chybu m�n�Po�e� stav $x_0$ je d�rozd�n�pravd�dobnosti $P^{x_0}$ a dal��yst� ur�e soustava \eqref{sys}.
	10
	11	Informace, kter�sou v pr� �� dispozici je zvykem ps�ve form�zv. informa�ho vektoru, kter�var
[1103]	12	\begin{equation}
[891]	13	I_0=y_0,\qquad I_{t+1}=(y_{0:t+1},u_{0:t}), \qquad t=1,\ldots,N-1.
[1090]	14	\end{equation}
[891]	15
	16	\subsection{Optim��n�ro � s nep�mi daty}
[1103]	17	�d� z�h nyn�em�xplicitn��set na stavu syst�, proto�e m� k dispozici pouze informa� vektor. Podobn�ako v p�l�apitole proto zav�me nepr�nou mno�inu $U(I_t)$ v�ech p�tn�d�ch z�h�informace $I_t$. P�tnou ��trategi�\pi=\mu_{0:N-1}$ bude posloupnost
	18	\begin{equation}
[891]	19	\label{icon}
	20	\mu_t(I_t)=u_t \, \qquad t=0,1,\ldots,N-1,
	21	\end{equation}
	22	kde $\mu_t(I_t)=u_t \in U(I_t)$ je p�tn�c��h.
[1103]	23
[891]	24	�olem je naj�p�tnou strategii, kter�y minimalizovala o��nou ztr�
[1090]	25	\begin{equation}
[891]	26	\label{ilos}
	27	J_\pi=\E_{\substack{x_0,\ w_{0:N-1},\\ v_{0:N}}}\left\{\sum_{t=0}^{N-1}g_t(x_{t+1},\mu_t(x_t))\right\},
[1103]	28	\end{equation}
[891]	29	za podm�k \eqref{sys} a \eqref{poz}.
	30
	31	\subsection{P� na � s �mi daty}
[1103]	32	Proto�e v �e $t$ nem� k dispozici p�stav syst� $x_t$, ale pouze informa� vektor $I_t$, nem� pou��postup z p�oz�apitoly. P��je pot�� vhodn�ransformovat. Za t�o �m zap�me informa� vektor ve tvaru
[891]	33	\begin{equation}
	34	\label{nep}
[917]	35	I_0=y_0,\qquad I_{t+1}=(I_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1.
[891]	36	\end{equation}
	37	Na tuto rovnost m� pohl�t jako na rovnice syst� \eqref{sys}. Stav v �e $t$ je nyn�I_t$, vstup $u_t$ a $y_{t+1}$ n�dn�eli�a podm�n�I_t$ a $u_t$ p�eqref{poz}.
	38
	39	D� p�me k nov�tr�v�unkci, kterou definujeme jako
	40	\begin{equation}
[1090]	41	\tilde{g}_t(I_{t+1},u_t)=\E_{x_{t+1}}\left\{g_t(x_{t+1},u_t)\|I_t,u_t\right\}, \qquad t=1,\ldots,N-1,
[1103]	42	\end{equation}
[1090]	43	kde $x_{t+1}$ se po��le \eqref{sys} a $x_t$ se pova�uje za n�dnou veli�u podm�nou informa�m vektorem $I_t$.
	44
[891]	45	O��nou ztr� podprobl� od �u $t$ do $N$ nyn�� ps�ve tvaru
[1103]	46	\begin{gather}
[918]	47	J_N(I_N)=0\\
[1090]	48	J_t(I_t)=\min_{u_t \in U_t}\E_{w_t,y_{t+1}}\left\{\tilde{g}_t(I_{t+1},u_t)+J_{t+1}(I_{t+1})\|I_t,u_t\right\} \qquad t=0,\ldots,N-1
	49	\end{gather}
[918]	50
[891]	51	Tato � ji� m��ena pomoc�ynamick� programov�. P��en�udeme postupovat od konce �� horizontu a postupn�ledat $J_t(I_t)$. Potom libovoln�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$, kter�ab�nim��n�tr� $J_0(y_0)$ je optim��c�trategie.
[1090]	52
[891]	53	\section{�zen�yst� s nezn�mi parametry}
	54	Pokud chceme � syst� jeho� v�z�s�a n�k�nezn�m konstant�parametru $\theta$, m� vyu��znalosti ��robl� s ne�m pozorov�m. Parametr $\theta$ bude reprezentovat stav syst� $x_t$, kter�yn� �e nem�.
[930]	55
[891]	56	\subsection{Syst�s nezn�mi parametry, hyperstav}
[1103]	57	V t� � m� v� syst� $y_t$ pops� jako
[919]	58	\begin{equation}
[891]	59	\label{poz2}
	60	y_0=h_0(\theta,v_0),\qquad y_{t+1}=h_t(I_t^{(d)},\theta,u_t,v_{t+1}), \qquad t=0,\ldots,N-1,
[1090]	61	\end{equation}
[891]	62	kde $I_t^{(d)}=(y_{t:t-d},u_{t-1:t-d})$ a �lo $d$ se naz�d modelu.
[1090]	63
[891]	64	Ozna� $T_t$ dostate�u statistiku pro parametr $\theta$ zalo�enou na informac� dostupn� �e $t$. Pokud dostate� statistika neexistuje, pak bude $T_t$ ozna�at n�kou jej�hodnou aproximaci. Ozna� d� $H_t=(I_t^{(d)},T_t)$ tzv. hyperstav syst�.
[1090]	65
[891]	66	P�kl�jme d�, �e o parametru $\theta$ m� n�kou apriorn�nformaci v podob�ustoty pravd�dobnosti $f(\theta\|T_0)$. Aposteriorn�ustotu $f(\theta\|T_{t+1})$ z�� pomoc�ayesova vzorce
[930]	67	\begin{equation}
	68	\label{bay}
[872]	69	f(\theta\|T_{t+1}) = \frac{f(y_{t+1} \| \theta, I_t^{(d)},u_t) f(\theta\| T_t)}
[1090]	70	{\int f(y_{t+1} \| \theta, I_t^{(d)},u_t) f(\theta\| T_t)\mathrm{d}\theta}
	71	\end{equation}
[872]	72	Rekurzivn�ou�it�zorce \eqref{bay} pro odhad parametru $\theta$ se naz�stup Bayesovsk� u��cite{peterka1981bayesian}.
[1090]	73
[872]	74	Pro v�yperstavu $H_t$ v �e m� na z�ad�eqref{bay} ps�
[1090]	75	\begin{equation}
[919]	76	\label{the}
	77	H_{t+1}=f_t(H_t,u_t,y_{t+1}), \qquad t=1,\ldots,N-1.
[1090]	78	\end{equation}
[919]	79	Rovnici \eqref{the} m� podobn�ako \eqref{nep} pova�ovat za rovnici syst� \eqref{sys} pro stav $H_t$ a vstup $u_t$ s �umem $y_{t+1}$.
[1090]	80
[891]	81	\subsection{P� na � s nep�mi daty}
[1103]	82	Ztr�v�unkce je nyn�\begin{equation}
[1090]	83	\label{los2}
	84	g(y_{1:N},u_{0:N-1})=\sum_{t=0}^{N-1}g_t(y_{t+1},u_t).
	85	\end{equation}
	86
	87	�ohou je nalezen��c�trategie $\pi=\mu_{0:N-1}$, kter�y minimalizovala o��nou ztr�
[919]	88	\begin{equation}
[1090]	89	\label{ilos2}
	90	J_\pi=\E_{\theta_0,v_{0:N-1}}\left\{\sum_{t=0}^{N-1}g_t(y_{t+1},\mu_t(H_t))\right\},
	91	\end{equation}
	92	za apriorn�nformace $f(\theta\|T_0)$, zn�ho rozd�n�umu $v_t$ a podm�k \eqref{the} a \eqref{poz2}.
	93
	94	Rovnice \eqref{the}, \eqref{poz2} a \eqref{los2} potom p�avuj�lohu stochastick� �� nep�mi daty.
	95
	96	�ohu op��e pomoc�ynamick� programov�, tedy postupnou minimalizac��n�tr� od konce �� horizontu
	97	\begin{gather}
[1103]	98	J_N(H_N)=0\\
[1090]	99	\label{los3}
	100	J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{g_t(y_{t+1},u_t)+J_{t+1}(H_{t+1})\|H_t,u_t\right\}, \qquad t=0,\ldots,N-1,
	101	\end{gather}
	102	kde $H_{t+1}$ se po��le \eqref{the}. St� hodnota vzhledem k $y_{t+1}$ se po��omoc�eqref{poz2} a $f(\theta\|T_t)$ jako�to aktu�� odhadu na parametr $\theta$.
	103
	104	\subsection{Kalman�ltr}
	105	Pokud v rovnic� \eqref{poz2} popisuj�ch v�syst� vystupuje aditivn�aussovk�a nezn� parametr je separov�jako line� �n, m� vypo�at konkr��var rovnice \eqref{the}, tzv. Kalman�ltr \cite{kalman1960new}.
[872]	106
[919]	107	Dle p�kladu m��v �e $t$ tvar
[872]	108	\begin{equation}
[891]	109	\label{sys2}
[872]	110	y_{t+1}=\tilde{h}_t(I_t,u_t)+A_t(I_t,u_t)\theta+v_{t+1}, , \qquad t=0,\ldots,N-1.
	111	\end{equation}
[1090]	112
[872]	113	kde $\tilde{h}_t(I_t,u_t)$, resp. $A_t(I_t,u_t)$ je zn� funkce, resp. matice z�s� na informa�m vektoru a aktu��stupu. D� p�kl�me gaussovsk�ozlo�en�umu $v_{t+1}$ se zn�m rozptylem
	114	\begin{equation}
[919]	115	v_{t+1}\sim N(0,Q_{t+1}),
[872]	116	\end{equation}
[891]	117	gaussovsk�ozlo�en�dhadu nezn�ho parametru $\theta_t$ a jejich nekorelovanost, tedy
[872]	118	\begin{gather}
[919]	119	\theta_t\sim N(\hat{\theta}_t,P_t),\\
[891]	120	\cov(v_{t+1},\theta_t)=0.
[919]	121	\end{gather}
	122
[891]	123	Dosazen�do \eqref{bay} se odvod��e aposteriorn�ustota pravd�dobnosti $f(\theta\|T_{t+1})$ je rovn�gaussovsk�a jej�arametry $(\hat{\theta}_{t+1}, P_{t+1})$ spl� rovnice
[872]	124	\begin{gather}
[1090]	125	K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}\\
[919]	126	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t),\\
	127	P_{t+1}=(I-K_tA_t)P_t.
	128	\end{gather}
	129	Odvozen�ze nal� v \cite{peterka1981bayesian}.
	130
	131	Alternativn�dvozen�ez po�adavku gaussovsk� �umu je mo�n�rov� za p�kladu, �e odhadovac�roceduru st� hodnoty $\hat{\theta}_{t+1}$ nezn�ho parametru $\theta$ budeme hledat ve tvaru line��pravy st� hodnoty $\hat{\theta}_t$ ��eur�osti v syst�. Tedy �e
	132	\begin{equation}
[1090]	133	\label{opr}
[872]	134	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-\E_{\theta,v_t}y_{t+1}),
	135	\end{equation}
[919]	136	kde $K_t$ je nezn� matice, kterou ur�e z po�adavku minimalizace v��atice rozptylu $P_{t+1}$. Pro �um $v_t$ budeme po�adovat nulovou st� hodnotu a existenci druh� momentu. Matici rozptylu ozna�e op�$Q_t$.
[872]	137
[919]	138	Pro matici $P_{t+1}$ jako funkci $K_t$ m� ps�
	139	\begin{equation}
	140	P_{t+1}(K_t)=\E[(\theta-\hat{\theta}_{t+1})(\theta-\hat{\theta}_{t+1})^T].
[872]	141	\end{equation}
	142
[891]	143	Dosazen�za $\hat{\theta}_{t+1}$ z \eqref{opr} a za $y_t$ ze \eqref{sys2} a �ou dostaneme (pro libovolnou matici $B$ budeme pro lep��itelnost nam�o $BB^T$ ps�zkr�n�B^2$)
	144	\begin{align*}
	145	P_{t+1}(K_t)&=\E_{\theta,v_t}\left\{(\theta-\hat{\theta}_t-K_t(y_{t+1}-\tilde{h}_t(I_t,u_t)-A_t\hat{\theta}_t))^2\right\} \\
[919]	146	&=\E_{\theta,v_t}\left\{((I-K_tA_t)(\theta-\hat{\theta}_t)-K_tv_t)^2\right\} \\
	147	&=(I-K_tA_t)\E\left\{(\theta-\hat{\theta_t})^2\right\}(I-K_tA_t)^T-(I-K_tA_t)\cov(\theta,v_t)K_t^T-\\
	148	&-K_t\cov(\theta,v_t)(I-K_tA_t)^T+K_t\E\left\{v_t^2\right\}K_t^T.
	149	\end{align*}
[891]	150
[919]	151	Pou�it�definice $P_t$, $Q_t$ a p�kladu $\cov(\theta,v_t)=0$ m�
[872]	152	\begin{equation}
[891]	153	\label{Pt+1}
[872]	154	P_{t+1}(K_t)=(I-K_tA_t)P_t(I-K_tA_t)^T+K_tQ_tK_t^T.
	155	\end{equation}
	156	Proto�e po�adujeme minim��ozptyl odhadu $\hat{\theta}_{t+1}$, ur�e $K_t$ z rovnice
	157	\begin{equation}
	158	\frac{\partial \tr( P_t)}{\partial K_t}=0.
	159	\end{equation}
[891]	160
[872]	161	K proveden�derivace pou�ijeme vzorceODVOZENI BUDE ASI AZ V DODATKU
[891]	162	\begin{gather}
	163	\frac{\partial\tr(MXN)}{\partial X}=M^TN^T,\\
	164	\frac{\partial\tr(MXNX^TO)}{\partial X}=M^TO^TXN+OMXN,
	165	\end{gather}
	166	kde $M,N$ a $O$ jsou konstantn�atice.
	167
	168	T�z�� line��ovnici pro $K_t$ tvaru
	169	\begin{equation}
[872]	170	-P_t^TA_t-P_tA_t+K_tA_tP_tK_t+K_tA_t^TP_tK_t+2Q_tK_t=0,
	171	\end{equation}
[891]	172	kter��e�en�\begin{equation}
[872]	173	\label{Kt}
	174	K_t=P_tA_t(A_t^TP_tA_t+Q_t)^{-1}
	175	\end{equation}
	176	Dosazen�\eqref{Kt} do \eqref{Pt+1} po ��ostaneme
[917]	177	\begin{equation}
[872]	178	\label{Pt+12}
[891]	179	P_{t+1}=(I-K_tA_t)P_t
[872]	180	\end{equation}
	181	Rovnice \eqref{opr}, \eqref{Kt} a \eqref{Pt+12} p�avuj�ovnice Kalmanova filtru.

Note: See TracBrowser for help on using the browser.

Context Navigation

root/applications/dual/SIDP/text/ch2.tex @ 1103

Download in other formats: