Context Navigation

ch4.tex @ 930

Revision 930, 4.6 kB (checked in by zimamiro, 14 years ago)

Line
1	V t� kapitole je pops�jednoduch�� na kter�jsou porovn� ��lgoritmy uveden� p�l�apitole. Syst�byl podrobn�koum�v \cite{astrom1986dual}. Pro srovn� uv�me tam��y.
2
3	\section{Popis syst�}
4	V�syst� je pops�jako
5	\begin{gather}
6	\label{simple}
7	y_{t+1}=y_t+\theta_tu_t+v_{t+1} \qquad t=0,\ldots,N-1,\\
8	v_t\sim N(0,\sigma^2).\\
9	\theta_t\sim N(\hat{\theta},P_t),\\
10	\cov(v_{t+1},\theta)=0.
11	\end{gather}
12
13	Ztr�vou funkci vol� kvadratickou, tedy
14	\begin{equation}
15	g(y_{0:N},u_{0:N-1},v_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2.
16	\end{equation}
17
18	Odhadovac�rocedurou pro parametr $\theta$ je Kalman�ltr. Pro syst�\eqref{simple} m�var
19	\begin{gather}
20	\label{kal}
21	K_t=\frac{u_tP_t}{u_t^2P_t+\sigma^2}\\
22	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-u_t\hat{\theta}_t),\\
23	P_{t+1}=(1-K_tu_t)P_t.
24	\end{gather}
25
26	O��n�tr� je
27	\begin{equation}
28	J_t(y_t,\theta_t)=\min_{u_t \in U_t}\E_{y_{t+1},v_t}\left\{y_{t+1}^2+J_{t+1}(y_{t+1},\theta_{t+1})\|y_t,\theta_t,u_t\right\}, \qquad t=0,\ldots,N-1.
29	\end{equation}
30
31	Ta po dosazen� \eqref{simple} a �te�m proveden�t� hodnoty p� na tvar
32	\begin{gather}
33	\label{dos}
34	J_t(y_t,\theta_t)=\min_{u_t \in U_t}\left\{(y_t+\hat{\theta}_tu_t)^2+u_t^2P_t+\sigma^2+\E_{y_{t+1},v_t}(J_{t+1}(y_{t+1},\theta_{t+1}))\|y_t,\theta_t,u_t\right\}.
35	\end{gather}
36
37	ZDE BY MEL BYT ANGSTROM+...
38
39	\section{Specifika jednotliv��up� tomto odd� jsou pops� n�er�spekty algoritm�er�udeme srovn�t, p�likaci na syst�\eqref{simple}.
40
41	\subsection{Certainty equivalent control}
42	O��n�tr� \eqref{CE} prejde v
43	\begin{gather}
44	J_t(y_t, \theta_t)=\min_{u_t \in U_t}\left\{\hat{y}_{t+1}^2 +J_{t+1}(y_{t+1},\theta_{t+1})\|I_t,\theta_t,u_t\right\}.
45	\end{gather}
46	St� hodnota v� je
47	\begin{equation}
48	\hat{y}_{t+1}=y_t+\hat{\theta}_tu_t
49	\end{equation}
50	a rozhodnut�ude tedy
51	\begin{equation}
52	\mu_t(y_t,\hat{\theta}_t)=-\frac{y_t}{\hat{\theta}_t}.
53	\end{equation}
54
55	\subsection{Metoda separace}
56	V prvn�� metody separace polo�� h
57	\begin{equation}
58	u_0=\sqrt{C-\frac{1}{P_0}}.
59	\end{equation}
60	T�se dle \eqref{kal} sn� rozptyl $P_0$ nezn�ho parametru $\theta$ na $\frac{1}{C}$. Konstanta $C$ by m� b�ena dostate� mal�aby odhad $\hat{\theta}$ pro druhou f� ��yl dostate� bl�o skute� hodnot�arametru $\theta$. P�ovn� jednotliv�goritm�l�me $C=100$.
61
62	\subsection{SIDP}
63	Dle \eqref{dos} je optim��u_t$ z�sl�a $(y_t,\hat{\theta}_t,P_t)$. P�mulaci m� tedy v ka�d��ov�okam�iku $t$ diskretizovat t�enzion��rostor nez�sle prom��le \cite{astrom1986dual} je v�ak p�amotnou simulac�hodn�� k transformaci prostoru $(y_t,\hat{\theta}_t,P_t,u_t)$ do nov�om��\eta_t,\beta_t,\zeta_t,\nu_t)$ dle
64	\begin{gather}
65	\eta_t=\frac{y_t}{\sigma} \\
66	\beta_t=\frac{\hat{\theta}_t}{\sqrt{P_t}} \\
67	\zeta_t=\frac{1}{\sqrt{P_t}} \\
68	\nu_t=\frac{u_t\sqrt{P_t}}{\sigma}
69	\end{gather}
70
71	Sou�n�� neur�ost ve v� \eqref{simple} reprezentovat jedinou normalizovanou n�dnou veli�ou podle
72	\begin{equation}
73	s_t=\frac{y_{t+1}-y_t+\hat{\theta}_tu_t}{\sqrt{u_t^2P_t+\sigma^2}} \sim N(0,1).
74	\end{equation}
75
76	Rovnice pro v�\eqref{simple} a n�eduj� odhad nezn�ho parametru \eqref{kal} tak p� v
77	\begin{gather}
78	\eta_{t+1}=\eta_t+\beta_t\nu_t+\sqrt{1+\nu^2}s_t\\
79	\beta_{t+1}=\sqrt{1+\nu^2}\beta_t+\nu_ts_t
80	\end{gather}
81
82	P�me-li k vhodn�praven��n�tr�, dostaneme
83	\begin{align}
84	V_t(\eta_t,\beta_t,\zeta_t)&=\frac{J_t(y_t,\hat{\theta}_t,P_t)}{\sigma^2}\\
85	&=\min_{\nu_t }\left\{(\eta_t+\beta_t\nu_t)^2+\nu_t^2+1+\E_{y_{t+1},v_t}(V_{t+1}(\eta_{t+1},\beta_{t+1},\zeta))\right\}.
86	\end{align}
87
88	Nyn�po�me o��nou ztr� pro $N-1$.
89	\begin{equation}
90	V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})=\min_{\nu_{N-1}}\left\{(\eta_{N-1}+\beta_{N-1}\nu_{N-1})^2+\nu_{N-1}^2+1\right\}.
91	\end{equation}
92
93	Derivac�� optim��h jako
94	\begin{equation}
95	\label{optcon}
96	\nu_{N-1}=-\frac{\eta_{N-1}\beta_{N-1}}{1+\beta_{N-1}^2}
97	\end{equation}
98	a o��nou ztr�
99	\begin{equation}
100	V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})= \frac{\eta_{N-1}^2+1}{\beta_{N-1}^2+1}
101	\end{equation}
102
103	Proto�e optim��h $\nu_{N-1}$ ani o��n�tr� $V_{N-1}$ nez�s�a $\zeta_{N-1}$, d� tvaru $V_t$ nebude rovn�optim��h $\nu_t$ a o��n�tr� $V_t$ z�set na $\zeta_t$. P�skretizaci tedy sta�uva�ovat pouze dvoudimenzion��rostor nez�sle prom��\eta_t,\beta_t)$.
104
105	\section{Srovn� jednotliv��up� t� sekci jsou porovn� popsan��c�lgoritmy na syst� \eqref{simple}.
106	POPIS EXPERIMENTU

Note: See TracBrowser for help on using the browser.

Context Navigation

root/applications/dual/SIDP/text/ch4.tex @ 930

Download in other formats: