Context Navigation

ch3.tex @ 1351

Revision 1351, 24.8 kB (checked in by zimamiro, 13 years ago)

Line
1	V t� kapitole je pops�jednoduch�� na kter�jsou porovn� ��lgoritmy zalo�en�a principech uveden�p�l�apitole. �d� algoritmy byly implementov� v prost�\emph{Matlab}.
2
3	\section{Integr�r s nezn�m ziskem}
4	Syst�zvan�gr�r s nezn�m ziskem, byl podrobn�koum�v \cite{astrom1986dual}. Pro srovn� uv�me tam��y.
5
6	\subsection{Popis syst�}
7	V�syst� je pops�jako
8	\begin{gather}
9	\label{simple}
10	y_{t+1}=y_t+\theta u_t+v_{t+1}, \qquad t=0,\ldots,N-1,\\
11	v_{t+1}\sim N(0,\sigma^2),
12	\end{gather}
13	kde $\theta\neq0$ je nezn� parametr a rozptyl �umu $\sigma^2=0,1$. Po�e� hodnota v� je nastavena na $y_0=1$.
14
15	O nezn�m parametru $\theta$ m� v �e $t$ informaci v podob�ostate� statistiky $T_t=(\hat{\theta}_t,P_t)$ tvo�st� hodnotou a rozptylem. P�kl�me nekorelovanost odhadu $\theta_t$ s �umem, tedy �e
16	\begin{equation}
17	\cov(v_{t+1},\theta_t)=0.
18	\end{equation}
19
20	Optim��n�e takov�kter�dr�� syst� na nulov�odnot�Ztr�v�unkce je kvadratick� $y_{t+1}$, �i
21	\begin{equation}
22	\label{glos}
23	g(y_{1:N},u_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2.
24	\end{equation}
25
26	Odhadovac�rocedurou pro parametr $\theta$ je Kalman�ltr. Pro syst�\eqref{simple} m�var
27	\begin{gather}
28	K_t=\frac{u_tP_t}{u_t^2P_t+\sigma^2},\\
29	\label{kal}
30	\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-u_t\hat{\theta}_t),\\
31	P_{t+1}=(1-K_tu_t)P_t.
32	\end{gather}
33
34	Hyperstav syst� $H_t$ tvo�ktor $(y_t,\hat{\theta}_t,P_t)$. O��n�tr� je
35	\begin{equation}
36	J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{y_{t+1}^2+J_{t+1}(H_{t+1})\|H_t,u_t\right\}, \qquad t=0,\ldots,N-1.
37	\end{equation}
38
39	Ta po dosazen� \eqref{simple} a �te�m proveden�t� hodnoty p� na tvar
40	\begin{gather}
41	\label{dos}
42	J_t(H_t)=\min_{u_t \in U_t}\left\{(y_t+\hat{\theta}_tu_t)^2+u_t^2P_t+\sigma^2+\E_{y_{t+1}}(J_{t+1}(H_{t+1}))\|y_t,\hat{\theta}_t, P_t,u_t\right\}.
43	\end{gather}
44
45	\subsection{Transformace rovnic syst�}
46	P�amotnou aplikac��k� �� algoritmu lze � vhodnou transformac�rom��ednodu�it. Dle \cite{astrom1986dual} je takovou transformac��d od popisu pomoc�$(y_t,\hat{\theta}_t,P_t,u_t)$ k prom��eta_t,\beta_t,\zeta_t,\nu_t)$ dle vztah�egin{gather}
47	\eta_t=\frac{y_t}{\sigma}, \\
48	\label{trab}
49	\beta_t=\frac{\hat{\theta}_t}{\sqrt{P_t}}, \\
50	\zeta_t=\frac{1}{\sqrt{P_t}}, \\
51	\nu_t=\frac{u_t\sqrt{P_t}}{\sigma}.
52	\end{gather}
53
54	Sou�n�� neur�ost ve v� \eqref{simple} reprezentovat jedinou normalizovanou n�dnou veli�ou
55	\begin{equation}
56	s_t=\frac{y_{t+1}-y_t+\hat{\theta}_tu_t}{\sqrt{u_t^2P_t+\sigma^2}} \sim N(0,1).
57	\end{equation}
58
59	Rovnice pro v�\eqref{simple} a n�eduj� odhad nezn�ho parametru \eqref{kal} tak p� v
60	\begin{gather}
61	\label{eta}
62	\eta_{t+1}=\eta_t+\beta_t\nu_t+\sqrt{1+\nu_t^2}s_t,\\
63	\label{beta}
64	\beta_{t+1}=\sqrt{1+\nu_t^2}\beta_t+\nu_ts_t.
65	\end{gather}
66
67	P�me-li k vhodn�praven��n�tr�, dostaneme
68	\begin{align}
69	\label{bel}
70	V_t(\eta_t,\beta_t,\zeta_t)&=\frac{J_t(y_t,\hat{\theta}_t,P_t)}{\sigma^2}\\
71	&=\min_{\nu_t }\left\{(\eta_t+\beta_t\nu_t)^2+\nu_t^2+1+\E_{s_t}(V_{t+1}(\eta_{t+1},\beta_{t+1},\zeta_{t+1}))\right\}.
72	\end{align}
73
74	Nyn�po�me o��nou ztr� pro $N-1$ jako
75	\begin{equation}
76	V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})=\min_{\nu_{N-1}}\left\{(\eta_{N-1}+\beta_{N-1}\nu_{N-1})^2+\nu_{N-1}^2+1\right\}.
77	\end{equation}
78
79	Pomoc�iferenci�� po� pak z�� optim��h ve tvaru
80	\begin{equation}
81	\label{optcon}
82	\nu_{N-1}=-\frac{\eta_{N-1}\beta_{N-1}}{1+\beta_{N-1}^2}
83	\end{equation}
84	a o��nou ztr� rovnu
85	\begin{equation}
86	V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})= \frac{\eta_{N-1}^2+1}{\beta_{N-1}^2+1}.
87	\end{equation}
88
89	Proto�e optim��h $\nu_{N-1}$ ani o��n�tr� $V_{N-1}$ nez�s�a $\zeta_{N-1}$, d� tvaru $V_t$ nebude rovn�optim��h $\nu_t$ a o��n�tr� $V_t$ z�set na $\zeta_t$. K nalezen�ptim�� edy sta�v ka�d��e $t$ uva�ovat pouze dvourozm��rstav $H_t=(\eta_t,\beta_t)$. Nav�m� bez �na obecnosti po�at optim��h pouze pro kladn�odnoty $\eta_t$ a $\beta_t$. Optim��n�edy napo�me pouze pro kladn�odnoty $y_t$ a $\theta_t$. Pro ostatn�o�nosti pak d� tvaru \eqref{simple} dostaneme po�adovan�c��h vhodnou volbou znam�a napo�n� z�hu.
90
91	\section{Pou�it��c�lgoritmy}
92	V tomto odd� jsou pops� ��lgoritmy, kter�udou posl� porovn� p�zen�yst� \eqref{simple}. Algoritmy jsou zalo�en�a principech uveden�p�l�apitole.
93
94	\subsection{Certainty equivalent}
95	Aplikac�etody certainty equivalent (CE) p� o��n�tr� \eqref{bel} v
96	\begin{equation}
97	V_t(\eta_t,\beta_t)=\min_{\nu_t }\left\{\hat{\eta}_{t+1}^2+V_{t+1}(\eta_{t+1},\beta_{t+1})\right\}
98	\end{equation}
99	St� hodnota v� je dle \eqref{eta} rovna
100	\begin{equation}
101	\hat{\eta}_{t+1}=\eta_t+\beta_t\nu_t,
102	\end{equation}
103
104	Optim��c��h bude tedy pro ka�d�\beta_t\neq0$ roven
105	\begin{equation}
106	\label{cecon}
107	\nu_t=-\frac{\eta_t}{\beta_t}.
108	\end{equation}
109
110	Pokud $\beta_t=0$, pak to dle \eqref{trab} znamen��e i $\hat{\theta}_t=0$ (to se m�t�a�liv $\theta\neq0$). Aktu��n�tr� pak nez�s�a $\nu_t$ a m� tedy volit libovoln�c��h bez vlivu na hodnotu o��n�tr�. V takov�p��ol� za ��h realizaci b�ho �umu $N(0,1)$. Jedn�e vlastn� jednoduchou aplikaci principu du�� opsan� rovnic�eqref{dual}.
111
112	Z tvaru optim�� z�hu \eqref{cecon} snadno zjist�, �e CE je metodou nedu��Pokud je toti� v�syst� na po�adovan�odnot��h nebude syst�vychylovat za �m lep��dentifikace parametru $\theta$. Nicm� d� tomu, �e m� k dispozici analytick�yj�en�\nu_t$, m��en�omoc�etody CE prov�no s minim�� v�n� n�ky. To m��er�likac� rozhoduj� v�.
113
114	Aplikace metody CE v podob��c� z�hu \eqref{cecon} je zjevn�evhodn�ro mal�odnoty $\beta_t$. Metoda bude toti� generovat, p� velk��c��hy bez ohledu na mo�nou p�nost neur�osti. Konkr��ky budou prezentov� d�.
115
116	\subsection{Opatrn��n�
117	Optim��c��h je pro metodu opatrn� ��cautious control, CC) d�dle \eqref{optcon} jako
118	\begin{equation}
119	\label{optcon2}
120	\nu_t=-\frac{\eta_t\beta_t}{1+\beta_t^2}.
121	\end{equation}
122
123	Op�se poda�z�at analytick�yj�en�\nu_t$ a v� optim�� omoc�etody CC m��v�n velmi efektivn�
124
125	V�imn� se, �e pro velk�odnoty $\beta_t$ p� optim��h pro metodu opatrn� ��eqref{optcon2} v optim��h metody CE \eqref{cecon}. Naproti tomu pro mal�odnoty $\beta_t$ (tedy pro velk�odnoty neur�osti v identifikaci parametru $\theta$, viz \eqref{trab}) bude ��odstatn�onzervativn��Pro $\beta_t=0$ (to odpov� $\hat{\theta}_t=0$) pak bude $\nu_t=0$ a regul�r tedy nebude poskytovat ��ktivn��n�
126
127	\subsection{Klasick�tup k dynamick� programov�}
128	V �nku \cite{astrom1986dual} je probl��yst� \eqref{simple} � pomoc��aplikace numerick�tod na ��lohy dynamick� programovan�Jde o sch� popsan� sekci \ref{idp}. Prostor hyperstav� diskretizov�do m� 64x64. Pro ka�d�hyperstavu se napo�ala o��n�tr�, mimo body m� se pou�ila kubick�nterpolace. K numerick�ntegraci byla pou�ita klasick�impsonova metoda. K nalezen�inima se pak pou�ila jednoduch�etoda, p�� se ka�d�emi body na m� prolo�ila parabola, nalezlo jej�inimum a to se pak testovalo, zdali je glob��minimem o��n�tr�.
129
130	Optim��n�a v�� bylo nakonec parametrizov� analytickou formul�varu
131	\begin{equation}
132	\label{ast}
133	\nu_t=-\frac{0,56+\beta_t}{2,2+0,08\beta_t+\beta_t^2}\eta_t-\frac{1,9}{1,7+\beta_t^4}.
134	\end{equation}
135	Auto��j��e analytick�proximace zp�la zv�ve ztr�v�unkci o m� ne� 1 \%.
136
137	Prvn�len v \eqref{ast} m� interpretovat jako modifikovan�patrn��n�druh� pak jako bud� slo�ku ��
138
139	\subsection{SIDP}
140	Dle popisu (a n�edn�ransformace) syst� \eqref{simple} je pro v� optim��trategie pomoc�lgoritmu SIDP nutn�iskretizovat �t dvoudimenzion�� prostoru nez�sle prom��_t=(\eta_t,\beta_t)$. Jak bylo v��, optim��c��hy sta�napo�t pro kladn�odnoty $(\eta_t,\beta_t)$.
141
142	V pr� \cite{thompson2005stochastic}, kde je metoda SIDP navr�ena, je pro diskretizaci prostoru pou�ita oblast obd��v� tvaru. Kolem vygenerovan�d�vytvo�jmen��bd�� kter�huje v�echny vygenerovan�ody. Metodu k jeho ur��li auto� \cite{bh-eamvb-01}. Nicm� p�u�it�� metody nen�aru�o, �e �t takto vygenerovan� obd�� nebude obsahovat i z�rn�odnoty $(\eta_t,\beta_t)$, viz obr�k \ref{box}.
143
144	\begin{figure}
145	\centering
146	\includegraphics[width=0.25\textwidth]{box}
147	\caption{Oblast ur�� diskretizaci $H_t$ pomoc�ejmen�� obd�� -- body uvnit�cn�rientovan� obd�� nemus�pl�t po�adavek na nez�rnost}
148	\label{box}
149	\end{figure}
150
151	V t� pr� se proto vol�dli�n�etoda. K diskretizaci zasa�en��i prostoru se vol�p�oblast obd��v� tvaru. Ta se ur�n�eduj� jednoduchou metodou (matici obsahuj� v�echny vygenerovan�ody ozna� $A=(x_1,x_2,\ldots,x_N) \in \mathbb{R}_+^{2,N}$)
152	\begin{itemize}
153	\item spo�u se vlastn��a a vektory kovarian� matice $AA'$
154	\item vlastn�ektory ur��m�hran kv�u, jejich d�a je $4\sqrt{\lambda_i}/N$
155	\item za st�bd�� se zvol��t�no�iny $\left\{x_1,x_2,\ldots,x_N\right\}$.
156	\end{itemize}
157	Pokud �t obd�� obsahuje z�rn�odnoty $(\eta_t,\beta_t)$, vezme se vhodn�ato�� zmen�en��. To se provede iterativn�kdy v ka�d�teraci se p��bd��nato�o 5�
158	a zmen�� 5 \%. V iterac� se pokra�e, dokud nen�pln� podm�a na nez�rn�odnoty $(\eta_t,\beta_t)$ uvnit��. Mo�nou situaci ilustruje obr�k \ref{box1}
159
160	\begin{figure}
161	\centering
162	\includegraphics[width=0.25\textwidth]{box1}
163	\caption{Oblast ur�� diskretizaci $H_t$ pomoc�de pou�it�etody -- v p��ot�se napo�n�ln�vhodn�men�� nato�
164	\label{box1}
165	\end{figure}
166
167	Implementace dal�� t�lgoritmu byla provedena v souladu s odd�m \ref{sidp}. Konkr��astaven�arametr�oritmu zachycuje tabulka \ref{par2}. V� za dan�rametr�al v �h minut.
168
169	\begin{table}
170	\begin{tabular}{\|l\|ll\|}
171	\hline
172	po� opakov� algoritmu & $n_{pass}$ & 4\\
173	po� iterac�lgoritmu & $n_{iter}$ & 8\\
174	po� bod�iskretizaci ka�d�imenze $H_t$ & $n_g$ & 10\\
175	apriorn��c�trategie & $\mu_{0:N-1}$ & $0$\\
176	po� kadnid� na zm� �� z�hu & $m$ & 7\\
177	po�e� rozsah pro hled� optim�� z�hu & $\beta^{in}$ & 1\\
178	parametr pro redukci $\beta^{in}$ p�akov� algoritmu &$\gamma$ & 0,9\\
179	parametr pro redukci $\beta^{in}$ p�erov� algoritmu & $\lambda$ & 0,5\\
180	po� realizac�ro odhad metodou Monte Carlo & $n$ & 20\\\hline
181	\end{tabular}
182	\caption{Konkr��olba parametr�oritmu SIDP}
183	\label{par2}
184	\end{table}
185
186	\section{Srovn� jednotliv��up� t� sekci jsou porovn� popsan�lgoritmy p�zen�yst� \eqref{simple}. Syst�je mo�n� p��ot�vhodn�osunou �p�lovat, nen�edy pot�uva�ovat jin�odnoty referen�ho sign� a po�e�ho v�. Kvalitu v�� osuzujeme z hlediska celkov�tr� vygenerovan�od�horizontu d�y $N$.
187
188	O��n�ledek bylo, �e v p��elk�o�e� neznalosti syst� bude du��n��an�omoc�IDP v�j��proti nedu��metod� Ty zde zastupuje metoda certainty equivalent (CE) a metoda Cautious control (CC). Pro srovn� je uveden v�k z�an�ick�erick�stupem k dynamick� programov� (DP) p�t�ite{astrom1986dual}. Jak vypl�tvaru \eqref{ast}, jedn�e o du��etodu.
189
190	O�� se, �e v�y z�an�omoc�lasick� DP budou srovnateln� v�y z�an�todou SIDP. Nicm� jak bylo prov�no v �nku \cite{thompson2005stochastic}, srovnateln��y d� SIDP ji� p�setinov�v�n��e. To je zp�no t� �e se p�u�it�etody SIDP diskretizuje jen ta �t hyperstavu, kter�e nezbytn� dal��teraci algoritmu. Pro efektivn�iskretizaci tedy sta�v� m� bod� v�� publikovan�pr� \cite{thompson2005stochastic} to bylo 64x64 bod� metodu DP, zat�o pro SIDP jen 20x20).
191
192	\subsection{Kvantitativn�rovn�}
193	�zen�ylo testov� vzhledem k r� hodnot�po�e�ho odhadu $\theta$, tedy k r� hodnot�$(\hat{\theta}_0,P_0)$. �d� horizont byl v prvn��i experiment�len jako $N_1=5$, v druh�N_2=10$. Ka�d�imulace byla opakov� 1000x, uveden�odnoty celkov�tr� jsou pr�m p�ednotliv�ealizace.
194
195	Pro ka�d�ednotliv�pakov� simulace byla skute� hodnota parametru $\theta$ pro po�e� hodnoty $(\hat{\theta}_0,P_0)$ zvolena jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(\hat{\theta}_0,P_0)$. Pro takto vygenerovanou hodnotu $\theta$ byly postupn�plikov� v�psan��c�lgoritmy. Pro sn�n�livu n�dnosti p�rovn� kvality ��yly v�echny realizace �umu (v r�i jednoho opakov� simulace) v pr� ��ednotliv�goritmy voleny stejn�
196
197	Na obr�u \ref{5} jsou zachyceny v�y pro d�u �� horizontu $N=5$, po�e� hodnoty rozptylu $P_0=1$ a $P_0=10$ a r�hodnoty $\hat{\theta}_0$, konkr��ro hodnoty $\{0,1,10\}$.
198
199	Prvn�ozorovateln�edek pro p� $P_0=1$ je, �e metoda CE poskytuje v pr� pou�iteln��n�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. V ostatn� p�ech je ��iln��sl�a apriorn�nformaci a n�dn�alizac� �umu a v pr� je takov�e�en�epou�iteln�
200
201	Jak ji� bylo zd�� v�etoda CC d� pro nulov�d na st� hodnotu, tedy pro $\hat{\theta}_t=0$, nulov��n�Ztr� p�zen� apriorn�nformac�(0,P_0)$ je tedy d� absenci ��vlivn� pouze konkr�� realizacemi �umu. Oproti tomu p�nulov�priorn�nformaci $\hat{\theta}_0$ dosahovalo ��omoc�C pr��ejmen��tr�.
202
203	Ob�u��etody (SIDP a DP) poskytuj� pr� dobr��n�ro v�echny testovan�ombinace $(\hat{\theta}_0,P_0)$. V p��elk�eur�osti po�e� identifikace $\theta$ (p� $P_0=10$) maj�egul�ry srovnateln��y. Pro del��orizont $N=10$ a p�j��priorn�nformaci $P_0=1$ dosahovala metoda SIDP hor�� v��li nep�stem zp�n�kretizac�
204
205	\begin{figure}
206	\centering
207	\begin{minipage}[c]{0.49\textwidth}
208	\centering
209	\includegraphics[width=\textwidth]{N=5,P=1}
210	\end{minipage}
211	\begin{minipage}[c]{0.49\textwidth}
212	\centering
213	\includegraphics[width=\textwidth]{N=5,P=10}
214	\end{minipage}
215	\caption{V�y simulace pro d�u horizontu $N=5$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$}
216	\label{5}
217	\end{figure}
218
219	\begin{figure}
220	\centering
221	\begin{minipage}[c]{0.49\textwidth}
222	\centering
223	\includegraphics[width=\textwidth]{N=10,P=1}
224	\end{minipage}
225	\begin{minipage}[c]{0.49\textwidth}
226	\centering
227	\includegraphics[width=\textwidth]{N=10,P=10}
228	\end{minipage}
229	\caption{V�y simulace pro d�u horizontu $N=10$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$}
230	\label{10}
231	\end{figure}
232
233	\subsection{Kvalitativn�rovn�}
234	Nastaven�imulace je stejn�ako v p��vantitativn� srovn�. Horizont je ve v�ech p�ech volen $N=5$, pro hodnotu $N=10$ byl v�k obdobn�
235	Dvojice obr��f{1} zachycuje v�y ��etodou certainty equivalent p�dnotliv�mulac� pro r�kombinace $(\hat{\theta}_0,P_0)$. Uveden�istogramy ukazuj��e a�e v n�er��dech poda�pomoc�etody CE navrhnout ��trategii s celkov��ou ztr�u, ve v�in��o ��e�n� vedlo k vysok�tr�. Jak ji� bylo zm�no v�� tvo��dy, kdy je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Tehdy je pou�it�etody CE vhodn�
236
237	\begin{figure}
238	\centering
239	\begin{minipage}[c]{0.49\textwidth}
240	\centering
241	\includegraphics[width=\textwidth]{CE4}
242	\end{minipage}
243	\begin{minipage}[c]{0.49\textwidth}
244	\centering
245	\includegraphics[width=\textwidth]{CE6}
246	\end{minipage}
247	\caption{V�y jednotliv�mulac��zen�etodou certainty equivalent}
248	\label{1}
249	\end{figure}
250
251	Na obr�� \ref{2} jsou v�y pro metodou cautious control. Oproti metod�E m� pozorovat absenci v� �patn� ��Pro $\hat{\theta}_0=0$ je ��ulov� v��tr�
252	tak z�s�ouze na konkr�� realizac� �umu. Oproti tomu p�hat{\theta}_0=10$ je ��elmi kvalitn� pro vysok�te� rozptyl $P_0$.
253
254	\begin{figure}
255	\centering
256	\begin{minipage}[c]{0.49\textwidth}
257	\centering
258	\includegraphics[width=\textwidth]{CC4}
259	\end{minipage}
260	\begin{minipage}[c]{0.49\textwidth}
261	\centering
262	\includegraphics[width=\textwidth]{CC6}
263	\end{minipage}
264	\caption{V�y jednotliv�mulac��zen�etodou cautious control}
265	\label{2}
266	\end{figure}
267
268	V�y pro jednotliv�imulace p�zen�etodou SIDP jsou na obr�u \ref{3}. Hlavn�ozd�oproti metod�E je, stejn�ako v p��C, odbour� tot�� selh� ��Charakteristick�em obou histogram��a spektra dosa�en�r� To je zp�no opatrnost��vrhu �� z�h�edy i pomalej��dentifikac�arametru $\theta$. Naproti tomu je v mnoha p�ech dosa�eno ztr�, kter�e vy��e� p�u�it��n�omoc�E a CC. Algoritmus SIDP tedy d� v pr� dobr��y d� robustnosti v�� patn� ��
269
270	\begin{figure}
271	\centering
272	\begin{minipage}[c]{0.49\textwidth}
273	\centering
274	\includegraphics[width=\textwidth]{SIDP4}
275	\end{minipage}
276	\begin{minipage}[c]{0.49\textwidth}
277	\centering
278	\includegraphics[width=\textwidth]{SIDP6}
279	\end{minipage}
280	\caption{V�y jednotliv�mulac��zen�etodou SIDP}
281	\label{3}
282	\end{figure}
283
284	Histogramy pro metodu klasick� numerick� p�pu k ��P zobrazuje \ref{4}. A�liv kvantitativn�ych� ��omoc�IDP a DP velmi podobn�p�alitativn�porovn� pomoc�istogram�m� v�imnout, �e ��etodou DP �t� nab��elkov�tr� ne� SIDP, ale rovn�i �t� selh� a dosahuje tak vysok�tr�.
285
286	\begin{figure}
287	\centering
288	\begin{minipage}[c]{0.49\textwidth}
289	\centering
290	\includegraphics[width=\textwidth]{DP4}
291	\end{minipage}
292	\begin{minipage}[c]{0.49\textwidth}
293	\centering
294	\includegraphics[width=\textwidth]{DP6}
295	\end{minipage}
296	\caption{V�y jednotliv�mulac��zen�etodou DP}
297	\label{4}
298	\end{figure}
299
300	\subsection{Porovn� robustnosti}
301	Kvalitu v�� vliv� p�st apriorn�nformace o nezn�m parametru $\theta$, kter�e pro syst�\eqref{simple} reprezentov� veli�ou $(\hat{\theta}_0,P_0)$. N�eduj� simulace dokumentuje �nost �� algoritm��e apriorn�nformace p� neodpov� skute�sti.
302
303	Pro tyto � byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(1,10)$. Robustnost pak byla testov� vzhledem k r�po�e� informaci o st� hodnot�\hat{\theta}_0$ nezn�ho parametru $\theta$. Rozptyl byl ve v�ech simulac� polo�en $P_0=10$. V�y zachycuje obr�k \ref{rob}. Ka�d�imulace byla opakov� 1000x, uveden je pr�p�ednotliv�ealizace. Metoda CE nen� ohledem k p�oz�v�� srovn� zahrnuta.
304
305	Pozorovan�ledkem je p��dobr�dolnost metody SIDP v�patn�priorn�nformaci $\hat{\theta}_0$. V��n��an�outo metodou dosahovalo dobr�tr� i v p��kdy byla apriorn�nformace naprosto nepou�iteln�$\hat{\theta}_0=-10$). Ostatn��c�lgoritmy (zejm� pak DP) dos�y v tomto p��ysok�r��tr�.
306
307	\begin{figure}
308	\centering
309	\includegraphics[width=0.5\textwidth]{rob}
310	\caption{Porovn� robustnosti navr�en��c�trategie vzhledem k nep�sti apriorn�nformace $\hat{\theta}_0$}
311	\label{rob}
312	\end{figure}
313
314	\subsection{�sov��st SIDP}
315	Pro nedu��etody CE a CC je k dispozici analytick� ��trategie, v� m��y prov�n prakticky v re��e. Strategie z�an�lgoritmem DP (p�ta z \cite{astrom1986dual}) m�ovn�analytick�. Jej�� trval (dle v��te{thompson2005stochastic}) p��n�esetkr�d�, oproti pou�it�IDP za obdr�en�rovnateln�sledk�
316	Tento odd�ilustruje n��st v� ��trategie pomoc�lgoritmu SIDP v z�slosti na d�e �� horizontu a jemnosti diskretizace. V�m algoritmu je tabulka vypo�n�d�ch z�h�ednotliv�dech diskretizace. Samotn��n�e prov� vyhled�n�v t� struktu�ro konkr��od hyperstavu $H_t$ se v tabulce vyhled�ejbli��apo�n�odnota a p� se ��h, kter��edn�ou�ije. Jsou-li tedy p��n�abulky k dispozici, ��rob�t prakticky v re��e, z�s�ouze na efektivit�yhled�n� p��n�truktu��u�it�etody SIDP je �ov�� f� p�vy tabulek, pomoc�ich� se posl� ��rov�. Diskutov� je tedy tato �t algoritmu.
317
318	V jednotliv�mulac�, kter�� prov�t v�n��ky metody SIDP, byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(0,10)$. Tomu odpov�la rovn�apriorn�nformace $(\hat{\theta}_0,P_0)=(0,10)$. Doba v� byla zkoum� v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace $n_{g}$ (tj. po� bod�iskretizaci ka�d�imenze hyperstavu $H_t$). Ostatn�arametry z�y shodn� nastaven�v tabulce \ref{par2}.
319
320	Obdr�en��y zachycuje tabulka \ref{hor}. Pro srovn� je rovn�uvedena ztr�, kter�akto navr�en��n�os�o. Jedn�e op�o pr�z tis� opakov�.
321
322	\begin{table}
323	\centering
324	\begin{tabular}{\|c\|c\|c\|c\|}
325	\hline
326	$N$ & $n_{g}$ & $\bar{J}$ & $t$ $[s]$\\ \hline
327	5 & 5& 3,11 & 23\\
328	5 & 10& 3,06 & 76\\
329	5 & 15& 3,01 & 180\\ \hline
330	10& 5& 4,67 & 124\\
331	10&10& 4,05 & 432\\
332	10&15& 3,91 & 1032\\ \hline
333	15& 5& 5,60 & 294\\
334	15&10& 5,12 & 1284\\
335	15&15& 5,06 & 2808\\ \hline
336	\end{tabular}
337	\caption{V�n�as $t$ algoritmu SIDP v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace $n_g$, $\bar{J}$ je pr��tr�}
338	\label{hor}
339	\end{table}
340
341	Dosa�en��y ukazuj��e i pro del��c�orizonty lze k n�hu pou��metodu SIDP. V�n�oba v�ak metodu z� limituje pro v� del��asov�orizonty. Jemnost diskretizace ovliv�la pr�ou ztr� vzhledem k u�et�u v�n� �u relativn��. Obzvl��ro kr��v�zont ($N=5$) byla kvalita v�� rovnateln� pro velmi hrubou diskretizaci (sta�o pouze 5x5 bod�
342	\subsection{Shrnut��ulace}
343	Dle proveden�mulac�ych� p�zen�yst� \eqref{simple} s nenulovou po�e� informac� st� hodnot�\theta$ nejl� nedu��etoda cautious control (CC). Dle kvantitativn� srovn� dosahovala v tomto p��r��ejni��tr� a kvalitativn�orovn� pak prok�lo jeho robustnost. Nicm� regul�r navr�en�c�etody CC nen�ou�iteln��d�\hat{\theta}_0=0$, nebo� tehdy poskytuje pouze nulov��n�
344
345	Du��etody (numerick�e�en�P p�t� \cite{astrom1986dual} a SIDP) dok�ly navrhnout �n��n�ro libovoln�odnoty parametr�\hat{\theta}_0,P_0)$. Ob�mi�n�etody pak dosahovaly v p��elk�o�e� neznalosti ($P_0=10$) kvantitativn�rovnateln�sledk�razn��ozd�byl pro rozptyl $P_0=1$. Tehdy si vedla l� metoda DP.
346
347	Metoda SIDP se uk�la jako robustn��naproti tomu v�ak �t� dosahovala m��y��tr� ne� DP. Chov� obou du�� metod tak vych� pr��elmi podobn�Nutno v�ak p�enout v�k z \cite{thompson2005stochastic}, �e SIDP dosahuje srovnateln� v�u s DP ji� p�ruba desetinov�v�n��e.
348
349	Metoda certainty equivalent (CE) se uk�la pou�iteln�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Podle kvalitativn� zkoum� to bylo zp�no t� �e v mnoha p�ech, ztr� v� p��a rozumnou mez. P� se ob� i touto metodou poda�navrhnout kvalitn��n�
350
351	Anal�po�n��sti algoritmu SIDP uk�la, �e pro komplexn��lohy by p�ala v � pouze v p��r��sov�rizont�ep� jemn�iskretizace. Jako vhodn�e tedy jev�ou�it�etody SIDP v kombinaci s n�kou v�n�fektivn�etodou, nap�d CC. V p��patn�dentifikace syst� by se pou�ilo ��avr�en�omoc�IDP a jakmile by znalost syst� p��a jistou zvolenou mez, k ��y se pou�ila nedu��etoda. V takov�p��y toti� sta�o metodou SIDP � jen na kr��ov�horizontu, konkr��e� by bylo dosa�eno dostate� znalosti syst�. D� by se ji� �o v�n�fektivn�etodou.

Note: See TracBrowser for help on using the browser.

Context Navigation

root/applications/dual/SIDP/bakalarka/SIDP/text/prace/ch3.tex @ 1351

Download in other formats: