root/applications/dual/SIDP/bakalarka/SIDP/text/prace/ch3.tex @ 1351

Revision 1351, 24.8 kB (checked in by zimamiro, 13 years ago)
Line 
1V t� kapitole je pops�jednoduch�� na kter�jsou porovn� ��lgoritmy zalo�en�a principech uveden�p�l�apitole. �d� algoritmy byly implementov� v prost�\emph{Matlab}.
2
3\section{Integr�r s nezn�m ziskem}
4Syst�zvan�gr�r s nezn�m ziskem, byl podrobn�koum�v \cite{astrom1986dual}. Pro srovn� uv�me tam���y.
5
6\subsection{Popis syst�}
7V�syst� je pops�jako
8\begin{gather}
9\label{simple}
10y_{t+1}=y_t+\theta u_t+v_{t+1}, \qquad t=0,\ldots,N-1,\\
11v_{t+1}\sim N(0,\sigma^2),
12\end{gather}
13kde $\theta\neq0$ je nezn� parametr a rozptyl �umu $\sigma^2=0,1$. Po�e� hodnota v� je nastavena na $y_0=1$.
14
15O nezn�m parametru $\theta$ m� v �e $t$ informaci v podob�ostate� statistiky $T_t=(\hat{\theta}_t,P_t)$ tvo�st� hodnotou a rozptylem. P�kl�me nekorelovanost odhadu $\theta_t$ s �umem, tedy �e
16\begin{equation}
17\cov(v_{t+1},\theta_t)=0.
18\end{equation}
19
20Optim���n�e takov�kter�dr��� syst� na nulov�odnot�Ztr�v�unkce je kvadratick� $y_{t+1}$, �i
21\begin{equation}
22\label{glos}
23g(y_{1:N},u_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2.
24\end{equation}
25
26Odhadovac�rocedurou pro parametr $\theta$ je Kalman�ltr. Pro syst�\eqref{simple}  m�var
27\begin{gather}
28K_t=\frac{u_tP_t}{u_t^2P_t+\sigma^2},\\
29\label{kal}
30\hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-u_t\hat{\theta}_t),\\
31P_{t+1}=(1-K_tu_t)P_t.
32\end{gather}
33
34Hyperstav syst� $H_t$ tvo�ktor $(y_t,\hat{\theta}_t,P_t)$. O��n�tr� je
35\begin{equation}
36J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{y_{t+1}^2+J_{t+1}(H_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1.
37\end{equation}
38
39Ta po dosazen� \eqref{simple} a �te�m proveden�t� hodnoty p� na tvar
40\begin{gather}
41\label{dos}
42J_t(H_t)=\min_{u_t \in U_t}\left\{(y_t+\hat{\theta}_tu_t)^2+u_t^2P_t+\sigma^2+\E_{y_{t+1}}(J_{t+1}(H_{t+1}))|y_t,\hat{\theta}_t, P_t,u_t\right\}.
43\end{gather}
44
45\subsection{Transformace rovnic syst�}
46P�amotnou aplikac��k� �� algoritmu lze � vhodnou transformac�rom��ednodu�it.  Dle \cite{astrom1986dual} je takovou transformac��d od popisu pomoc�$(y_t,\hat{\theta}_t,P_t,u_t)$ k prom��eta_t,\beta_t,\zeta_t,\nu_t)$ dle vztah�egin{gather}
47\eta_t=\frac{y_t}{\sigma}, \\
48\label{trab}
49\beta_t=\frac{\hat{\theta}_t}{\sqrt{P_t}}, \\
50\zeta_t=\frac{1}{\sqrt{P_t}}, \\
51\nu_t=\frac{u_t\sqrt{P_t}}{\sigma}.
52\end{gather}
53
54Sou�n�� neur�ost ve v� \eqref{simple} reprezentovat jedinou normalizovanou n�dnou veli�ou
55\begin{equation}
56s_t=\frac{y_{t+1}-y_t+\hat{\theta}_tu_t}{\sqrt{u_t^2P_t+\sigma^2}} \sim N(0,1).
57\end{equation}
58 
59Rovnice pro v�\eqref{simple} a n�eduj� odhad nezn�ho parametru \eqref{kal} tak p� v
60\begin{gather}
61\label{eta}
62\eta_{t+1}=\eta_t+\beta_t\nu_t+\sqrt{1+\nu_t^2}s_t,\\
63\label{beta}
64\beta_{t+1}=\sqrt{1+\nu_t^2}\beta_t+\nu_ts_t.
65\end{gather}
66
67P�me-li k vhodn�praven���n�tr�, dostaneme
68\begin{align}
69\label{bel}
70V_t(\eta_t,\beta_t,\zeta_t)&=\frac{J_t(y_t,\hat{\theta}_t,P_t)}{\sigma^2}\\
71&=\min_{\nu_t }\left\{(\eta_t+\beta_t\nu_t)^2+\nu_t^2+1+\E_{s_t}(V_{t+1}(\eta_{t+1},\beta_{t+1},\zeta_{t+1}))\right\}.
72\end{align}
73
74Nyn�po�me o��nou ztr� pro $N-1$ jako
75\begin{equation}
76V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})=\min_{\nu_{N-1}}\left\{(\eta_{N-1}+\beta_{N-1}\nu_{N-1})^2+\nu_{N-1}^2+1\right\}.
77\end{equation}
78
79Pomoc�iferenci�� po� pak z�� optim���h ve tvaru
80\begin{equation}
81\label{optcon}
82\nu_{N-1}=-\frac{\eta_{N-1}\beta_{N-1}}{1+\beta_{N-1}^2}
83\end{equation}
84a o��nou ztr� rovnu
85\begin{equation}
86V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})= \frac{\eta_{N-1}^2+1}{\beta_{N-1}^2+1}.
87\end{equation}
88
89Proto�e optim���h $\nu_{N-1}$ ani o��n�tr� $V_{N-1}$ nez�s�a $\zeta_{N-1}$, d� tvaru $V_t$ nebude rovn�optim���h $\nu_t$ a o��n�tr� $V_t$ z�set na $\zeta_t$. K nalezen�ptim�� ��edy sta�v ka�d��e $t$ uva�ovat pouze dvourozm��rstav $H_t=(\eta_t,\beta_t)$. Nav�m� bez �na obecnosti po�at optim���h pouze pro kladn�odnoty $\eta_t$ a $\beta_t$. Optim���n�edy napo�me pouze pro kladn�odnoty $y_t$ a $\theta_t$. Pro ostatn�o�nosti pak d� tvaru \eqref{simple} dostaneme po�adovan�c��h vhodnou volbou znam�a napo�n� z�hu.
90
91\section{Pou�it��c�lgoritmy}
92V tomto odd� jsou pops� ��lgoritmy, kter�udou posl� porovn� p�zen�yst� \eqref{simple}. Algoritmy jsou zalo�en�a principech uveden�p�l�apitole.
93
94\subsection{Certainty equivalent}
95Aplikac�etody certainty equivalent (CE) p� o��n�tr� \eqref{bel}  v
96\begin{equation}
97V_t(\eta_t,\beta_t)=\min_{\nu_t }\left\{\hat{\eta}_{t+1}^2+V_{t+1}(\eta_{t+1},\beta_{t+1})\right\}
98\end{equation}
99St� hodnota v� je dle \eqref{eta} rovna
100\begin{equation}
101\hat{\eta}_{t+1}=\eta_t+\beta_t\nu_t,
102\end{equation}
103
104Optim���c��h bude tedy pro ka�d�\beta_t\neq0$ roven
105\begin{equation}
106\label{cecon}
107\nu_t=-\frac{\eta_t}{\beta_t}.
108\end{equation}
109
110Pokud $\beta_t=0$, pak to dle \eqref{trab} znamen��e i $\hat{\theta}_t=0$ (to se m�t�a�liv $\theta\neq0$). Aktu����n�tr� pak nez�s�a $\nu_t$ a m� tedy volit libovoln�c��h bez vlivu na hodnotu o��n�tr�. V takov�p��ol� za ���h realizaci b�ho �umu $N(0,1)$. Jedn�e vlastn� jednoduchou aplikaci principu du�� ��opsan� rovnic�eqref{dual}.
111
112Z tvaru optim�� �� z�hu \eqref{cecon} snadno zjist�, �e CE je metodou nedu��Pokud je toti� v�syst� na po�adovan�odnot����h nebude syst�vychylovat za �m lep��dentifikace parametru $\theta$. Nicm� d� tomu, �e m� k dispozici analytick�yj�en�\nu_t$, m��en�omoc�etody CE prov�no s minim�� v�n� n�ky. To m���er�likac� rozhoduj� v�.
113
114Aplikace metody CE v podob��c� z�hu \eqref{cecon} je zjevn�evhodn�ro mal�odnoty  $\beta_t$. Metoda bude toti� generovat, p� velk��c��hy bez ohledu na mo�nou p�nost neur�osti. Konkr���ky budou prezentov� d�.
115
116\subsection{Opatrn��n�
117Optim���c��h je pro metodu opatrn� ��cautious control, CC) d�dle \eqref{optcon} jako
118\begin{equation}
119\label{optcon2}
120\nu_t=-\frac{\eta_t\beta_t}{1+\beta_t^2}.
121\end{equation}
122
123Op�se poda�z�at analytick�yj�en�\nu_t$ a v� optim�� ��omoc�etody CC m��v�n velmi efektivn�
124
125V�imn� se, �e pro velk�odnoty $\beta_t$ p� optim���h pro metodu opatrn� ��eqref{optcon2} v optim���h metody CE \eqref{cecon}. Naproti tomu pro mal�odnoty $\beta_t$ (tedy pro velk�odnoty neur�osti v identifikaci parametru $\theta$, viz \eqref{trab}) bude ��odstatn�onzervativn��Pro $\beta_t=0$ (to odpov� $\hat{\theta}_t=0$) pak bude $\nu_t=0$ a regul�r tedy nebude poskytovat ���ktivn��n�
126
127\subsection{Klasick�tup k dynamick� programov�}
128V �nku \cite{astrom1986dual} je probl���yst� \eqref{simple} � pomoc��aplikace numerick�tod na ��lohy dynamick� programovan�Jde o sch� popsan� sekci \ref{idp}. Prostor hyperstav� diskretizov�do m� 64x64. Pro ka�d�hyperstavu se napo�ala o��n�tr�, mimo body m� se pou�ila kubick�nterpolace. K numerick�ntegraci byla pou�ita klasick�impsonova metoda. K nalezen�inima se pak pou�ila jednoduch�etoda, p�� se ka�d�emi body na m� prolo�ila parabola, nalezlo jej�inimum a to se pak testovalo, zdali je glob��minimem o��n�tr�.
129
130Optim���n�a v��� bylo nakonec parametrizov� analytickou formul�varu
131\begin{equation}
132\label{ast}
133\nu_t=-\frac{0,56+\beta_t}{2,2+0,08\beta_t+\beta_t^2}\eta_t-\frac{1,9}{1,7+\beta_t^4}.
134\end{equation}
135Auto��j��e analytick�proximace zp�la zv�ve ztr�v�unkci o m� ne� 1 \%.
136
137Prvn�len v \eqref{ast} m� interpretovat jako modifikovan�patrn��n�druh� pak jako bud� slo�ku ��
138
139\subsection{SIDP}
140Dle popisu (a n�edn�ransformace) syst� \eqref{simple} je pro v� optim��trategie pomoc�lgoritmu SIDP nutn�iskretizovat �t dvoudimenzion�� prostoru nez�sle prom��_t=(\eta_t,\beta_t)$. Jak bylo v���, optim���c��hy sta�napo�t pro kladn�odnoty $(\eta_t,\beta_t)$.
141
142V pr� \cite{thompson2005stochastic}, kde je metoda SIDP navr�ena, je pro diskretizaci prostoru pou�ita oblast obd��v� tvaru. Kolem vygenerovan�d�vytvo�jmen��bd�� kter�huje v�echny vygenerovan�ody. Metodu k jeho ur���li auto� \cite{bh-eamvb-01}. Nicm� p�u�it�� metody nen�aru�o, �e �t takto vygenerovan� obd�� nebude obsahovat i z�rn�odnoty $(\eta_t,\beta_t)$, viz obr�k \ref{box}.
143
144\begin{figure}
145\centering
146\includegraphics[width=0.25\textwidth]{box}
147\caption{Oblast ur�� diskretizaci $H_t$ pomoc�ejmen�� obd�� -- body uvnit�cn�rientovan� obd�� nemus�pl�t po�adavek na nez�rnost}
148\label{box}
149\end{figure}
150
151V t� pr� se proto vol�dli�n�etoda. K diskretizaci zasa�en��i prostoru se vol�p�oblast obd��v� tvaru. Ta se ur�n�eduj�  jednoduchou metodou (matici obsahuj� v�echny vygenerovan�ody ozna� $A=(x_1,x_2,\ldots,x_N) \in \mathbb{R}_+^{2,N}$)
152\begin{itemize}
153\item spo�u se vlastn��a a vektory kovarian� matice $AA'$ 
154\item vlastn�ektory ur��m�hran kv�u, jejich d�a je $4\sqrt{\lambda_i}/N$
155\item za st�bd�� se zvol���t�no�iny $\left\{x_1,x_2,\ldots,x_N\right\}$.
156\end{itemize}
157Pokud �t obd�� obsahuje z�rn�odnoty $(\eta_t,\beta_t)$, vezme se vhodn�ato�� zmen�en���. To se provede iterativn�kdy v ka�d�teraci se p��bd��nato�o 5
158a zmen�� 5 \%. V iterac� se pokra�e, dokud nen�pln� podm�a na nez�rn�odnoty $(\eta_t,\beta_t)$ uvnit���. Mo�nou situaci ilustruje obr�k \ref{box1}
159
160\begin{figure}
161\centering
162\includegraphics[width=0.25\textwidth]{box1}
163\caption{Oblast ur�� diskretizaci $H_t$ pomoc�de pou�it�etody -- v p��ot�se napo�n�ln�vhodn�men�� nato�
164\label{box1}
165\end{figure}
166
167Implementace dal�� �t�lgoritmu byla provedena v souladu s odd�m \ref{sidp}. Konkr��astaven�arametr�oritmu zachycuje tabulka \ref{par2}. V� za dan�rametr�al v �h minut.
168
169\begin{table}
170\begin{tabular}{|l|ll|}
171\hline
172po� opakov� algoritmu & $n_{pass}$ & 4\\
173po� iterac�lgoritmu & $n_{iter}$ & 8\\
174po� bod�iskretizaci ka�d�imenze $H_t$ & $n_g$ & 10\\
175apriorn��c�trategie & $\mu_{0:N-1}$ & $0$\\
176po� kadnid� na zm�  �� z�hu & $m$ & 7\\
177po�e� rozsah pro hled� optim�� �� z�hu & $\beta^{in}$ & 1\\
178parametr pro redukci $\beta^{in}$ p�akov� algoritmu &$\gamma$ & 0,9\\
179parametr pro redukci $\beta^{in}$ p�erov� algoritmu  & $\lambda$ & 0,5\\
180po� realizac�ro odhad metodou Monte Carlo & $n$ & 20\\\hline
181\end{tabular}
182\caption{Konkr��olba parametr�oritmu SIDP}
183\label{par2}
184\end{table}
185
186\section{Srovn� jednotliv��up� t� sekci jsou porovn� popsan�lgoritmy p�zen�yst� \eqref{simple}. Syst�je mo�n� p��ot�vhodn�osunou �p�lovat, nen�edy pot�uva�ovat jin�odnoty referen�ho sign� a po�e�ho v�. Kvalitu v�� ��osuzujeme z hlediska celkov�tr� vygenerovan�od�horizontu d�y $N$.
187
188O��n�ledek bylo, �e v p��elk�o�e� neznalosti syst� bude du���n��an�omoc�IDP v�j��proti nedu��metod� Ty zde zastupuje metoda certainty equivalent (CE) a metoda Cautious control (CC). Pro srovn� je uveden v�k z�an�ick�erick�stupem k dynamick� programov� (DP) p�t�ite{astrom1986dual}. Jak vypl�tvaru \eqref{ast}, jedn�e o du��etodu.
189
190O�� se, �e v�y z�an�omoc�lasick� DP budou srovnateln� v�y z�an�todou SIDP. Nicm� jak bylo prov�no v �nku \cite{thompson2005stochastic}, srovnateln��y d� SIDP ji� p�setinov�v�n��e. To je zp�no t� �e se p�u�it�etody SIDP diskretizuje jen ta �t hyperstavu, kter�e nezbytn� dal��teraci algoritmu. Pro efektivn�iskretizaci tedy sta�v� m� bod� v�� publikovan�pr� \cite{thompson2005stochastic} to bylo 64x64 bod� metodu DP, zat�o pro SIDP jen 20x20).
191
192\subsection{Kvantitativn�rovn�}
193�zen�ylo testov� vzhledem k r� hodnot�po�e�ho odhadu $\theta$, tedy k r� hodnot�$(\hat{\theta}_0,P_0)$. �d� horizont byl v prvn��i experiment�len jako $N_1=5$, v druh�N_2=10$. Ka�d�imulace byla opakov� 1000x, uveden�odnoty celkov�tr� jsou pr�m p�ednotliv�ealizace.
194
195Pro ka�d�ednotliv�pakov� simulace byla skute� hodnota parametru $\theta$ pro po�e� hodnoty $(\hat{\theta}_0,P_0)$ zvolena jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(\hat{\theta}_0,P_0)$. Pro takto vygenerovanou hodnotu $\theta$ byly postupn�plikov� v�psan��c�lgoritmy. Pro sn�n�livu n�dnosti p�rovn� kvality ��yly v�echny realizace �umu (v r�i jednoho opakov� simulace) v pr� ��ednotliv�goritmy voleny stejn�
196
197Na obr�u \ref{5} jsou zachyceny v�y pro d�u �� horizontu $N=5$, po�e� hodnoty rozptylu $P_0=1$ a $P_0=10$ a r�hodnoty $\hat{\theta}_0$, konkr��ro hodnoty $\{0,1,10\}$.
198
199Prvn�ozorovateln�edek pro p� $P_0=1$ je, �e metoda CE poskytuje v pr� pou�iteln��n�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. V ostatn� p�ech je ��iln��sl�a apriorn�nformaci a n�dn�alizac� �umu a v pr� je takov�e�en�epou�iteln�
200
201Jak ji� bylo zd�� v�etoda CC d� pro nulov�d na st� hodnotu, tedy pro $\hat{\theta}_t=0$, nulov��n�Ztr� p�zen� apriorn�nformac�(0,P_0)$ je tedy d� absenci ��vlivn� pouze konkr�� realizacemi �umu. Oproti tomu p�nulov�priorn�nformaci $\hat{\theta}_0$ dosahovalo ��omoc�C pr��ejmen��tr�.
202
203Ob�u��etody (SIDP a DP) poskytuj� pr� dobr��n�ro v�echny testovan�ombinace $(\hat{\theta}_0,P_0)$. V p��elk�eur�osti po�e� identifikace $\theta$ (p� $P_0=10$) maj�egul�ry srovnateln��y.  Pro del��orizont $N=10$ a p�j��priorn�nformaci $P_0=1$ dosahovala metoda SIDP hor�� v��li nep�stem zp�n�kretizac�
204
205\begin{figure}
206\centering
207\begin{minipage}[c]{0.49\textwidth}
208\centering
209\includegraphics[width=\textwidth]{N=5,P=1}
210\end{minipage}
211\begin{minipage}[c]{0.49\textwidth}
212\centering
213\includegraphics[width=\textwidth]{N=5,P=10}
214\end{minipage}
215\caption{V�y simulace pro d�u horizontu $N=5$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$}
216\label{5}
217\end{figure}
218
219\begin{figure}
220\centering
221\begin{minipage}[c]{0.49\textwidth}
222\centering
223\includegraphics[width=\textwidth]{N=10,P=1}
224\end{minipage}
225\begin{minipage}[c]{0.49\textwidth}
226\centering
227\includegraphics[width=\textwidth]{N=10,P=10}
228\end{minipage}
229\caption{V�y simulace pro d�u horizontu $N=10$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$}
230\label{10}
231\end{figure}
232
233\subsection{Kvalitativn�rovn�}
234Nastaven�imulace je stejn�ako v p��vantitativn� srovn�. Horizont je ve v�ech p�ech volen $N=5$, pro hodnotu $N=10$ byl v�k obdobn�
235Dvojice obr��f{1} zachycuje v�y ��etodou certainty equivalent p�dnotliv�mulac� pro r�kombinace $(\hat{\theta}_0,P_0)$. Uveden�istogramy ukazuj��e a�e v n�er��dech poda�pomoc�etody CE navrhnout ��trategii s celkov��ou ztr�u, ve v�in���o ��e�n� vedlo k vysok�tr�. Jak ji� bylo zm�no v�� tvo��dy, kdy  je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Tehdy je pou�it�etody CE vhodn�
236
237\begin{figure}
238\centering
239\begin{minipage}[c]{0.49\textwidth}
240\centering
241\includegraphics[width=\textwidth]{CE4}
242\end{minipage}
243\begin{minipage}[c]{0.49\textwidth}
244\centering
245\includegraphics[width=\textwidth]{CE6}
246\end{minipage}
247\caption{V�y jednotliv�mulac��zen�etodou certainty equivalent}
248\label{1}
249\end{figure}
250
251Na obr�� \ref{2} jsou v�y pro metodou cautious control. Oproti metod�E m� pozorovat absenci v� �patn� ��Pro $\hat{\theta}_0=0$ je ��ulov� v��tr�
252tak z�s�ouze na konkr�� realizac� �umu. Oproti tomu p�hat{\theta}_0=10$ je ��elmi kvalitn� pro vysok�te� rozptyl $P_0$.
253
254\begin{figure}
255\centering
256\begin{minipage}[c]{0.49\textwidth}
257\centering
258\includegraphics[width=\textwidth]{CC4}
259\end{minipage}
260\begin{minipage}[c]{0.49\textwidth}
261\centering
262\includegraphics[width=\textwidth]{CC6}
263\end{minipage}
264\caption{V�y jednotliv�mulac��zen�etodou cautious control}
265\label{2}
266\end{figure}
267
268V�y pro jednotliv�imulace p�zen�etodou SIDP jsou na obr�u \ref{3}. Hlavn�ozd�oproti   metod�E je, stejn�ako v p��C,  odbour� tot�� selh� ��Charakteristick�em obou histogram���a spektra dosa�en�r� To je zp�no opatrnost��vrhu �� z�h�edy i pomalej��dentifikac�arametru $\theta$. Naproti tomu je v mnoha p�ech dosa�eno ztr�, kter�e vy���e� p�u�it��n�omoc�E a CC. Algoritmus SIDP tedy d� v pr� dobr��y d� robustnosti v�� �patn� ��
269
270\begin{figure}
271\centering
272\begin{minipage}[c]{0.49\textwidth}
273\centering
274\includegraphics[width=\textwidth]{SIDP4}
275\end{minipage}
276\begin{minipage}[c]{0.49\textwidth}
277\centering
278\includegraphics[width=\textwidth]{SIDP6}
279\end{minipage}
280\caption{V�y jednotliv�mulac��zen�etodou SIDP}
281\label{3}
282\end{figure}
283
284Histogramy pro metodu klasick� numerick� p�pu k ��P zobrazuje \ref{4}. A�liv kvantitativn�ych� ��omoc�IDP a DP velmi podobn�p�alitativn�porovn� pomoc�istogram�m� v�imnout, �e ��etodou DP �t� nab����elkov�tr� ne� SIDP, ale rovn�i �t� selh� a dosahuje tak vysok�tr�.
285
286\begin{figure}
287\centering
288\begin{minipage}[c]{0.49\textwidth}
289\centering
290\includegraphics[width=\textwidth]{DP4}
291\end{minipage}
292\begin{minipage}[c]{0.49\textwidth}
293\centering
294\includegraphics[width=\textwidth]{DP6}
295\end{minipage}
296\caption{V�y jednotliv�mulac��zen�etodou DP}
297\label{4}
298\end{figure}
299
300\subsection{Porovn� robustnosti}
301Kvalitu v�� ��vliv� p�st apriorn�nformace o nezn�m parametru $\theta$, kter�e pro syst�\eqref{simple} reprezentov� veli�ou $(\hat{\theta}_0,P_0)$. N�eduj� simulace dokumentuje �nost �� algoritm����e apriorn�nformace p� neodpov� skute�sti.
302
303Pro tyto � byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(1,10)$. Robustnost pak byla testov� vzhledem k r�po�e� informaci o st� hodnot�\hat{\theta}_0$ nezn�ho parametru $\theta$. Rozptyl byl ve v�ech simulac� polo�en $P_0=10$. V�y zachycuje obr�k \ref{rob}. Ka�d�imulace byla opakov� 1000x, uveden  je pr�p�ednotliv�ealizace. Metoda CE nen� ohledem k p�oz�v�� srovn� zahrnuta.
304
305Pozorovan�ledkem je p���dobr�dolnost metody SIDP v�patn�priorn�nformaci $\hat{\theta}_0$. V���n��an�outo metodou dosahovalo dobr�tr� i v p��kdy byla apriorn�nformace naprosto nepou�iteln�$\hat{\theta}_0=-10$). Ostatn��c�lgoritmy (zejm� pak DP) dos�y v tomto p��ysok�r��tr�.
306
307\begin{figure}
308\centering
309\includegraphics[width=0.5\textwidth]{rob}
310\caption{Porovn� robustnosti navr�en��c�trategie vzhledem k nep�sti apriorn�nformace $\hat{\theta}_0$}
311\label{rob}
312\end{figure}
313
314\subsection{�sov���st SIDP}
315Pro nedu��etody CE a CC je k dispozici analytick� ��trategie, v� m��y prov�n prakticky v re���e. Strategie z�an�lgoritmem DP (p�ta z \cite{astrom1986dual}) m�ovn�analytick�. Jej�� trval (dle v��te{thompson2005stochastic}) p��n�esetkr�d�, oproti pou�it�IDP za obdr�en�rovnateln�sledk�
316Tento odd�ilustruje n��st v� ��trategie pomoc�lgoritmu SIDP v z�slosti na d�e �� horizontu a jemnosti diskretizace. V�m algoritmu je tabulka vypo�n�d�ch z�h�ednotliv�dech diskretizace. Samotn��n�e prov� vyhled�n�v t� struktu�ro konkr��od hyperstavu $H_t$ se v tabulce vyhled�ejbli���apo�n�odnota a p� se ���h, kter��edn�ou�ije. Jsou-li tedy p��n�abulky k dispozici, ���rob�t prakticky v re���e, z�s�ouze na efektivit�yhled�n� p��n�truktu��u�it�etody SIDP je �ov��� f� p�vy tabulek, pomoc�ich� se posl� ��rov�. Diskutov� je tedy tato �t algoritmu.
317
318V jednotliv�mulac�, kter�� prov�t v�n��ky metody SIDP, byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(0,10)$. Tomu odpov�la rovn�apriorn�nformace $(\hat{\theta}_0,P_0)=(0,10)$. Doba v� byla zkoum� v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace  $n_{g}$ (tj. po� bod�iskretizaci ka�d�imenze hyperstavu $H_t$). Ostatn�arametry z�y shodn� nastaven�v tabulce \ref{par2}.
319
320Obdr�en��y zachycuje tabulka \ref{hor}. Pro srovn� je rovn�uvedena ztr�, kter�akto navr�en��n�os�o. Jedn�e op�o pr�z tis� opakov�.
321
322\begin{table}
323\centering
324\begin{tabular}{|c|c|c|c|}
325\hline
326$N$ & $n_{g}$ & $\bar{J}$ & $t$ $[s]$\\ \hline
3275  & 5& 3,11 & 23\\
3285 & 10& 3,06 & 76\\
3295 & 15& 3,01 & 180\\ \hline
33010& 5& 4,67 & 124\\
33110&10& 4,05 & 432\\
33210&15& 3,91 & 1032\\ \hline
33315& 5& 5,60 & 294\\
33415&10& 5,12 & 1284\\
33515&15& 5,06 & 2808\\ \hline
336\end{tabular}
337\caption{V�n�as $t$ algoritmu SIDP v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace $n_g$, $\bar{J}$ je pr��tr�}
338\label{hor}
339\end{table}
340
341Dosa�en��y ukazuj��e i pro del���c�orizonty lze k n�hu pou��metodu SIDP. V�n�oba v�ak metodu z� limituje pro v� del��asov�orizonty. Jemnost diskretizace ovliv�la pr�ou ztr� vzhledem k u�et�u v�n� �u relativn��. Obzvl��ro kr��v�zont ($N=5$) byla kvalita v�� ��rovnateln� pro velmi hrubou diskretizaci (sta�o pouze 5x5 bod�
342\subsection{Shrnut���ulace}
343Dle proveden�mulac�ych� p�zen�yst� \eqref{simple} s nenulovou po�e� informac� st� hodnot�\theta$ nejl� nedu��etoda cautious control (CC). Dle kvantitativn� srovn� dosahovala v tomto p��r��ejni���tr� a kvalitativn�orovn� pak prok�lo jeho robustnost. Nicm� regul�r navr�en�c�etody CC nen�ou�iteln��d�\hat{\theta}_0=0$, nebo� tehdy poskytuje pouze nulov��n�
344
345Du��etody (numerick�e�en�P p�t� \cite{astrom1986dual} a SIDP) dok�ly navrhnout �n��n�ro libovoln�odnoty parametr�\hat{\theta}_0,P_0)$. Ob�mi�n�etody pak dosahovaly v p��elk�o�e� neznalosti ($P_0=10$)  kvantitativn�rovnateln�sledk�razn��ozd�byl pro rozptyl $P_0=1$. Tehdy si vedla l� metoda DP.
346
347Metoda SIDP se uk�la jako robustn��naproti tomu v�ak �t� dosahovala m��y���tr� ne� DP. Chov� obou du�� metod tak vych� pr��elmi podobn�Nutno v�ak p�enout v�k z \cite{thompson2005stochastic}, �e SIDP dosahuje srovnateln� v�u s DP ji� p�ruba desetinov�v�n��e.
348
349Metoda certainty equivalent (CE) se uk�la pou�iteln�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Podle kvalitativn� zkoum� to bylo zp�no t� �e v mnoha p�ech, ztr� v�  p��a rozumnou mez. P� se ob� i touto metodou poda�navrhnout kvalitn��n�
350
351Anal�po�n���sti algoritmu SIDP uk�la, �e pro komplexn��lohy by p�ala v �  pouze v p��r��sov�rizont�ep� jemn�iskretizace. Jako vhodn�e tedy jev�ou�it�etody SIDP v kombinaci s n�kou v�n�fektivn�etodou, nap�d CC. V p��patn�dentifikace syst� by se pou�ilo ��avr�en�omoc�IDP a jakmile by znalost syst� p��a jistou zvolenou mez, k ��y se pou�ila nedu��etoda. V takov�p��y toti� sta�o metodou SIDP � jen na kr���ov�horizontu, konkr��e� by bylo dosa�eno dostate� znalosti syst�. D� by se ji� �o v�n�fektivn�etodou.
Note: See TracBrowser for help on using the browser.