1 | V t� kapitole je pops�jednoduch�� na kter�jsou porovn� ��lgoritmy zalo�en�a principech uveden�p�l�apitole. �d� algoritmy byly implementov� v prost�\emph{Matlab}. |
---|
2 | |
---|
3 | \section{Integr�r s nezn�m ziskem} |
---|
4 | Syst�zvan�gr�r s nezn�m ziskem, byl podrobn�koum�v \cite{astrom1986dual}. Pro srovn� uv�me tam���y. |
---|
5 | |
---|
6 | \subsection{Popis syst�} |
---|
7 | V�syst� je pops�jako |
---|
8 | \begin{gather} |
---|
9 | \label{simple} |
---|
10 | y_{t+1}=y_t+\theta u_t+v_{t+1}, \qquad t=0,\ldots,N-1,\\ |
---|
11 | v_{t+1}\sim N(0,\sigma^2), |
---|
12 | \end{gather} |
---|
13 | kde $\theta\neq0$ je nezn� parametr a rozptyl �umu $\sigma^2=0,1$. Po�e� hodnota v� je nastavena na $y_0=1$. |
---|
14 | |
---|
15 | O nezn�m parametru $\theta$ m� v �e $t$ informaci v podob�ostate� statistiky $T_t=(\hat{\theta}_t,P_t)$ tvo�st� hodnotou a rozptylem. P�kl�me nekorelovanost odhadu $\theta_t$ s �umem, tedy �e |
---|
16 | \begin{equation} |
---|
17 | \cov(v_{t+1},\theta_t)=0. |
---|
18 | \end{equation} |
---|
19 | |
---|
20 | Optim���n�e takov�kter�dr��� syst� na nulov�odnot�Ztr�v�unkce je kvadratick� $y_{t+1}$, �i |
---|
21 | \begin{equation} |
---|
22 | \label{glos} |
---|
23 | g(y_{1:N},u_{0:N-1})=\sum_{t=0}^{N-1}y_{t+1}^2. |
---|
24 | \end{equation} |
---|
25 | |
---|
26 | Odhadovac�rocedurou pro parametr $\theta$ je Kalman�ltr. Pro syst�\eqref{simple} m�var |
---|
27 | \begin{gather} |
---|
28 | K_t=\frac{u_tP_t}{u_t^2P_t+\sigma^2},\\ |
---|
29 | \label{kal} |
---|
30 | \hat{\theta}_{t+1}=\hat{\theta}_t+K_t(y_{t+1}-u_t\hat{\theta}_t),\\ |
---|
31 | P_{t+1}=(1-K_tu_t)P_t. |
---|
32 | \end{gather} |
---|
33 | |
---|
34 | Hyperstav syst� $H_t$ tvo�ktor $(y_t,\hat{\theta}_t,P_t)$. O��n�tr� je |
---|
35 | \begin{equation} |
---|
36 | J_t(H_t)=\min_{u_t \in U_t}\E_{y_{t+1}}\left\{y_{t+1}^2+J_{t+1}(H_{t+1})|H_t,u_t\right\}, \qquad t=0,\ldots,N-1. |
---|
37 | \end{equation} |
---|
38 | |
---|
39 | Ta po dosazen� \eqref{simple} a �te�m proveden�t� hodnoty p� na tvar |
---|
40 | \begin{gather} |
---|
41 | \label{dos} |
---|
42 | J_t(H_t)=\min_{u_t \in U_t}\left\{(y_t+\hat{\theta}_tu_t)^2+u_t^2P_t+\sigma^2+\E_{y_{t+1}}(J_{t+1}(H_{t+1}))|y_t,\hat{\theta}_t, P_t,u_t\right\}. |
---|
43 | \end{gather} |
---|
44 | |
---|
45 | \subsection{Transformace rovnic syst�} |
---|
46 | P�amotnou aplikac��k� �� algoritmu lze � vhodnou transformac�rom��ednodu�it. Dle \cite{astrom1986dual} je takovou transformac��d od popisu pomoc�$(y_t,\hat{\theta}_t,P_t,u_t)$ k prom��eta_t,\beta_t,\zeta_t,\nu_t)$ dle vztah�egin{gather} |
---|
47 | \eta_t=\frac{y_t}{\sigma}, \\ |
---|
48 | \label{trab} |
---|
49 | \beta_t=\frac{\hat{\theta}_t}{\sqrt{P_t}}, \\ |
---|
50 | \zeta_t=\frac{1}{\sqrt{P_t}}, \\ |
---|
51 | \nu_t=\frac{u_t\sqrt{P_t}}{\sigma}. |
---|
52 | \end{gather} |
---|
53 | |
---|
54 | Sou�n�� neur�ost ve v� \eqref{simple} reprezentovat jedinou normalizovanou n�dnou veli�ou |
---|
55 | \begin{equation} |
---|
56 | s_t=\frac{y_{t+1}-y_t+\hat{\theta}_tu_t}{\sqrt{u_t^2P_t+\sigma^2}} \sim N(0,1). |
---|
57 | \end{equation} |
---|
58 | |
---|
59 | Rovnice pro v�\eqref{simple} a n�eduj� odhad nezn�ho parametru \eqref{kal} tak p� v |
---|
60 | \begin{gather} |
---|
61 | \label{eta} |
---|
62 | \eta_{t+1}=\eta_t+\beta_t\nu_t+\sqrt{1+\nu_t^2}s_t,\\ |
---|
63 | \label{beta} |
---|
64 | \beta_{t+1}=\sqrt{1+\nu_t^2}\beta_t+\nu_ts_t. |
---|
65 | \end{gather} |
---|
66 | |
---|
67 | P�me-li k vhodn�praven���n�tr�, dostaneme |
---|
68 | \begin{align} |
---|
69 | \label{bel} |
---|
70 | V_t(\eta_t,\beta_t,\zeta_t)&=\frac{J_t(y_t,\hat{\theta}_t,P_t)}{\sigma^2}\\ |
---|
71 | &=\min_{\nu_t }\left\{(\eta_t+\beta_t\nu_t)^2+\nu_t^2+1+\E_{s_t}(V_{t+1}(\eta_{t+1},\beta_{t+1},\zeta_{t+1}))\right\}. |
---|
72 | \end{align} |
---|
73 | |
---|
74 | Nyn�po�me o��nou ztr� pro $N-1$ jako |
---|
75 | \begin{equation} |
---|
76 | V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})=\min_{\nu_{N-1}}\left\{(\eta_{N-1}+\beta_{N-1}\nu_{N-1})^2+\nu_{N-1}^2+1\right\}. |
---|
77 | \end{equation} |
---|
78 | |
---|
79 | Pomoc�iferenci�� po� pak z�� optim���h ve tvaru |
---|
80 | \begin{equation} |
---|
81 | \label{optcon} |
---|
82 | \nu_{N-1}=-\frac{\eta_{N-1}\beta_{N-1}}{1+\beta_{N-1}^2} |
---|
83 | \end{equation} |
---|
84 | a o��nou ztr� rovnu |
---|
85 | \begin{equation} |
---|
86 | V_{N-1}(\eta_{N-1},\beta_{N-1},\zeta_{N-1})= \frac{\eta_{N-1}^2+1}{\beta_{N-1}^2+1}. |
---|
87 | \end{equation} |
---|
88 | |
---|
89 | Proto�e optim���h $\nu_{N-1}$ ani o��n�tr� $V_{N-1}$ nez�s�a $\zeta_{N-1}$, d� tvaru $V_t$ nebude rovn�optim���h $\nu_t$ a o��n�tr� $V_t$ z�set na $\zeta_t$. K nalezen�ptim�� ��edy sta�v ka�d��e $t$ uva�ovat pouze dvourozm��rstav $H_t=(\eta_t,\beta_t)$. Nav�m� bez �na obecnosti po�at optim���h pouze pro kladn�odnoty $\eta_t$ a $\beta_t$. Optim���n�edy napo�me pouze pro kladn�odnoty $y_t$ a $\theta_t$. Pro ostatn�o�nosti pak d� tvaru \eqref{simple} dostaneme po�adovan�c��h vhodnou volbou znam�a napo�n� z�hu. |
---|
90 | |
---|
91 | \section{Pou�it��c�lgoritmy} |
---|
92 | V tomto odd� jsou pops� ��lgoritmy, kter�udou posl� porovn� p�zen�yst� \eqref{simple}. Algoritmy jsou zalo�en�a principech uveden�p�l�apitole. |
---|
93 | |
---|
94 | \subsection{Certainty equivalent} |
---|
95 | Aplikac�etody certainty equivalent (CE) p� o��n�tr� \eqref{bel} v |
---|
96 | \begin{equation} |
---|
97 | V_t(\eta_t,\beta_t)=\min_{\nu_t }\left\{\hat{\eta}_{t+1}^2+V_{t+1}(\eta_{t+1},\beta_{t+1})\right\} |
---|
98 | \end{equation} |
---|
99 | St� hodnota v� je dle \eqref{eta} rovna |
---|
100 | \begin{equation} |
---|
101 | \hat{\eta}_{t+1}=\eta_t+\beta_t\nu_t, |
---|
102 | \end{equation} |
---|
103 | |
---|
104 | Optim���c��h bude tedy pro ka�d�\beta_t\neq0$ roven |
---|
105 | \begin{equation} |
---|
106 | \label{cecon} |
---|
107 | \nu_t=-\frac{\eta_t}{\beta_t}. |
---|
108 | \end{equation} |
---|
109 | |
---|
110 | Pokud $\beta_t=0$, pak to dle \eqref{trab} znamen��e i $\hat{\theta}_t=0$ (to se m�t�a�liv $\theta\neq0$). Aktu����n�tr� pak nez�s�a $\nu_t$ a m� tedy volit libovoln�c��h bez vlivu na hodnotu o��n�tr�. V takov�p��ol� za ���h realizaci b�ho �umu $N(0,1)$. Jedn�e vlastn� jednoduchou aplikaci principu du�� ��opsan� rovnic�eqref{dual}. |
---|
111 | |
---|
112 | Z tvaru optim�� �� z�hu \eqref{cecon} snadno zjist�, �e CE je metodou nedu��Pokud je toti� v�syst� na po�adovan�odnot����h nebude syst�vychylovat za �m lep��dentifikace parametru $\theta$. Nicm� d� tomu, �e m� k dispozici analytick�yj�en�\nu_t$, m��en�omoc�etody CE prov�no s minim�� v�n� n�ky. To m���er�likac� rozhoduj� v�. |
---|
113 | |
---|
114 | Aplikace metody CE v podob��c� z�hu \eqref{cecon} je zjevn�evhodn�ro mal�odnoty $\beta_t$. Metoda bude toti� generovat, p� velk��c��hy bez ohledu na mo�nou p�nost neur�osti. Konkr���ky budou prezentov� d�. |
---|
115 | |
---|
116 | \subsection{Opatrn��n� |
---|
117 | Optim���c��h je pro metodu opatrn� ��cautious control, CC) d�dle \eqref{optcon} jako |
---|
118 | \begin{equation} |
---|
119 | \label{optcon2} |
---|
120 | \nu_t=-\frac{\eta_t\beta_t}{1+\beta_t^2}. |
---|
121 | \end{equation} |
---|
122 | |
---|
123 | Op�se poda�z�at analytick�yj�en�\nu_t$ a v� optim�� ��omoc�etody CC m��v�n velmi efektivn� |
---|
124 | |
---|
125 | V�imn� se, �e pro velk�odnoty $\beta_t$ p� optim���h pro metodu opatrn� ��eqref{optcon2} v optim���h metody CE \eqref{cecon}. Naproti tomu pro mal�odnoty $\beta_t$ (tedy pro velk�odnoty neur�osti v identifikaci parametru $\theta$, viz \eqref{trab}) bude ��odstatn�onzervativn��Pro $\beta_t=0$ (to odpov� $\hat{\theta}_t=0$) pak bude $\nu_t=0$ a regul�r tedy nebude poskytovat ���ktivn��n� |
---|
126 | |
---|
127 | \subsection{Klasick�tup k dynamick� programov�} |
---|
128 | V �nku \cite{astrom1986dual} je probl���yst� \eqref{simple} � pomoc��aplikace numerick�tod na ��lohy dynamick� programovan�Jde o sch� popsan� sekci \ref{idp}. Prostor hyperstav� diskretizov�do m� 64x64. Pro ka�d�hyperstavu se napo�ala o��n�tr�, mimo body m� se pou�ila kubick�nterpolace. K numerick�ntegraci byla pou�ita klasick�impsonova metoda. K nalezen�inima se pak pou�ila jednoduch�etoda, p�� se ka�d�emi body na m� prolo�ila parabola, nalezlo jej�inimum a to se pak testovalo, zdali je glob��minimem o��n�tr�. |
---|
129 | |
---|
130 | Optim���n�a v��� bylo nakonec parametrizov� analytickou formul�varu |
---|
131 | \begin{equation} |
---|
132 | \label{ast} |
---|
133 | \nu_t=-\frac{0,56+\beta_t}{2,2+0,08\beta_t+\beta_t^2}\eta_t-\frac{1,9}{1,7+\beta_t^4}. |
---|
134 | \end{equation} |
---|
135 | Auto��j��e analytick�proximace zp�la zv�ve ztr�v�unkci o m� ne� 1 \%. |
---|
136 | |
---|
137 | Prvn�len v \eqref{ast} m� interpretovat jako modifikovan�patrn��n�druh� pak jako bud� slo�ku �� |
---|
138 | |
---|
139 | \subsection{SIDP} |
---|
140 | Dle popisu (a n�edn�ransformace) syst� \eqref{simple} je pro v� optim��trategie pomoc�lgoritmu SIDP nutn�iskretizovat �t dvoudimenzion�� prostoru nez�sle prom��_t=(\eta_t,\beta_t)$. Jak bylo v���, optim���c��hy sta�napo�t pro kladn�odnoty $(\eta_t,\beta_t)$. |
---|
141 | |
---|
142 | V pr� \cite{thompson2005stochastic}, kde je metoda SIDP navr�ena, je pro diskretizaci prostoru pou�ita oblast obd��v� tvaru. Kolem vygenerovan�d�vytvo�jmen��bd�� kter�huje v�echny vygenerovan�ody. Metodu k jeho ur���li auto� \cite{bh-eamvb-01}. Nicm� p�u�it�� metody nen�aru�o, �e �t takto vygenerovan� obd�� nebude obsahovat i z�rn�odnoty $(\eta_t,\beta_t)$, viz obr�k \ref{box}. |
---|
143 | |
---|
144 | \begin{figure} |
---|
145 | \centering |
---|
146 | \includegraphics[width=0.25\textwidth]{box} |
---|
147 | \caption{Oblast ur�� diskretizaci $H_t$ pomoc�ejmen�� obd�� -- body uvnit�cn�rientovan� obd�� nemus�pl�t po�adavek na nez�rnost} |
---|
148 | \label{box} |
---|
149 | \end{figure} |
---|
150 | |
---|
151 | V t� pr� se proto vol�dli�n�etoda. K diskretizaci zasa�en��i prostoru se vol�p�oblast obd��v� tvaru. Ta se ur�n�eduj� jednoduchou metodou (matici obsahuj� v�echny vygenerovan�ody ozna� $A=(x_1,x_2,\ldots,x_N) \in \mathbb{R}_+^{2,N}$) |
---|
152 | \begin{itemize} |
---|
153 | \item spo�u se vlastn��a a vektory kovarian� matice $AA'$ |
---|
154 | \item vlastn�ektory ur��m�hran kv�u, jejich d�a je $4\sqrt{\lambda_i}/N$ |
---|
155 | \item za st�bd�� se zvol���t�no�iny $\left\{x_1,x_2,\ldots,x_N\right\}$. |
---|
156 | \end{itemize} |
---|
157 | Pokud �t obd�� obsahuje z�rn�odnoty $(\eta_t,\beta_t)$, vezme se vhodn�ato�� zmen�en���. To se provede iterativn�kdy v ka�d�teraci se p��bd��nato�o 5� |
---|
158 | a zmen�� 5 \%. V iterac� se pokra�e, dokud nen�pln� podm�a na nez�rn�odnoty $(\eta_t,\beta_t)$ uvnit���. Mo�nou situaci ilustruje obr�k \ref{box1} |
---|
159 | |
---|
160 | \begin{figure} |
---|
161 | \centering |
---|
162 | \includegraphics[width=0.25\textwidth]{box1} |
---|
163 | \caption{Oblast ur�� diskretizaci $H_t$ pomoc�de pou�it�etody -- v p��ot�se napo�n�ln�vhodn�men�� nato� |
---|
164 | \label{box1} |
---|
165 | \end{figure} |
---|
166 | |
---|
167 | Implementace dal�� �t�lgoritmu byla provedena v souladu s odd�m \ref{sidp}. Konkr��astaven�arametr�oritmu zachycuje tabulka \ref{par2}. V� za dan�rametr�al v �h minut. |
---|
168 | |
---|
169 | \begin{table} |
---|
170 | \begin{tabular}{|l|ll|} |
---|
171 | \hline |
---|
172 | po� opakov� algoritmu & $n_{pass}$ & 4\\ |
---|
173 | po� iterac�lgoritmu & $n_{iter}$ & 8\\ |
---|
174 | po� bod�iskretizaci ka�d�imenze $H_t$ & $n_g$ & 10\\ |
---|
175 | apriorn��c�trategie & $\mu_{0:N-1}$ & $0$\\ |
---|
176 | po� kadnid� na zm� �� z�hu & $m$ & 7\\ |
---|
177 | po�e� rozsah pro hled� optim�� �� z�hu & $\beta^{in}$ & 1\\ |
---|
178 | parametr pro redukci $\beta^{in}$ p�akov� algoritmu &$\gamma$ & 0,9\\ |
---|
179 | parametr pro redukci $\beta^{in}$ p�erov� algoritmu & $\lambda$ & 0,5\\ |
---|
180 | po� realizac�ro odhad metodou Monte Carlo & $n$ & 20\\\hline |
---|
181 | \end{tabular} |
---|
182 | \caption{Konkr��olba parametr�oritmu SIDP} |
---|
183 | \label{par2} |
---|
184 | \end{table} |
---|
185 | |
---|
186 | \section{Srovn� jednotliv��up� t� sekci jsou porovn� popsan�lgoritmy p�zen�yst� \eqref{simple}. Syst�je mo�n� p��ot�vhodn�osunou �p�lovat, nen�edy pot�uva�ovat jin�odnoty referen�ho sign� a po�e�ho v�. Kvalitu v�� ��osuzujeme z hlediska celkov�tr� vygenerovan�od�horizontu d�y $N$. |
---|
187 | |
---|
188 | O��n�ledek bylo, �e v p��elk�o�e� neznalosti syst� bude du���n��an�omoc�IDP v�j��proti nedu��metod� Ty zde zastupuje metoda certainty equivalent (CE) a metoda Cautious control (CC). Pro srovn� je uveden v�k z�an�ick�erick�stupem k dynamick� programov� (DP) p�t�ite{astrom1986dual}. Jak vypl�tvaru \eqref{ast}, jedn�e o du��etodu. |
---|
189 | |
---|
190 | O�� se, �e v�y z�an�omoc�lasick� DP budou srovnateln� v�y z�an�todou SIDP. Nicm� jak bylo prov�no v �nku \cite{thompson2005stochastic}, srovnateln��y d� SIDP ji� p�setinov�v�n��e. To je zp�no t� �e se p�u�it�etody SIDP diskretizuje jen ta �t hyperstavu, kter�e nezbytn� dal��teraci algoritmu. Pro efektivn�iskretizaci tedy sta�v� m� bod� v�� publikovan�pr� \cite{thompson2005stochastic} to bylo 64x64 bod� metodu DP, zat�o pro SIDP jen 20x20). |
---|
191 | |
---|
192 | \subsection{Kvantitativn�rovn�} |
---|
193 | �zen�ylo testov� vzhledem k r� hodnot�po�e�ho odhadu $\theta$, tedy k r� hodnot�$(\hat{\theta}_0,P_0)$. �d� horizont byl v prvn��i experiment�len jako $N_1=5$, v druh�N_2=10$. Ka�d�imulace byla opakov� 1000x, uveden�odnoty celkov�tr� jsou pr�m p�ednotliv�ealizace. |
---|
194 | |
---|
195 | Pro ka�d�ednotliv�pakov� simulace byla skute� hodnota parametru $\theta$ pro po�e� hodnoty $(\hat{\theta}_0,P_0)$ zvolena jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(\hat{\theta}_0,P_0)$. Pro takto vygenerovanou hodnotu $\theta$ byly postupn�plikov� v�psan��c�lgoritmy. Pro sn�n�livu n�dnosti p�rovn� kvality ��yly v�echny realizace �umu (v r�i jednoho opakov� simulace) v pr� ��ednotliv�goritmy voleny stejn� |
---|
196 | |
---|
197 | Na obr�u \ref{5} jsou zachyceny v�y pro d�u �� horizontu $N=5$, po�e� hodnoty rozptylu $P_0=1$ a $P_0=10$ a r�hodnoty $\hat{\theta}_0$, konkr��ro hodnoty $\{0,1,10\}$. |
---|
198 | |
---|
199 | Prvn�ozorovateln�edek pro p� $P_0=1$ je, �e metoda CE poskytuje v pr� pou�iteln��n�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. V ostatn� p�ech je ��iln��sl�a apriorn�nformaci a n�dn�alizac� �umu a v pr� je takov�e�en�epou�iteln� |
---|
200 | |
---|
201 | Jak ji� bylo zd�� v�etoda CC d� pro nulov�d na st� hodnotu, tedy pro $\hat{\theta}_t=0$, nulov��n�Ztr� p�zen� apriorn�nformac�(0,P_0)$ je tedy d� absenci ��vlivn� pouze konkr�� realizacemi �umu. Oproti tomu p�nulov�priorn�nformaci $\hat{\theta}_0$ dosahovalo ��omoc�C pr��ejmen��tr�. |
---|
202 | |
---|
203 | Ob�u��etody (SIDP a DP) poskytuj� pr� dobr��n�ro v�echny testovan�ombinace $(\hat{\theta}_0,P_0)$. V p��elk�eur�osti po�e� identifikace $\theta$ (p� $P_0=10$) maj�egul�ry srovnateln��y. Pro del��orizont $N=10$ a p�j��priorn�nformaci $P_0=1$ dosahovala metoda SIDP hor�� v��li nep�stem zp�n�kretizac� |
---|
204 | |
---|
205 | \begin{figure} |
---|
206 | \centering |
---|
207 | \begin{minipage}[c]{0.49\textwidth} |
---|
208 | \centering |
---|
209 | \includegraphics[width=\textwidth]{N=5,P=1} |
---|
210 | \end{minipage} |
---|
211 | \begin{minipage}[c]{0.49\textwidth} |
---|
212 | \centering |
---|
213 | \includegraphics[width=\textwidth]{N=5,P=10} |
---|
214 | \end{minipage} |
---|
215 | \caption{V�y simulace pro d�u horizontu $N=5$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$} |
---|
216 | \label{5} |
---|
217 | \end{figure} |
---|
218 | |
---|
219 | \begin{figure} |
---|
220 | \centering |
---|
221 | \begin{minipage}[c]{0.49\textwidth} |
---|
222 | \centering |
---|
223 | \includegraphics[width=\textwidth]{N=10,P=1} |
---|
224 | \end{minipage} |
---|
225 | \begin{minipage}[c]{0.49\textwidth} |
---|
226 | \centering |
---|
227 | \includegraphics[width=\textwidth]{N=10,P=10} |
---|
228 | \end{minipage} |
---|
229 | \caption{V�y simulace pro d�u horizontu $N=10$, rozptyl $P_0=1$ a $P_0=10$ a r�st� hodnoty $\hat{\theta}_0$} |
---|
230 | \label{10} |
---|
231 | \end{figure} |
---|
232 | |
---|
233 | \subsection{Kvalitativn�rovn�} |
---|
234 | Nastaven�imulace je stejn�ako v p��vantitativn� srovn�. Horizont je ve v�ech p�ech volen $N=5$, pro hodnotu $N=10$ byl v�k obdobn� |
---|
235 | Dvojice obr��f{1} zachycuje v�y ��etodou certainty equivalent p�dnotliv�mulac� pro r�kombinace $(\hat{\theta}_0,P_0)$. Uveden�istogramy ukazuj��e a�e v n�er��dech poda�pomoc�etody CE navrhnout ��trategii s celkov��ou ztr�u, ve v�in���o ��e�n� vedlo k vysok�tr�. Jak ji� bylo zm�no v�� tvo��dy, kdy je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Tehdy je pou�it�etody CE vhodn� |
---|
236 | |
---|
237 | \begin{figure} |
---|
238 | \centering |
---|
239 | \begin{minipage}[c]{0.49\textwidth} |
---|
240 | \centering |
---|
241 | \includegraphics[width=\textwidth]{CE4} |
---|
242 | \end{minipage} |
---|
243 | \begin{minipage}[c]{0.49\textwidth} |
---|
244 | \centering |
---|
245 | \includegraphics[width=\textwidth]{CE6} |
---|
246 | \end{minipage} |
---|
247 | \caption{V�y jednotliv�mulac��zen�etodou certainty equivalent} |
---|
248 | \label{1} |
---|
249 | \end{figure} |
---|
250 | |
---|
251 | Na obr�� \ref{2} jsou v�y pro metodou cautious control. Oproti metod�E m� pozorovat absenci v� �patn� ��Pro $\hat{\theta}_0=0$ je ��ulov� v��tr� |
---|
252 | tak z�s�ouze na konkr�� realizac� �umu. Oproti tomu p�hat{\theta}_0=10$ je ��elmi kvalitn� pro vysok�te� rozptyl $P_0$. |
---|
253 | |
---|
254 | \begin{figure} |
---|
255 | \centering |
---|
256 | \begin{minipage}[c]{0.49\textwidth} |
---|
257 | \centering |
---|
258 | \includegraphics[width=\textwidth]{CC4} |
---|
259 | \end{minipage} |
---|
260 | \begin{minipage}[c]{0.49\textwidth} |
---|
261 | \centering |
---|
262 | \includegraphics[width=\textwidth]{CC6} |
---|
263 | \end{minipage} |
---|
264 | \caption{V�y jednotliv�mulac��zen�etodou cautious control} |
---|
265 | \label{2} |
---|
266 | \end{figure} |
---|
267 | |
---|
268 | V�y pro jednotliv�imulace p�zen�etodou SIDP jsou na obr�u \ref{3}. Hlavn�ozd�oproti metod�E je, stejn�ako v p��C, odbour� tot�� selh� ��Charakteristick�em obou histogram���a spektra dosa�en�r� To je zp�no opatrnost��vrhu �� z�h�edy i pomalej��dentifikac�arametru $\theta$. Naproti tomu je v mnoha p�ech dosa�eno ztr�, kter�e vy���e� p�u�it��n�omoc�E a CC. Algoritmus SIDP tedy d� v pr� dobr��y d� robustnosti v�� �patn� �� |
---|
269 | |
---|
270 | \begin{figure} |
---|
271 | \centering |
---|
272 | \begin{minipage}[c]{0.49\textwidth} |
---|
273 | \centering |
---|
274 | \includegraphics[width=\textwidth]{SIDP4} |
---|
275 | \end{minipage} |
---|
276 | \begin{minipage}[c]{0.49\textwidth} |
---|
277 | \centering |
---|
278 | \includegraphics[width=\textwidth]{SIDP6} |
---|
279 | \end{minipage} |
---|
280 | \caption{V�y jednotliv�mulac��zen�etodou SIDP} |
---|
281 | \label{3} |
---|
282 | \end{figure} |
---|
283 | |
---|
284 | Histogramy pro metodu klasick� numerick� p�pu k ��P zobrazuje \ref{4}. A�liv kvantitativn�ych� ��omoc�IDP a DP velmi podobn�p�alitativn�porovn� pomoc�istogram�m� v�imnout, �e ��etodou DP �t� nab����elkov�tr� ne� SIDP, ale rovn�i �t� selh� a dosahuje tak vysok�tr�. |
---|
285 | |
---|
286 | \begin{figure} |
---|
287 | \centering |
---|
288 | \begin{minipage}[c]{0.49\textwidth} |
---|
289 | \centering |
---|
290 | \includegraphics[width=\textwidth]{DP4} |
---|
291 | \end{minipage} |
---|
292 | \begin{minipage}[c]{0.49\textwidth} |
---|
293 | \centering |
---|
294 | \includegraphics[width=\textwidth]{DP6} |
---|
295 | \end{minipage} |
---|
296 | \caption{V�y jednotliv�mulac��zen�etodou DP} |
---|
297 | \label{4} |
---|
298 | \end{figure} |
---|
299 | |
---|
300 | \subsection{Porovn� robustnosti} |
---|
301 | Kvalitu v�� ��vliv� p�st apriorn�nformace o nezn�m parametru $\theta$, kter�e pro syst�\eqref{simple} reprezentov� veli�ou $(\hat{\theta}_0,P_0)$. N�eduj� simulace dokumentuje �nost �� algoritm����e apriorn�nformace p� neodpov� skute�sti. |
---|
302 | |
---|
303 | Pro tyto � byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(1,10)$. Robustnost pak byla testov� vzhledem k r�po�e� informaci o st� hodnot�\hat{\theta}_0$ nezn�ho parametru $\theta$. Rozptyl byl ve v�ech simulac� polo�en $P_0=10$. V�y zachycuje obr�k \ref{rob}. Ka�d�imulace byla opakov� 1000x, uveden je pr�p�ednotliv�ealizace. Metoda CE nen� ohledem k p�oz�v�� srovn� zahrnuta. |
---|
304 | |
---|
305 | Pozorovan�ledkem je p���dobr�dolnost metody SIDP v�patn�priorn�nformaci $\hat{\theta}_0$. V���n��an�outo metodou dosahovalo dobr�tr� i v p��kdy byla apriorn�nformace naprosto nepou�iteln�$\hat{\theta}_0=-10$). Ostatn��c�lgoritmy (zejm� pak DP) dos�y v tomto p��ysok�r��tr�. |
---|
306 | |
---|
307 | \begin{figure} |
---|
308 | \centering |
---|
309 | \includegraphics[width=0.5\textwidth]{rob} |
---|
310 | \caption{Porovn� robustnosti navr�en��c�trategie vzhledem k nep�sti apriorn�nformace $\hat{\theta}_0$} |
---|
311 | \label{rob} |
---|
312 | \end{figure} |
---|
313 | |
---|
314 | \subsection{�sov���st SIDP} |
---|
315 | Pro nedu��etody CE a CC je k dispozici analytick� ��trategie, v� m��y prov�n prakticky v re���e. Strategie z�an�lgoritmem DP (p�ta z \cite{astrom1986dual}) m�ovn�analytick�. Jej�� trval (dle v��te{thompson2005stochastic}) p��n�esetkr�d�, oproti pou�it�IDP za obdr�en�rovnateln�sledk� |
---|
316 | Tento odd�ilustruje n��st v� ��trategie pomoc�lgoritmu SIDP v z�slosti na d�e �� horizontu a jemnosti diskretizace. V�m algoritmu je tabulka vypo�n�d�ch z�h�ednotliv�dech diskretizace. Samotn��n�e prov� vyhled�n�v t� struktu�ro konkr��od hyperstavu $H_t$ se v tabulce vyhled�ejbli���apo�n�odnota a p� se ���h, kter��edn�ou�ije. Jsou-li tedy p��n�abulky k dispozici, ���rob�t prakticky v re���e, z�s�ouze na efektivit�yhled�n� p��n�truktu��u�it�etody SIDP je �ov��� f� p�vy tabulek, pomoc�ich� se posl� ��rov�. Diskutov� je tedy tato �t algoritmu. |
---|
317 | |
---|
318 | V jednotliv�mulac�, kter�� prov�t v�n��ky metody SIDP, byl parametr $\theta$ volen jako prvn�enulov�ealizace n�dn�eli�y s rozd�n�$N(0,10)$. Tomu odpov�la rovn�apriorn�nformace $(\hat{\theta}_0,P_0)=(0,10)$. Doba v� byla zkoum� v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace $n_{g}$ (tj. po� bod�iskretizaci ka�d�imenze hyperstavu $H_t$). Ostatn�arametry z�y shodn� nastaven�v tabulce \ref{par2}. |
---|
319 | |
---|
320 | Obdr�en��y zachycuje tabulka \ref{hor}. Pro srovn� je rovn�uvedena ztr�, kter�akto navr�en��n�os�o. Jedn�e op�o pr�z tis� opakov�. |
---|
321 | |
---|
322 | \begin{table} |
---|
323 | \centering |
---|
324 | \begin{tabular}{|c|c|c|c|} |
---|
325 | \hline |
---|
326 | $N$ & $n_{g}$ & $\bar{J}$ & $t$ $[s]$\\ \hline |
---|
327 | 5 & 5& 3,11 & 23\\ |
---|
328 | 5 & 10& 3,06 & 76\\ |
---|
329 | 5 & 15& 3,01 & 180\\ \hline |
---|
330 | 10& 5& 4,67 & 124\\ |
---|
331 | 10&10& 4,05 & 432\\ |
---|
332 | 10&15& 3,91 & 1032\\ \hline |
---|
333 | 15& 5& 5,60 & 294\\ |
---|
334 | 15&10& 5,12 & 1284\\ |
---|
335 | 15&15& 5,06 & 2808\\ \hline |
---|
336 | \end{tabular} |
---|
337 | \caption{V�n�as $t$ algoritmu SIDP v z�slosti na d�e �� horizontu $N$ a jemnosti diskretizace $n_g$, $\bar{J}$ je pr��tr�} |
---|
338 | \label{hor} |
---|
339 | \end{table} |
---|
340 | |
---|
341 | Dosa�en��y ukazuj��e i pro del���c�orizonty lze k n�hu pou��metodu SIDP. V�n�oba v�ak metodu z� limituje pro v� del��asov�orizonty. Jemnost diskretizace ovliv�la pr�ou ztr� vzhledem k u�et�u v�n� �u relativn��. Obzvl��ro kr��v�zont ($N=5$) byla kvalita v�� ��rovnateln� pro velmi hrubou diskretizaci (sta�o pouze 5x5 bod� |
---|
342 | \subsection{Shrnut���ulace} |
---|
343 | Dle proveden�mulac�ych� p�zen�yst� \eqref{simple} s nenulovou po�e� informac� st� hodnot�\theta$ nejl� nedu��etoda cautious control (CC). Dle kvantitativn� srovn� dosahovala v tomto p��r��ejni���tr� a kvalitativn�orovn� pak prok�lo jeho robustnost. Nicm� regul�r navr�en�c�etody CC nen�ou�iteln��d�\hat{\theta}_0=0$, nebo� tehdy poskytuje pouze nulov��n� |
---|
344 | |
---|
345 | Du��etody (numerick�e�en�P p�t� \cite{astrom1986dual} a SIDP) dok�ly navrhnout �n��n�ro libovoln�odnoty parametr�\hat{\theta}_0,P_0)$. Ob�mi�n�etody pak dosahovaly v p��elk�o�e� neznalosti ($P_0=10$) kvantitativn�rovnateln�sledk�razn��ozd�byl pro rozptyl $P_0=1$. Tehdy si vedla l� metoda DP. |
---|
346 | |
---|
347 | Metoda SIDP se uk�la jako robustn��naproti tomu v�ak �t� dosahovala m��y���tr� ne� DP. Chov� obou du�� metod tak vych� pr��elmi podobn�Nutno v�ak p�enout v�k z \cite{thompson2005stochastic}, �e SIDP dosahuje srovnateln� v�u s DP ji� p�ruba desetinov�v�n��e. |
---|
348 | |
---|
349 | Metoda certainty equivalent (CE) se uk�la pou�iteln�ouze, pokud je parametr $\theta$ dostate� vzd�n od nulov�odnoty. Podle kvalitativn� zkoum� to bylo zp�no t� �e v mnoha p�ech, ztr� v� p��a rozumnou mez. P� se ob� i touto metodou poda�navrhnout kvalitn��n� |
---|
350 | |
---|
351 | Anal�po�n���sti algoritmu SIDP uk�la, �e pro komplexn��lohy by p�ala v � pouze v p��r��sov�rizont�ep� jemn�iskretizace. Jako vhodn�e tedy jev�ou�it�etody SIDP v kombinaci s n�kou v�n�fektivn�etodou, nap�d CC. V p��patn�dentifikace syst� by se pou�ilo ��avr�en�omoc�IDP a jakmile by znalost syst� p��a jistou zvolenou mez, k ��y se pou�ila nedu��etoda. V takov�p��y toti� sta�o metodou SIDP � jen na kr���ov�horizontu, konkr��e� by bylo dosa�eno dostate� znalosti syst�. D� by se ji� �o v�n�fektivn�etodou. |
---|