root/applications/dual/SIDP/text/untitled-1.tex @ 868

Revision 868, 6.1 kB (checked in by zimamiro, 14 years ago)
RevLine 
[868]1\documentclass{article}
2
3\usepackage[czech]{babel} %pouzivam cestinu
4\usepackage[cp1250]{inputenc} %vstupni retezec je cesky
5\usepackage[T1]{fontenc} %mam zde vsechny znaky
6\usepackage{amsmath}
7
8\DeclareMathOperator*{\E}{E}
9
10\begin{document}
11\tableofcontents %obsah
12\newpage
13
14\section{�od}
15                V technick�raxi, stejn�ako b���ivot�jsme nuceni d�t rozhodnut�A� u� se jedn� ��� linky �hled� opti�� spojen�ezi dv� m�y, na�e rozhodnut�ych�j�e znalost�kter� sv� m�. Chceme-li �it �n�ozhodnut�je t�vy� dv�lohy: 1) ��kt co nejl� poznat a 2) dos�ut c�, kter� si vyty�i. Tyto dva � jsou v�ak v�inou v rozporu: syst�se nejl� pozn�kdy� se nechov�odle na�ich po�adavk�re��sv� nav�existuj��dn�evy, poruchy a nep�v�n�ituace, kter�ednotn�az�neur�ost�Tato skute�st zp�je, �e na�e znalost syst� nebude nikdy dokonal�
16
17Za �m ��yst�, kter�sou bu�atolik slo�it��e jejich deterministick�s je nemo�n�o obsahuj�ch n�dn�rvky ji� ze sv�odstaty, vzniklo stochastick��n�nebo-li optim���n�a neur�osti. C�m stochastick� ��e minimalizovat velikost  odchylek syst� od po�adovan� stavu optimalizac��c� z�h�
18Jeden z p�p�e�en�ohoto prob� je dynamick�rogramov�, kter�avrhl americk�matik Richard Bellman[]. Jedn�e o metodu, kter� vyu�it�zp�� chodu minimalizuje hodnotu o��n�t�v�unkce. Tento p�p m�nalytick�e�en�ouze v p��nalosti v�ech parametr�t�. V �edes�ch letech 20. stolet�avrhl Alexander Aronovich Feldbaum ��ou�it�takzvan� du�� ��Hlavn�y�lenkou tohoto p�pu bylo, �e ��us�ejen minimalizovat aktu��tr�, ale rovn�mus��at o syst� co nejv� informac�ro minimalizaci budouc� ztr�
19
20P�aplikace tohoto postupu je v�ak bohu�el i u pom��ednoduch�a� komplikov� slo�itost��.  K ��lohy je proto vhodn�o��aproxima�ch metod.
21\newline
22
23Tato  bakal�k�r� si klade n�eduj� c�
24\begin{itemize}
25\item
26Formulace � stochastick� ��\item
27��en�lohy stochastick� ��omoc�u�� ��\item
28P�aven��er�roxima�ch p�p�u�� ��\item
29Aplixace du�� �� nalezen�ptim��trategie na jednoduch�syst�
30\item
31Porovn� uveden�roxima�ch p�p�jednoduch�syst�
32\end{itemize}
33
34\section{Formulace � stochastick� ��
35�t�m pojmem v teorii ��e \emph{syst�. Syst�je �t sv�, kterou chceme poznat ��. Informace o stavu syt� z��me prost�ctv�jeho v�. �zen�tj. ovliv�n�tavu syst�, m� prov�t  vstup�t� pr� budeme p�kl�t, �e v� charakterizuj�tav syst� �. To nemus��cn�ravda, postup p�zen� nedokonal�formacemi o stavu syst� je uveden nap�d v []. Obecn�e d�k�t, �e � s ��yst� s ne�mi informacemi o stavu se d�kvivalentn�ransformovat na � ��yst� s �mi informacemi o stavu.
36
37Budeme-li p�kl�t diskr��ovahu �u m� syst�v �ov� okam�iku $t$ popsat syst�m rovnic
38\begin{equation}
39\label{sys}
40x_{t+1}=f_k(x_t,u_t,w_t), \qquad t=0,1,\ldots,N-1,
41\end{equation}
42kde $x_t$ je v�v �e $t$, $u_t$ je vstup v �e t a $w_t$ je v�v �e t.
43 
44D� m� p�s�u ztr�vou funkci
45\begin{equation}
46g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1})
47\end{equation}
48
49Posloupnost��c� strategi�\pi=\{\mu_0,\ldots,\mu_{N-1}\}$ budeme rozum�posloupnost zobrazen�\begin{equation}
50\label{con}
51\mu_t(x_t)=u_t \, \qquad t=0,1,\ldots,N-1,
52\end{equation}
53
54Pro danou ��trategii ozna� o��nou ztr� jako
55\begin{multline}
56\label{los}
57J_\pi(x_0)=\\
58\E_{w_0,\ldots,w_{N-1}}\left\{g(x_0\ldots,x_N,\mu_0(x_0),\ldots,\mu_{N-1}(x_{N-1}),w_0,\ldots,w_{N-1})\right\}
59\end{multline}
60
61�ohou je potom naj�takovou $\pi^*$, pro kterou plat�\begin{equation}
62J_{\pi^*}(x_0)=\min_{\pi \in \Pi}J_\pi(x_0)
63\end{equation}
64
65Celkov�e tedy jedn� optimaliza� � nal� takovou posloupnost funkc�eqref{con}, kter�inimalizuje o��nou ztr�vu \eqref{los} za podm�k \eqref{sys}.
66
67
68
69\section{��en�lohy stochastick� ��omoc�ynamick� programov�}
70�ohu stochastick� ��ak, jak byla definov� v p�oz��i, nelze obecn�e�it. Je tedy vhodn��k � bl� specifikovat. V tomto sm� je vhodne omezit se na n�k�i��var ztr�v�unkce \eqref{los}. Jako vhodn�e�en�e ukazuje uva�ovat tzv. aditivn�var ztr�v�unkce, tedy �e existuj�unkce $g_t$ takov��e m� ps�
71\begin{equation}
72\label{adi}
73g(x_0,\ldots,x_N,u_0,\ldots,u_{N-1},w_0,\ldots,w_{N-1})=g_N(x_N)+\sum_{t=0}^{N-1}g_t(x_t,u_t,w_t)
74\end{equation}
75
76Toto je ji� vhodn� pro pou�it�ynamick� programov� []. Dynamick�rogramov� je p�p k ��ptimaliza�ch � na kter�e m� d�t jako na posloupnost rozhodnut�pro kter�lat�zv. princip optimality.  Ten � �e optim��osloupnost rozhodnut��u vlastnost, �e pro libovoln�te� stav a rozhudnut�us��chna n�eduj� rozhodnut�ptim��zhledem k v��zhodnut�rvn�. D� �e pro ztr� tvaru \eqref{adi} plat�rincip optimality je snadn�e ho nal� nap�d v [].
77
78P��en�lohy stochastick� programov� je tedy ji� mo�n�ostupovat jak je u ���moc�ynamick� programov� zvykem.
79
80
81\section{Suboptim��e�en�lohy stochastick� ��
82\subsection{Du���n�
83Minimalizace+uceni
84\subsection{Kalman�ltr}
85Jak kvantifikovat co jsem se naucilm, jen linearni systemy
86\subsection{P�py k du�� ��
87nektere mozne pristupy a na jaky predpis pro suboptimalni $u_t$ vedou
88\subsubsection{Certainty equivalecnce control}
89\subsubsection{Causious control}
90\subsubsection{Metoda separace}
91\subsubsection{SIDP}
92\section{Pou�it�u�� ���zen�ednoduchh� syst�}
93\subsection{Popis syst�}
94\subsection{Srovn� jednotliv��up�section{Z�r}
95\end{document}
Note: See TracBrowser for help on using the browser.