- Timestamp:
- 07/27/10 06:50:13 (14 years ago)
- Files:
-
- 1 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/delka_cyklu/03_Agents/Agents.tex.backup
r1147 r1150 11 11 \subsection{Historie} 12 12 13 Multiagentí systémy jsou na poli počítačové vědy poměrně n novinkou. Studium tohoto13 Multiagentí systémy jsou na poli počítačové vědy poměrně novinkou. Studium tohoto 14 14 tématu probíhá od začátku osmdesátých let devatenáctého století. Větší pozornosti 15 15 se jim dostalo v polovině let devadesátých s rozvojem internetu. … … 30 30 provedená dvakrát za sebou nemusí vést ke stejnému výsledku. 31 31 32 \section{ Prostředí}32 \section{Druhy prostředí} 33 33 34 Russel a Norvig navrhli klasifikaci prostředí podle jednotlivých parametrů následovně. 34 Způsob práce agentů se liší podle druhu prostředí, ve kterém pracují. Podle \cite{wooldridge} se 35 prostředí dají klasifikovat následovně: 35 36 36 \subsection{Dostupné vs. nedostupné} 37 \begin{itemize} 38 \item Deterministické vs. Nedetrministické 39 \item Dostupné vs. nedostupné 40 \item Statické vs. dynamické 41 \end{itemize} 42 Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt. 43 Prostředí je dostupné, pokud agent múže zjistit jeho úplný stav v kteroukoliv dobu. 44 Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty. 45 V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí. 46 \\ 47 \\ 48 V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru), 49 nedostupné (hodnoty se měří pouze jednou za 90 sekund, aještě jsou zkreslené) a dynamické 50 (intenzita dopravy se mění nezévisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi 51 znesnadňuje rozhodování a kontrolu vyvolaného výsledku. 37 52 38 Prostředí je dostupné, pokud agent múže zjistit jeho úplný stav v kteroukoliv dobu.39 40 \subsection{Deterministické vs. Nedetrministické}41 42 Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt.43 44 \subsection{Statické vs. dynamické}45 46 Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty.47 48 \subsection{Diskrétní vs. spojité}49 50 V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí.51 53 52 54 \section{Interakce agentů} … … 64 66 \begin{definition}[Uspořádání na množině všech stavů] 65 67 Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněmě, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$, 66 pokud platí $u_i(\omega_1) \ >=u_i(\omega_2)$. Značíme68 pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme 67 69 $$ \omega_1 \succeq_i \omega_2. $$ 68 70 Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$, 69 pokud platí $u_i(\omega_1) \> u_i(\omega_2)$. Značíme71 pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme 70 72 $$ \omega_1 \succ_i \omega_2 $$ 71 73 \end{definition} … … 92 94 $$ \tau : A \times A \rightarrow \Omega. $$ 93 95 94 \begin{definition}[Dominance]95 Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $.96 Řekneme že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí97 $$98 \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'.99 $$100 Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí101 $$102 \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'.103 $$104 96 105 \end{definition}106 97 107 98 … … 153 144 \subsection{Použití pro výběr délky cyklu} 154 145 155 Délka cyklu řadiče křižovatky je parametr, který je pro všechny křižovatky ve skupiněspolečný.146 Délka cyklu řadiče křižovatky je parametr, který je pro všechny agenty ve skupině zahrnující křižovatky do zelené vlny společný. 156 147 Nesmí tedy dojít k situaci, kdy by každý agent nastavil jinou délku cyklu. Množina strategií 157 148 $A = \{ a_1, a_2, ... \}$ je tedy v našem případě množinou všech nastavitelných délek cyklu $Tc_k$ … … 197 188 u_{Tc_i} = \max(U). 198 189 $$ 190 Toto je výběr globálně nejlepšího řešení, kde agent upřednostní takový čas délky cyklu, u kterého se předpokládá 191 největší součet zisků od všech agentů nad časem, u kterého předpokládá největší zisk pro sebe. 192 193 \subsection{Rozšíření} 194 V našem případě se zabýváme pouze dvěma křižovatkami. V případě většího počtu křižovatek patřících do různých skupin zelené vlny 195 S bude optimalizace provádět pro každou skupinu zvlášť. jak dále popíšeme v \ref{ss:odhad_fronty}