Show
Ignore:
Timestamp:
07/27/10 06:50:13 (14 years ago)
Author:
jabu
Message:
 
Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/delka_cyklu/03_Agents/Agents.tex.backup

    r1147 r1150  
    1111\subsection{Historie} 
    1212 
    13 Multiagentí systémy jsou na poli počítačové vědy poměrně nnovinkou. Studium tohoto  
     13Multiagentí systémy jsou na poli počítačové vědy poměrně novinkou. Studium tohoto  
    1414tématu probíhá od začátku osmdesátých let devatenáctého století. Větší pozornosti 
    1515se jim dostalo v polovině let devadesátých s rozvojem internetu.  
     
    3030provedená dvakrát za sebou nemusí vést ke stejnému výsledku. 
    3131 
    32 \section{Prostředí} 
     32\section{Druhy prostředí} 
    3333 
    34 Russel a Norvig navrhli klasifikaci prostředí podle jednotlivých parametrů následovně. 
     34Způsob práce agentů se liší podle druhu prostředí, ve kterém pracují. Podle \cite{wooldridge} se 
     35prostředí dají klasifikovat následovně: 
    3536 
    36 \subsection{Dostupné vs. nedostupné} 
     37\begin{itemize} 
     38 \item Deterministické vs. Nedetrministické 
     39 \item Dostupné vs. nedostupné 
     40 \item Statické vs. dynamické 
     41\end{itemize} 
     42Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt. 
     43Prostředí je dostupné, pokud agent múže zjistit jeho úplný stav v kteroukoliv dobu. 
     44Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty. 
     45V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí. 
     46\\ 
     47\\ 
     48V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru), 
     49nedostupné (hodnoty se měří pouze jednou za 90 sekund, aještě jsou zkreslené) a dynamické  
     50(intenzita dopravy se mění nezévisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi 
     51znesnadňuje rozhodování a kontrolu vyvolaného výsledku. 
    3752 
    38 Prostředí je dostupné, pokud agent múže zjistit jeho úplný stav v kteroukoliv dobu. 
    39  
    40 \subsection{Deterministické vs. Nedetrministické} 
    41  
    42 Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt. 
    43  
    44 \subsection{Statické vs. dynamické} 
    45  
    46 Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty. 
    47  
    48 \subsection{Diskrétní vs. spojité} 
    49  
    50 V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí. 
    5153 
    5254\section{Interakce agentů} 
     
    6466\begin{definition}[Uspořádání na množině všech stavů] 
    6567 Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněmě, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$, 
    66 pokud platí $u_i(\omega_1) \>= u_i(\omega_2)$. Značíme 
     68pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme 
    6769$$ \omega_1 \succeq_i \omega_2. $$ 
    6870Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$, 
    69 pokud platí $u_i(\omega_1) \> u_i(\omega_2)$. Značíme 
     71pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme 
    7072$$ \omega_1 \succ_i \omega_2 $$ 
    7173\end{definition} 
     
    9294$$ \tau : A \times A \rightarrow \Omega. $$ 
    9395 
    94 \begin{definition}[Dominance] 
    95  Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $.  
    96 Řekneme že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí 
    97 $$ 
    98 \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'. 
    99 $$ 
    100 Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí 
    101 $$ 
    102 \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'. 
    103 $$ 
    10496 
    105 \end{definition} 
    10697 
    10798 
     
    153144\subsection{Použití pro výběr délky cyklu} 
    154145 
    155 Délka cyklu řadiče křižovatky je parametr, který je pro všechny křižovatky ve skupině společný. 
     146Délka cyklu řadiče křižovatky je parametr, který je pro všechny agenty ve skupině zahrnující křižovatky do zelené vlny společný. 
    156147Nesmí tedy dojít k situaci, kdy by každý agent nastavil jinou délku cyklu. Množina strategií 
    157148$A = \{ a_1, a_2, ... \}$ je tedy v našem případě množinou všech nastavitelných délek cyklu $Tc_k$ 
     
    197188u_{Tc_i} = \max(U).  
    198189$$  
     190Toto je výběr globálně nejlepšího řešení, kde agent upřednostní takový čas délky cyklu, u kterého se předpokládá 
     191největší součet zisků od všech agentů nad časem, u kterého předpokládá největší zisk pro sebe. 
     192 
     193\subsection{Rozšíření} 
     194V našem případě se zabýváme pouze dvěma křižovatkami. V případě většího počtu křižovatek patřících do různých skupin zelené vlny 
     195S bude optimalizace provádět pro každou skupinu zvlášť. jak dále popíšeme v \ref{ss:odhad_fronty}