root/applications/doprava/texty/novotny_vyzk_LQ/02_Agents/Agents.tex @ 1425

Revision 1425, 6.5 kB (checked in by jabu, 12 years ago)

1. uprava uvodu, jeste rozepsat, vysledky scenare 01

Line 
1\chapter{Multiagentní systémy}
2
3\section{Úvod}
4
5Multiagentní systém je druh distribuované umělé inteligence, jehož základem je
6agent - výpočetní prvek schopný autonomní reakce, komunikace a koordinace.
7Každý agent je schopen vyhodnotit optimální chování v dané situaci,
8které závisí i na akoci ostatních agentů. Ke sploupráci jednotlivých
9agentů slouží různe metody vejednávání a predikce chování.
10
11\subsection{Historie}
12
13Multiagentní systémy jsou na poli počítačové vědy relativní novinkou. Studium tohoto
14tématu probíhá od začátku osmdesátých let dvacátého století. Větší pozornosti
15se jim dostalo v polovině let devadesátých s rozvojem internetu.
16
17\subsection{Agent}
18
19Obecně uznávaná definice agenta neexistuje. Jedna z možných je uvedena například v publikaci
20\cite{wooldridge}:
21
22\begin{definition}[Agent]\label{de:agent01}
23Agent je počítačový systém umístěný do nějakého prostředí, který je schopen autonomní akce
24k přiblížení se navrženým cílům.
25\end{definition}
26
27
28\section{Druhy prostředí}
29
30Způsob práce agentů se liší podle druhu prostředí, ve kterém pracují. Podle \cite{wooldridge} se
31prostředí dají klasifikovat následovně:
32
33\begin{itemize}
34 \item Deterministické vs. nedeterministické
35 \item Dostupné vs. nedostupné
36 \item Statické vs. dynamické
37\end{itemize}
38Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt.
39Prostředí je dostupné, pokud agent může zjistit jeho úplný stav v kteroukoliv dobu.
40Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty.
41V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí.
42% \\
43% \\
44% V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru),
45% nedostupné (hodnoty se měří pouze jednou za 90 sekund, a ještě jsou zkreslené) a dynamické
46% (intenzita dopravy se mění nezávisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi
47% znesnadňuje rozhodování a kontrolu vyvolaného výsledku.
48
49
50\section{Interakce agentů}
51
52\subsection{Stavy prostředí a preference agentů}
53
54Mějme pro jednoduchost 2 agenty. Označme si je $i$ a $j$.
55Předpokládejme, že máme množinu $$\Omega = \{\omega_1, \omega_2, ...\}$$ obsahující všechny možné stavy
56prostředí, v kterém agenti operují. Aby byl agent schopen efektivně ovlivňovat prostření, musí být schopen
57ohodnotit, jak je pro něj daný stav příznivý. Hodnocení daného stavu agenta $i$ a $j$ formálně definujeme jako funkce
58$$u_i : \Omega \rightarrow \mathbb{R}, $$
59$$u_j : \Omega \rightarrow \mathbb{R}. $$
60Čím je stav $\omega$ příznivější pro agenta $i$, tím je větší hodnota funkce $u_i$.
61
62\begin{definition}[Uspořádání na množině všech stavů]
63 Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněme, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$,
64pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme
65$$ \omega_1 \succeq_i \omega_2. $$
66Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$,
67pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme
68$$ \omega_1 \succ_i \omega_2 $$
69\end{definition}
70
71Relace $ \succeq_i $ je zřejmě uspořádání, protože má všechny potřebné vlastnosti.
72\newline
73Reflexivitu:
74$$  \forall \omega \in \Omega : \omega \succeq_i \omega $$
75Tranzitivitu:
76$$  \forall \omega_1, \omega_2, \omega_3 \in \Omega : \omega_1 \succeq_i \omega_2 \wedge \omega_2 \succeq_i \omega_3 \Rightarrow \omega_1 \succeq_i \omega_3$$
77Porovnatelnost:
78$$  \forall \omega_1, \omega_2 \in \Omega : \omega_1 \succeq_i \omega_2 \vee \omega_2 \succeq_i \omega_1 $$
79
80Relace $\succ_i$ zjevně nesplňuje podmínky reflexivity.
81
82\chapter{Výběr strategie genta}
83Nyní popíšeme, jak mají agenti možnost ovlivňovat prostředí.
84Opět předpokládejme existenci dvou agentů $i$ a $j$. Obecně mají
85různí agenti různou oblast působnosti. Množina
86$$ A = \{ a_1, a_2, ... \} $$
87znázorňuje množinu všech akcí, které jsou agenti schopni provézt.
88Na tyto akce reaguje prostředí přechodem do nějakého stavu $\omega \in \Omega$.
89Formálně můžeme tento přechod zapsat jako funkci
90$$ \tau : A \times A \rightarrow \Omega. $$
91
92
93
94
95\section{Výběr strategie podle teorie her}
96
97Popišme zde způsob, jak se agent rozhodne pro realizaci určité akce.
98Agent je nyní schopen ohodnotit, který stav prostředí je pro něj příznivější než jiný,
99neví však jak budou reagovat ostatní agenti, není schopen určit tudíž, i za předpokladu,
100že by systém byl deterministický, do jakého stavu systém přejde. K výběru optimální akce
101se používají prvky z teorie her. Zadefinujme nejprve v souladu s touto teorií základní pojmy.
102
103\begin{definition}[Dominance množiny]
104 Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $.
105Řekneme, že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí
106$$
107\forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'.
108$$
109Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí
110$$
111\forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'.
112$$
113\end{definition}
114
115Abychom používali terminologii teorie her, budeme nyní akce $a_i \in A$ jednotlivých agentů
116nazývat strategiemi.
117
118\begin{definition}[Množina výsledků]
119Nazvěme množinu všech stavů, do kterých může prostředí přejít při hraní strategie $a_i \in A$,
120množinou možných výsledků. Označme ji
121$$
122a_i^* \subset \Omega.
123$$
124\end{definition}
125
126\begin{definition}[Dominance strategie]
127 Řekneme, že strategie $a_i$ je dominantní nad strategií $a_j$,
128pokud je množina $a_i^*$ dominantní nad množinou $a_j^*$.
129Strategie $a_i$ je silně dominantní nad strategií $a_j$,
130pokud je množina $a_i^*$ silně dominantní nad množinou $a_j^*$.
131\end{definition}
132
133Racionálně uvažující agent tedy vyloučí všechny strategie $a_i$, jestliže existuje
134strategie $a_j$, která nad strategií $a_i$ silně dominuje. K zúžení výběru zbývajících
135strategií slouží Nashova rovnost. Pro zjednodušení uvažujme 2 agenty, $i$ a $j$
136\begin{definition}[Nashova rovnost]\label{de:nash_equlibrium}
137 Dvě strategie, $a_1$ a $a_2$ jsou v Nashově rovnosti, pokud za předpokladu že agent
138  $i$ zvolí strategii $a_1$, je nejvýhodnější strategií pro agenta $j$ je strategie $a_2$ a zároveň
139  pokud agent $j$ zvolí strategii $a_2$, je pro agenta i nejvýhodnější strategií $a_1$.
140\end{definition}
141
142
143 
144
Note: See TracBrowser for help on using the browser.