1 | \chapter{Multiagentní systémy} |
---|
2 | |
---|
3 | \section{Úvod} |
---|
4 | |
---|
5 | Multiagentní systém je druh distribuované umělé inteligence. Tento systém se skládá z |
---|
6 | jednotlivých výpočetních prvků, tzv. agentů, které musí mít dvě základní schopnosti. |
---|
7 | Zaprvé musí být schopni autonomní akce rozhodnutí - zjistit jak nejlépe dosáhnout |
---|
8 | požadovaných cílů - a zadruhé je to schopnost interakce s ostatními agenty. V druhém případě nejde |
---|
9 | jen o pouhou výměnu dat, ale o typ kolektivní aktivity - návrh, potvrzení, odmítnutí. |
---|
10 | |
---|
11 | \subsection{Historie} |
---|
12 | |
---|
13 | Multiagentní systémy jsou na poli počítačové vědy relativní novinkou. Studium tohoto |
---|
14 | tématu probíhá od začátku osmdesátých let dvacátého století. Větší pozornosti |
---|
15 | se jim dostalo v polovině let devadesátých s rozvojem internetu. |
---|
16 | |
---|
17 | \subsection{Agent} |
---|
18 | |
---|
19 | Neexistuje obecně uznávaná definice agenta. Přikloníme se k definici použité v publikaci |
---|
20 | \cite{wooldridge}. |
---|
21 | |
---|
22 | \begin{definition}[Agent]\label{de:agent01} |
---|
23 | Agent je počítačový systém umístěný do nějakého prostředí, který je schopen autonomní akce |
---|
24 | k přiblížení se navrženým cílům. |
---|
25 | \end{definition} |
---|
26 | |
---|
27 | |
---|
28 | Agent v naprosté většině případů nemá celkovou kontrolu nad prostředím. Prostředí může ovlivňovat |
---|
29 | jen částečně. Obecně je prostředí nedeterministické. Stejná akce provedená dvakrát za sebou |
---|
30 | nemusí vést ke stejnému výsledku. |
---|
31 | |
---|
32 | \section{Druhy prostředí} |
---|
33 | |
---|
34 | Způsob práce agentů se liší podle druhu prostředí, ve kterém pracují. Podle \cite{wooldridge} se |
---|
35 | prostředí dají klasifikovat následovně: |
---|
36 | |
---|
37 | \begin{itemize} |
---|
38 | \item Deterministické vs. nedeterministické |
---|
39 | \item Dostupné vs. nedostupné |
---|
40 | \item Statické vs. dynamické |
---|
41 | \end{itemize} |
---|
42 | Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt. |
---|
43 | Prostředí je dostupné, pokud agent může zjistit jeho úplný stav v kteroukoliv dobu. |
---|
44 | Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolanými agenty. |
---|
45 | V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí. |
---|
46 | % \\ |
---|
47 | % \\ |
---|
48 | % V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru), |
---|
49 | % nedostupné (hodnoty se měří pouze jednou za 90 sekund, a ještě jsou zkreslené) a dynamické |
---|
50 | % (intenzita dopravy se mění nezávisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi |
---|
51 | % znesnadňuje rozhodování a kontrolu vyvolaného výsledku. |
---|
52 | |
---|
53 | |
---|
54 | \section{Interakce agentů} |
---|
55 | |
---|
56 | \subsection{Stavy prostředí a preference agentů} |
---|
57 | |
---|
58 | Mějme pro jednoduchost 2 agenty. Označme si je $i$ a $j$. |
---|
59 | Předpokládejme, že máme množinu $$\Omega = \{\omega_1, \omega_2, ...\}$$ obsahující všechny možné stavy |
---|
60 | prostředí, v kterém agenti operují. Aby byl agent schopen efektivně ovlivňovat prostření, musí být schopen |
---|
61 | ohodnotit, jak je pro něj daný stav příznivý. Hodnocení daného stavu agenta $i$ a $j$ formálně definujeme jako funkce |
---|
62 | $$u_i : \Omega \rightarrow \mathbb{R}, $$ |
---|
63 | $$u_j : \Omega \rightarrow \mathbb{R}. $$ |
---|
64 | Čím je stav $\omega$ příznivější pro agenta $i$, tím je větší hodnota funkce $u_i$. |
---|
65 | |
---|
66 | \begin{definition}[Uspořádání na množině všech stavů] |
---|
67 | Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněme, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$, |
---|
68 | pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme |
---|
69 | $$ \omega_1 \succeq_i \omega_2. $$ |
---|
70 | Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$, |
---|
71 | pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme |
---|
72 | $$ \omega_1 \succ_i \omega_2 $$ |
---|
73 | \end{definition} |
---|
74 | |
---|
75 | Relace $ \succeq_i $ je zřejmě uspořádání, protože má všechny potřebné vlastnosti. |
---|
76 | \newline |
---|
77 | Reflexivitu: |
---|
78 | $$ \forall \omega \in \Omega : \omega \succeq_i \omega $$ |
---|
79 | Tranzitivitu: |
---|
80 | $$ \forall \omega_1, \omega_2, \omega_3 \in \Omega : \omega_1 \succeq_i \omega_2 \wedge \omega_2 \succeq_i \omega_3 \Rightarrow \omega_1 \succeq_i \omega_3$$ |
---|
81 | Porovnatelnost: |
---|
82 | $$ \forall \omega_1, \omega_2 \in \Omega : \omega_1 \succeq_i \omega_2 \vee \omega_2 \succeq_i \omega_1 $$ |
---|
83 | |
---|
84 | Relace $\succ_i$ zjevně nesplňuje podmínky reflexivity. |
---|
85 | |
---|
86 | \chapter{Výběr strategie genta} |
---|
87 | Nyní popíšeme, jak mají agenti možnost ovlivňovat prostředí. |
---|
88 | Opět předpokládejme existenci dvou agentů $i$ a $j$. Obecně mají |
---|
89 | různí agenti různou oblast působnosti. Množina |
---|
90 | $$ A = \{ a_1, a_2, ... \} $$ |
---|
91 | znázorňuje množinu všech akcí, které jsou agenti schopni provézt. |
---|
92 | Na tyto akce reaguje prostředí přechodem do nějakého stavu $\omega \in \Omega$. |
---|
93 | Formálně můžeme tento přechod zapsat jako funkci |
---|
94 | $$ \tau : A \times A \rightarrow \Omega. $$ |
---|
95 | |
---|
96 | |
---|
97 | |
---|
98 | |
---|
99 | \section{Výběr strategie podle teorie her} |
---|
100 | |
---|
101 | Popišme zde způsob, jak se agent rozhodne pro realizaci určité akce. |
---|
102 | Agent je nyní schopen ohodnotit, který stav prostředí je pro něj příznivější než jiný, |
---|
103 | neví však jak budou reagovat ostatní agenti, není schopen určit tudíž, i za předpokladu, |
---|
104 | že by systém byl deterministický, do jakého stavu systém přejde. K výběru optimální akce |
---|
105 | se používají prvky z teorie her. Zadefinujme nejprve v souladu s touto teorií základní pojmy. |
---|
106 | |
---|
107 | \begin{definition}[Dominance množiny] |
---|
108 | Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $. |
---|
109 | Řekneme, že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí |
---|
110 | $$ |
---|
111 | \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'. |
---|
112 | $$ |
---|
113 | Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí |
---|
114 | $$ |
---|
115 | \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'. |
---|
116 | $$ |
---|
117 | \end{definition} |
---|
118 | |
---|
119 | Abychom používali terminologii teorie her, budeme nyní akce $a_i \in A$ jednotlivých agentů |
---|
120 | nazývat strategiemi. |
---|
121 | |
---|
122 | \begin{definition}[Množina výsledků] |
---|
123 | Nazvěme množinu všech stavů, do kterých může prostředí přejít při hraní strategie $a_i \in A$, |
---|
124 | množinou možných výsledků. Označme ji |
---|
125 | $$ |
---|
126 | a_i^* \subset \Omega. |
---|
127 | $$ |
---|
128 | \end{definition} |
---|
129 | |
---|
130 | \begin{definition}[Dominance strategie] |
---|
131 | Řekneme, že strategie $a_i$ je dominantní nad strategií $a_j$, |
---|
132 | pokud je množina $a_i^*$ dominantní nad množinou $a_j^*$. |
---|
133 | Strategie $a_i$ je silně dominantní nad strategií $a_j$, |
---|
134 | pokud je množina $a_i^*$ silně dominantní nad množinou $a_j^*$. |
---|
135 | \end{definition} |
---|
136 | |
---|
137 | Racionálně uvažující agent tedy vyloučí všechny strategie $a_i$, jestliže existuje |
---|
138 | strategie $a_j$, která nad strategií $a_i$ silně dominuje. K zúžení výběru zbývajících |
---|
139 | strategií slouží Nashova rovnost. Pro zjednodušení uvažujme 2 agenty, $i$ a $j$ |
---|
140 | \begin{definition}[Nashova rovnost]\label{de:nash_equlibrium} |
---|
141 | Dvě strategie, $a_1$ a $a_2$ jsou v Nashově rovnosti, pokud za předpokladu že agent |
---|
142 | $i$ zvolí strategii $a_1$, je nejvýhodnější strategií pro agenta $j$ je strategie $a_2$ a zároveň |
---|
143 | pokud agent $j$ zvolí strategii $a_2$, je pro agenta i nejvýhodnější strategií $a_1$. |
---|
144 | \end{definition} |
---|
145 | |
---|
146 | |
---|
147 | |
---|
148 | |
---|