| 1 | \chapter{Matematické metody rozhodování} |
|---|
| 2 | |
|---|
| 3 | \section{Multiagentní systémy} |
|---|
| 4 | |
|---|
| 5 | Multiagentní systém je druh distribuované umělé inteligence, jehož základem je |
|---|
| 6 | agent - výpočetní prvek schopný autonomní akce, komunikace a koordinace. |
|---|
| 7 | Každý agent je schopen vyhodnotit optimální chování v dané situaci, |
|---|
| 8 | které závisí i na akcích ostatních agentů. Ke sploupráci jednotlivých |
|---|
| 9 | agentů slouží různe metody vejednávání a predikce chování. |
|---|
| 10 | |
|---|
| 11 | |
|---|
| 12 | \subsection{Agent} |
|---|
| 13 | |
|---|
| 14 | Obecně uznávaná definice agenta neexistuje. Jedna z možných je uvedena například v publikaci |
|---|
| 15 | \cite{wooldridge}: |
|---|
| 16 | |
|---|
| 17 | \begin{definition}[Agent]\label{de:agent01} |
|---|
| 18 | Agent je počítačový systém umístěný do nějakého prostředí, který je schopen autonomní akce |
|---|
| 19 | k přiblížení se navrženým cílům. |
|---|
| 20 | \end{definition} |
|---|
| 21 | |
|---|
| 22 | |
|---|
| 23 | \subsection{Druhy prostředí} |
|---|
| 24 | |
|---|
| 25 | Způsob práce agentů se liší podle druhu prostředí, ve kterém operjií. Podle \cite{wooldridge} se |
|---|
| 26 | prostředí dají klasifikovat následovně: |
|---|
| 27 | |
|---|
| 28 | \begin{itemize} |
|---|
| 29 | \item Deterministické vs. nedeterministické |
|---|
| 30 | \item Dostupné vs. nedostupné |
|---|
| 31 | \item Statické vs. dynamické |
|---|
| 32 | \end{itemize} |
|---|
| 33 | Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt. |
|---|
| 34 | Prostředí je dostupné, pokud agent může zjistit jeho úplný stav v kteroukoliv dobu. |
|---|
| 35 | Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolaných agenty. |
|---|
| 36 | V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí. |
|---|
| 37 | % \\ |
|---|
| 38 | % \\ |
|---|
| 39 | % V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru), |
|---|
| 40 | % nedostupné (hodnoty se měří pouze jednou za 90 sekund, a ještě jsou zkreslené) a dynamické |
|---|
| 41 | % (intenzita dopravy se mění nezávisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi |
|---|
| 42 | % znesnadňuje rozhodování a kontrolu vyvolaného výsledku. |
|---|
| 43 | |
|---|
| 44 | |
|---|
| 45 | |
|---|
| 46 | |
|---|
| 47 | \subsection{Stavy prostředí a preference agentů} |
|---|
| 48 | |
|---|
| 49 | Mějme pro jednoduchost 2 agenty. Označme si je $i$ a $j$. |
|---|
| 50 | Předpokládejme, že máme množinu $$\Omega = \{\omega_1, \omega_2, ...\}$$ obsahující všechny možné stavy |
|---|
| 51 | prostředí, v kterém agenti operují. Aby byl agent schopen efektivně ovlivňovat prostření, musí umět |
|---|
| 52 | ohodnotit, jak je pro něj daný stav příznivý. Hodnocení daného stavu agenta $i$ a $j$ formálně definujeme jako funkce |
|---|
| 53 | $$u_i : \Omega \rightarrow \mathbb{R}, $$ |
|---|
| 54 | $$u_j : \Omega \rightarrow \mathbb{R}. $$ |
|---|
| 55 | Čím je stav $\omega$ příznivější pro agenta $i$, tím je větší hodnota funkce $u_i$. |
|---|
| 56 | |
|---|
| 57 | \begin{definition}[Uspořádání na množině všech stavů] |
|---|
| 58 | Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněme, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$, |
|---|
| 59 | pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme |
|---|
| 60 | $$ \omega_1 \succeq_i \omega_2. $$ |
|---|
| 61 | Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$, |
|---|
| 62 | pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme |
|---|
| 63 | $$ \omega_1 \succ_i \omega_2 $$ |
|---|
| 64 | \end{definition} |
|---|
| 65 | |
|---|
| 66 | Relace $ \succeq_i $ je zřejmě uspořádání, protože má všechny potřebné vlastnosti. |
|---|
| 67 | \newline |
|---|
| 68 | Reflexivitu: |
|---|
| 69 | $$ \forall \omega \in \Omega : \omega \succeq_i \omega $$ |
|---|
| 70 | Tranzitivitu: |
|---|
| 71 | $$ \forall \omega_1, \omega_2, \omega_3 \in \Omega : \omega_1 \succeq_i \omega_2 \wedge \omega_2 \succeq_i \omega_3 \Rightarrow \omega_1 \succeq_i \omega_3$$ |
|---|
| 72 | Porovnatelnost: |
|---|
| 73 | $$ \forall \omega_1, \omega_2 \in \Omega : \omega_1 \succeq_i \omega_2 \vee \omega_2 \succeq_i \omega_1 $$ |
|---|
| 74 | |
|---|
| 75 | Relace $\succ_i$ zjevně nesplňuje podmínky reflexivity. |
|---|
| 76 | |
|---|
| 77 | |
|---|
| 78 | \section{Výběr strategie podle teorie her} |
|---|
| 79 | |
|---|
| 80 | Nyní, jak je rozebíráno v \cite{wooldridge}, popíšeme, jak mají agenti možnost ovlivňovat prostředí. |
|---|
| 81 | Opět předpokládejme existenci dvou agentů $i$ a $j$. Obecně mají |
|---|
| 82 | různí agenti různou oblast působnosti. Množina |
|---|
| 83 | $$ A = \{ a_1, a_2, ... \} $$ |
|---|
| 84 | znázorňuje množinu všech akcí, které jsou agenti schopni provést. |
|---|
| 85 | Na tyto akce reaguje prostředí přechodem do nějakého stavu $\omega \in \Omega$. |
|---|
| 86 | Formálně můžeme tento přechod zapsat jako funkci |
|---|
| 87 | $$ \tau : A \times A \rightarrow \Omega. $$ |
|---|
| 88 | |
|---|
| 89 | Popišme zde způsob, jak se agent rozhodne pro realizaci určité akce. |
|---|
| 90 | Agent je nyní schopen ohodnotit, který stav prostředí je pro něj příznivější než jiný, |
|---|
| 91 | neví však jak budou reagovat ostatní agenti, není schopen určit tudíž, i za předpokladu, |
|---|
| 92 | že by systém byl deterministický, do jakého stavu systém přejde. K výběru optimální akce |
|---|
| 93 | se používají prvky z teorie her. Zadefinujme nejprve v souladu s touto teorií základní pojmy. |
|---|
| 94 | |
|---|
| 95 | \begin{definition}[Dominance množiny] |
|---|
| 96 | Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $. |
|---|
| 97 | Řekneme, že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí |
|---|
| 98 | $$ |
|---|
| 99 | \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'. |
|---|
| 100 | $$ |
|---|
| 101 | Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí |
|---|
| 102 | $$ |
|---|
| 103 | \forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'. |
|---|
| 104 | $$ |
|---|
| 105 | \end{definition} |
|---|
| 106 | |
|---|
| 107 | Abychom používali terminologii teorie her, budeme nyní akce $a_i \in A$ jednotlivých agentů |
|---|
| 108 | nazývat strategiemi. |
|---|
| 109 | |
|---|
| 110 | \begin{definition}[Množina výsledků] |
|---|
| 111 | Nazvěme množinu všech stavů, do kterých může prostředí přejít při hraní strategie $a_i \in A$, |
|---|
| 112 | množinou možných výsledků. Označme ji |
|---|
| 113 | $$ |
|---|
| 114 | a_i^* \subset \Omega. |
|---|
| 115 | $$ |
|---|
| 116 | \end{definition} |
|---|
| 117 | |
|---|
| 118 | \begin{definition}[Dominance strategie] |
|---|
| 119 | Řekneme, že strategie $a_i$ je dominantní nad strategií $a_j$, |
|---|
| 120 | pokud je množina $a_i^*$ dominantní nad množinou $a_j^*$. |
|---|
| 121 | Strategie $a_i$ je silně dominantní nad strategií $a_j$, |
|---|
| 122 | pokud je množina $a_i^*$ silně dominantní nad množinou $a_j^*$. |
|---|
| 123 | \end{definition} |
|---|
| 124 | |
|---|
| 125 | Racionálně uvažující agent tedy vyloučí všechny strategie $a_i$, jestliže existuje |
|---|
| 126 | strategie $a_j$, která nad strategií $a_i$ silně dominuje. K zúžení výběru zbývajících |
|---|
| 127 | strategií slouží Nashova rovnost. Pro zjednodušení uvažujme 2 agenty, $i$ a $j$ |
|---|
| 128 | \begin{definition}[Nashova rovnost]\label{de:nash_equlibrium} |
|---|
| 129 | Dvě strategie, $a_1$ a $a_2$ jsou v Nashově rovnosti, pokud za předpokladu že agent |
|---|
| 130 | $i$ zvolí strategii $a_1$, je nejvýhodnější strategií pro agenta $j$ strategie $a_2$ a zároveň |
|---|
| 131 | pokud agent $j$ zvolí strategii $a_2$, je pro agenta i nejvýhodnější strategií $a_1$. |
|---|
| 132 | \end{definition} |
|---|
| 133 | |
|---|
| 134 | |
|---|
| 135 | |
|---|
| 136 | |
|---|