root/applications/doprava/texty/novotny_vyzk_LQ/MathematicalMethods/MathematicalMethods.tex @ 1434

Revision 1434, 6.3 kB (checked in by jabu, 12 years ago)

finalni verze

Line 
1\chapter{Matematické metody rozhodování}
2
3\section{Multiagentní systémy}
4
5Multiagentní systém je druh distribuované umělé inteligence, jehož základem je
6agent - výpočetní prvek schopný autonomní akce, komunikace a koordinace.
7Každý agent je schopen vyhodnotit optimální chování v dané situaci,
8které závisí i na akcích ostatních agentů. Ke sploupráci jednotlivých
9agentů slouží různe metody vejednávání a predikce chování.
10
11
12\subsection{Agent}
13
14Obecně uznávaná definice agenta neexistuje. Jedna z možných je uvedena například v publikaci
15\cite{wooldridge}:
16
17\begin{definition}[Agent]\label{de:agent01}
18Agent je počítačový systém umístěný do nějakého prostředí, který je schopen autonomní akce
19k přiblížení se navrženým cílům.
20\end{definition}
21
22
23\subsection{Druhy prostředí}
24
25Způsob práce agentů se liší podle druhu prostředí, ve kterém operjií. Podle \cite{wooldridge} se
26prostředí dají klasifikovat následovně:
27
28\begin{itemize}
29 \item Deterministické vs. nedeterministické
30 \item Dostupné vs. nedostupné
31 \item Statické vs. dynamické
32\end{itemize}
33Deterministické prostředí je takové, ve kterém má každá jednotlivá akce předem daný efekt.
34Prostředí je dostupné, pokud agent může zjistit jeho úplný stav v kteroukoliv dobu.
35Statické prostředí se na rozdíl od dynamického mění pouze vlivem akcí vyvolaných agenty.
36V diskrétním prostředí existuje pevné konečné číslo možných vjemů a akcí.
37% \\
38% \\
39% V našem případě je prostředí nedeterministické (agent pouze odhaduje vliv přenastavení parametru),
40% nedostupné (hodnoty se měří pouze jednou za 90 sekund, a ještě jsou zkreslené) a dynamické
41% (intenzita dopravy se mění nezávisle na akcích agenta). Je zřejmé, že prostředí s těmito vlastnostmi
42% znesnadňuje rozhodování a kontrolu vyvolaného výsledku.
43
44
45
46
47\subsection{Stavy prostředí a preference agentů}
48
49Mějme pro jednoduchost 2 agenty. Označme si je $i$ a $j$.
50Předpokládejme, že máme množinu $$\Omega = \{\omega_1, \omega_2, ...\}$$ obsahující všechny možné stavy
51prostředí, v kterém agenti operují. Aby byl agent schopen efektivně ovlivňovat prostření, musí umět
52ohodnotit, jak je pro něj daný stav příznivý. Hodnocení daného stavu agenta $i$ a $j$ formálně definujeme jako funkce
53$$u_i : \Omega \rightarrow \mathbb{R}, $$
54$$u_j : \Omega \rightarrow \mathbb{R}. $$
55Čím je stav $\omega$ příznivější pro agenta $i$, tím je větší hodnota funkce $u_i$.
56
57\begin{definition}[Uspořádání na množině všech stavů]
58 Mějme 2 stavy prostředí $\omega_1$, $\omega_2$. Řekněme, že stav $\omega_1$ je preferován agentem $i$ nad stavem $\omega_2$,
59pokud platí $u_i(\omega_1) \geqq u_i(\omega_2)$. Značíme
60$$ \omega_1 \succeq_i \omega_2. $$
61Stav $\omega_1$ je silně preferován agentem $i$ nad stavem $\omega_2$,
62pokud platí $u_i(\omega_1) > u_i(\omega_2)$. Značíme
63$$ \omega_1 \succ_i \omega_2 $$
64\end{definition}
65
66Relace $ \succeq_i $ je zřejmě uspořádání, protože má všechny potřebné vlastnosti.
67\newline
68Reflexivitu:
69$$  \forall \omega \in \Omega : \omega \succeq_i \omega $$
70Tranzitivitu:
71$$  \forall \omega_1, \omega_2, \omega_3 \in \Omega : \omega_1 \succeq_i \omega_2 \wedge \omega_2 \succeq_i \omega_3 \Rightarrow \omega_1 \succeq_i \omega_3$$
72Porovnatelnost:
73$$  \forall \omega_1, \omega_2 \in \Omega : \omega_1 \succeq_i \omega_2 \vee \omega_2 \succeq_i \omega_1 $$
74
75Relace $\succ_i$ zjevně nesplňuje podmínky reflexivity.
76
77
78\section{Výběr strategie podle teorie her}
79
80Nyní, jak je rozebíráno v \cite{wooldridge}, popíšeme, jak mají agenti možnost ovlivňovat prostředí.
81Opět předpokládejme existenci dvou agentů $i$ a $j$. Obecně mají
82různí agenti různou oblast působnosti. Množina
83$$ A = \{ a_1, a_2, ... \} $$
84znázorňuje množinu všech akcí, které jsou agenti schopni provést.
85Na tyto akce reaguje prostředí přechodem do nějakého stavu $\omega \in \Omega$.
86Formálně můžeme tento přechod zapsat jako funkci
87$$ \tau : A \times A \rightarrow \Omega. $$
88
89Popišme zde způsob, jak se agent rozhodne pro realizaci určité akce.
90Agent je nyní schopen ohodnotit, který stav prostředí je pro něj příznivější než jiný,
91neví však jak budou reagovat ostatní agenti, není schopen určit tudíž, i za předpokladu,
92že by systém byl deterministický, do jakého stavu systém přejde. K výběru optimální akce
93se používají prvky z teorie her. Zadefinujme nejprve v souladu s touto teorií základní pojmy.
94
95\begin{definition}[Dominance množiny]
96 Mějme 2 podmnožiny $ \Omega_1, \Omega_2 \subset \Omega $.
97Řekneme, že $\Omega_1$ je pro agenta $i$ dominantní nad množinou $\Omega_2$, pokud platí
98$$
99\forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succeq_i \omega'.
100$$
101Řekneme že $\Omega_1$ je pro agenta $i$ silně dominantní nad množinou $\Omega_2$, pokud platí
102$$
103\forall \omega \in \Omega_1, \forall \omega' \in \Omega_2 : \omega \succ_i \omega'.
104$$
105\end{definition}
106
107Abychom používali terminologii teorie her, budeme nyní akce $a_i \in A$ jednotlivých agentů
108nazývat strategiemi.
109
110\begin{definition}[Množina výsledků]
111Nazvěme množinu všech stavů, do kterých může prostředí přejít při hraní strategie $a_i \in A$,
112množinou možných výsledků. Označme ji
113$$
114a_i^* \subset \Omega.
115$$
116\end{definition}
117
118\begin{definition}[Dominance strategie]
119 Řekneme, že strategie $a_i$ je dominantní nad strategií $a_j$,
120pokud je množina $a_i^*$ dominantní nad množinou $a_j^*$.
121Strategie $a_i$ je silně dominantní nad strategií $a_j$,
122pokud je množina $a_i^*$ silně dominantní nad množinou $a_j^*$.
123\end{definition}
124
125Racionálně uvažující agent tedy vyloučí všechny strategie $a_i$, jestliže existuje
126strategie $a_j$, která nad strategií $a_i$ silně dominuje. K zúžení výběru zbývajících
127strategií slouží Nashova rovnost. Pro zjednodušení uvažujme 2 agenty, $i$ a $j$
128\begin{definition}[Nashova rovnost]\label{de:nash_equlibrium}
129 Dvě strategie, $a_1$ a $a_2$ jsou v Nashově rovnosti, pokud za předpokladu že agent
130  $i$ zvolí strategii $a_1$, je nejvýhodnější strategií pro agenta $j$ strategie $a_2$ a zároveň
131  pokud agent $j$ zvolí strategii $a_2$, je pro agenta i nejvýhodnější strategií $a_1$.
132\end{definition}
133
134
135 
136
Note: See TracBrowser for help on using the browser.