root/applications/doprava/texty/novotny_vyzk_LQ/03_RMM/RMM.tex @ 1433

Revision 1424, 6.4 kB (checked in by jabu, 12 years ago)

Prvni verze bez vysledku

Line 
1\section{RMM - Rekurzivní modelové metody} 
2
3
4Rekurzivní modelová metoda, která byla použita
5v článku \cite{4_rmm_formalization} k modelování chování
6agentů ovládajících ostatní dopravní uzly, slouží k odhadu chování ostatních a gentů.
7Akce každého agenta z pravidlo ovlivňuje do určité míry celý systém, tudíž
8výběr strategie každého agenta závisí na předpokládaném chování ostatních
9agentů. Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím,
10že každý agent je schopen modelovat rozhodnutí ostatních a podle známých parametrů
11prostředí s určitou pravděpodobností stanovit jejich volbu.
12
13
14
15\subsection{Formální definice}
16
17Základním stavebním kamenem RMM je matice zisků agenta, Definovaná v souladu s teorií her v \cite{4_rmm_formalization}
18
19\begin{definition}[Matice zisků]\label{de:payoff_matrix}
20  Matice zisků $P_{R_i}$ agenta $R_i$ je definována trojicí
21  $$(R, A, U)$$
22  kde $R$ je množina všech agentů v systému,
23  $A$ je množina množin $A_j = \{a_1^j, a_2^j, ...\}$ alternativních akcí agenta $R_j$.
24  $A_j$ budeme nazývat rozhodovací prostor agenta $R_j$.
25  U je funkce
26  $$U : A_1 \times A_2 \times ... \times A_n \rightarrow \mathbb{R}$$
27  přiřazující hodnoty zisku všem kombinacím akcí všech agentů.
28\end{definition}
29Každý agent provádí danou akci z nějakého důvodu. Zisky agenta $R_i$ jsou spojeny s
30provedením jeho určité akce $a_m^i \in A_i$ za předpokladu, že ostatní agenti $R_j, j \in \{1 .. n \} / \{i\} $
31provedou akci $a_k^j \in A_j$. Matice je tedy $n$-dimenzionální, kde $n$ je počet agentů v systému, a sestává
32se z prvků $u^{R_i}_{a_k^1 ... a_l^i ... a_m^n}$, reprezentující zisky v dané situaci.
33\\
34K určení pravděpodobnosti provedení strategií ostatních agentů se definuje rekursivní modelová struktura. \cite{4_rmm_formalization}
35
36\begin{definition}[Rekursivní modelová struktura]\label{de:rms}
37 Rekursivní modelová struktura $RMS_{R_i}$ agenta $R_i$ je definována jako dvojice
38  $$ (P_{R_i}, RM_{R_i}) $$,
39 kde $P_{R_i}$ je matice zisků definovaná v \ref{de:payoff_matrix} a $RM_{R_i}$
40 je rekurzivní model \ref{de:rm}, který je použit k modelování rozhodování ostatních agentů.
41\end{definition}
42
43Rekursivní model je definován v \cite{4_rmm_formalization} takto:
44
45\begin{definition}[Rekursivní model]\label{de:rm}
46  Rekursivní model $MR_{R_i}$ agenta $R_i$ je definován jako $m$-tice dvojic \footnotemark
47  $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) )  $$ 
48  kde
49  $$ M^{(R_i, k )}_{\{-R_i\}} = ( M^{(R_i, k )}_{R_1}, ... , M^{(R_i, k )}_{R_{i-1}}, M^{(R_i, k )}_{R_{i+1}}, ... ,M^{(R_i, k )}_{R_n} )$$
50  představuje jednu z $m$ $(n-1)$-tic rozhodovacích modelů ostatních agentů a $p_i^k$ jeho subjektivní předpokládanou pravděpodobnost. 
51\end{definition}
52\footnotetext{$\{-R_i\}$ je zkrácený zápis množiny ostatních agentů $ \{R_1, ..., R_n\} / \{R_i\} $}
53
54$M^{(R_i, k )}_{R_j}$ je tedy jeden z možných modelů agenta $R_j$, který předpokládá agent $R_i$
55s pravděpodobností $p^{R_i}_k$. Platí samozřejmě podmínka $\sum_{k=1}^m p^{R_i}_k = 1$.
56\\
57Model $M^{(R_i, k )}_{R_j}$ se dá podle \cite{4_rmm_formalization} rozdělit do tří forem:
58
59\begin{itemize}
60 \item $IM^{(R_i, k )}_{R_j}$ - Recionální model
61 \item $NM^{(R_i, k )}_{R_j}$ - Neinformovaný model
62 \item $SM^{(R_i, k )}_{R_j}$ - Neracionální model
63\end{itemize}
64
65Recionální model odpovídá tomu, že agent $R_i$ předpokládá o agentovi $R_j$, že se chová racionálně.
66V \cite{4_rmm_formalization} je definován jako
67
68$$
69  IM^{(R_i, k )}_{R_j} = RMS_{R_j}^{(R_i, k)} \;,
70$$
71
72s parametry $p^{(R_i, k)}_{a^j_l}$ a $P_{R_j}^{(R_i, k)} $.
73$P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije.
74což je Rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá,
75že je agent $R_j$ použije k rozhodování.\\
76
77Neinformovaný model vychází z toho, že agent $R_i$ nemá o agentovi $R_j$ žádné informace, tudíž přiřadí každé
78akci $a^{R_j}_l$ pravděpodobnost $p^{(R_i, k)}_{a^j_l} = \frac{1}{|A_j|}$, kde $|A_j|$ je počet možných akcí agenta $R_j$,
79což odpovídá rovnoměrnému rozdělení.
80$p^{(R_i, k)}_{a^j_l}$ značí pravďěpodobnost, že podle agenta $R_i$ nastane v $k$-tém modelu agenta $R_j$ akce $a^j_l$.\\
81
82Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tompto případě modeluje
83podle situace pokaždé jinak.\\
84
85Systém se tedy rekurzivně rozvijí, dokud jsou dostupné informace. Pokud nejsou, rekurze skončí neinformovaným modelem
86s rovnoměrným rozdělením pravděpodobnosti všech akcí. Rekurze také může skončit iracionálním modelem, což ovšem není
87v našem případě příliš časté.
88
89\subsection{Rozhodovací algoritmus}
90
91Po zkonstruování rekurzivní modelové struktury se prochází tento systém od konce rekurze, kde jsou pravděpodobnosti
92známi, z důvodu ukončení rekurzivního rozvijení neinformovaným modelem. K výběru nejpravděpodobnější situace se používá
93tzv. užitečnosti. \cite{4_rmm_formalization}
94
95\begin{definition}[Užitečnost]\label{de:utility}
96  Užitečnost akce $a^i_m$ podle agenta $R_i$ je definována jako
97  $$ 
98  u^{R_i}_{a^i_m}  = 
99  \sum_{a^1_q \in A_1} ...
100  \sum_{a^{i-1}_v \in A_{i-1}}
101  \sum_{a^{i+1}_w \in A_{i+1}} ...
102  \sum_{a^n_x \in A_n}
103  ( p^{R_i}_{a^1_q} ... p^{R_i}_{a^{i-1}_v} p^{R_i}_{a^{i-1}_w} ...  p^{R_i}_{a^n_x}  u^{R_i}_{ a^1_q ... a^i_m ... a^n_x } ) \;,
104  $$
105  kde
106  $$ u^{R_i}_{ a^1_q ... a^n_x } $$ 
107  je prvek matice zisků $P_{R_i}$ a pravděpodobnost $ p^{R_i}_{a_o^j} $ je definována jako
108  $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} $$.
109 
110 
111\end{definition}
112
113kde $p^{R_i}_o$ je pravděpodobnost modelu z definice \ref{de:rm} a
114$p^{(R_i, o)}_{a_k^j} $ značí pravďěpodobnost, že podle agenta $R_i$ 
115nastane v $o$-tém modelu agenta $R_j$ akce $a^j_k$. V případě, že je algoritmus v bodě racionálního modelu,
116určí se tato hodnota rekurzivně, pokud je model neinformovaný, je rovna $\frac{1}{|A_j|}$.
117$ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený pravděpodobností modelu
118a $ u^{R_i}_{a^i_m} $ se definuje jako součet všech prvků matice zisků, kromě těch, které zahrnují jiné akce agenta
119$R_i$, než je $a_k^j$, vyvažený touto pravděpodobností.
120
Note: See TracBrowser for help on using the browser.