1 | \section{RMM - Rekurzivní modelové metody} |
---|
2 | |
---|
3 | |
---|
4 | Rekurzivní modelová metoda, která byla použita |
---|
5 | v článku \cite{4_rmm_formalization} k modelování chování |
---|
6 | agentů ovládajících ostatní dopravní uzly, slouží k odhadu chování ostatních a gentů. |
---|
7 | Akce každého agenta z pravidlo ovlivňuje do určité míry celý systém, tudíž |
---|
8 | výběr strategie každého agenta závisí na předpokládaném chování ostatních |
---|
9 | agentů. Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím, |
---|
10 | že každý agent je schopen modelovat rozhodnutí ostatních a podle známých parametrů |
---|
11 | prostředí s určitou pravděpodobností stanovit jejich volbu. |
---|
12 | |
---|
13 | |
---|
14 | |
---|
15 | \subsection{Formální definice} |
---|
16 | |
---|
17 | Základním stavebním kamenem RMM je matice zisků agenta, Definovaná v souladu s teorií her v \cite{4_rmm_formalization} |
---|
18 | |
---|
19 | \begin{definition}[Matice zisků]\label{de:payoff_matrix} |
---|
20 | Matice zisků $P_{R_i}$ agenta $R_i$ je definována trojicí |
---|
21 | $$(R, A, U)$$ |
---|
22 | kde $R$ je množina všech agentů v systému, |
---|
23 | $A$ je množina množin $A_j = \{a_1^j, a_2^j, ...\}$ alternativních akcí agenta $R_j$. |
---|
24 | $A_j$ budeme nazývat rozhodovací prostor agenta $R_j$. |
---|
25 | U je funkce |
---|
26 | $$U : A_1 \times A_2 \times ... \times A_n \rightarrow \mathbb{R}$$ |
---|
27 | přiřazující hodnoty zisku všem kombinacím akcí všech agentů. |
---|
28 | \end{definition} |
---|
29 | Každý agent provádí danou akci z nějakého důvodu. Zisky agenta $R_i$ jsou spojeny s |
---|
30 | provedením jeho určité akce $a_m^i \in A_i$ za předpokladu, že ostatní agenti $R_j, j \in \{1 .. n \} / \{i\} $ |
---|
31 | provedou akci $a_k^j \in A_j$. Matice je tedy $n$-dimenzionální, kde $n$ je počet agentů v systému, a sestává |
---|
32 | se z prvků $u^{R_i}_{a_k^1 ... a_l^i ... a_m^n}$, reprezentující zisky v dané situaci. |
---|
33 | \\ |
---|
34 | K určení pravděpodobnosti provedení strategií ostatních agentů se definuje rekursivní modelová struktura. \cite{4_rmm_formalization} |
---|
35 | |
---|
36 | \begin{definition}[Rekursivní modelová struktura]\label{de:rms} |
---|
37 | Rekursivní modelová struktura $RMS_{R_i}$ agenta $R_i$ je definována jako dvojice |
---|
38 | $$ (P_{R_i}, RM_{R_i}) $$, |
---|
39 | kde $P_{R_i}$ je matice zisků definovaná v \ref{de:payoff_matrix} a $RM_{R_i}$ |
---|
40 | je rekurzivní model \ref{de:rm}, který je použit k modelování rozhodování ostatních agentů. |
---|
41 | \end{definition} |
---|
42 | |
---|
43 | Rekursivní model je definován v \cite{4_rmm_formalization} takto: |
---|
44 | |
---|
45 | \begin{definition}[Rekursivní model]\label{de:rm} |
---|
46 | Rekursivní model $MR_{R_i}$ agenta $R_i$ je definován jako $m$-tice dvojic \footnotemark |
---|
47 | $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) ) $$ |
---|
48 | kde |
---|
49 | $$ M^{(R_i, k )}_{\{-R_i\}} = ( M^{(R_i, k )}_{R_1}, ... , M^{(R_i, k )}_{R_{i-1}}, M^{(R_i, k )}_{R_{i+1}}, ... ,M^{(R_i, k )}_{R_n} )$$ |
---|
50 | představuje jednu z $m$ $(n-1)$-tic rozhodovacích modelů ostatních agentů a $p_i^k$ jeho subjektivní předpokládanou pravděpodobnost. |
---|
51 | \end{definition} |
---|
52 | \footnotetext{$\{-R_i\}$ je zkrácený zápis množiny ostatních agentů $ \{R_1, ..., R_n\} / \{R_i\} $} |
---|
53 | |
---|
54 | $M^{(R_i, k )}_{R_j}$ je tedy jeden z možných modelů agenta $R_j$, který předpokládá agent $R_i$ |
---|
55 | s pravděpodobností $p^{R_i}_k$. Platí samozřejmě podmínka $\sum_{k=1}^m p^{R_i}_k = 1$. |
---|
56 | \\ |
---|
57 | Model $M^{(R_i, k )}_{R_j}$ se dá podle \cite{4_rmm_formalization} rozdělit do tří forem: |
---|
58 | |
---|
59 | \begin{itemize} |
---|
60 | \item $IM^{(R_i, k )}_{R_j}$ - Recionální model |
---|
61 | \item $NM^{(R_i, k )}_{R_j}$ - Neinformovaný model |
---|
62 | \item $SM^{(R_i, k )}_{R_j}$ - Neracionální model |
---|
63 | \end{itemize} |
---|
64 | |
---|
65 | Recionální model odpovídá tomu, že agent $R_i$ předpokládá o agentovi $R_j$, že se chová racionálně. |
---|
66 | V \cite{4_rmm_formalization} je definován jako |
---|
67 | |
---|
68 | $$ |
---|
69 | IM^{(R_i, k )}_{R_j} = RMS_{R_j}^{(R_i, k)} \;, |
---|
70 | $$ |
---|
71 | |
---|
72 | s parametry $p^{(R_i, k)}_{a^j_l}$ a $P_{R_j}^{(R_i, k)} $. |
---|
73 | $P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije. |
---|
74 | což je Rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá, |
---|
75 | že je agent $R_j$ použije k rozhodování.\\ |
---|
76 | |
---|
77 | Neinformovaný model vychází z toho, že agent $R_i$ nemá o agentovi $R_j$ žádné informace, tudíž přiřadí každé |
---|
78 | akci $a^{R_j}_l$ pravděpodobnost $p^{(R_i, k)}_{a^j_l} = \frac{1}{|A_j|}$, kde $|A_j|$ je počet možných akcí agenta $R_j$, |
---|
79 | což odpovídá rovnoměrnému rozdělení. |
---|
80 | $p^{(R_i, k)}_{a^j_l}$ značí pravďěpodobnost, že podle agenta $R_i$ nastane v $k$-tém modelu agenta $R_j$ akce $a^j_l$.\\ |
---|
81 | |
---|
82 | Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tompto případě modeluje |
---|
83 | podle situace pokaždé jinak.\\ |
---|
84 | |
---|
85 | Systém se tedy rekurzivně rozvijí, dokud jsou dostupné informace. Pokud nejsou, rekurze skončí neinformovaným modelem |
---|
86 | s rovnoměrným rozdělením pravděpodobnosti všech akcí. Rekurze také může skončit iracionálním modelem, což ovšem není |
---|
87 | v našem případě příliš časté. |
---|
88 | |
---|
89 | \subsection{Rozhodovací algoritmus} |
---|
90 | |
---|
91 | Po zkonstruování rekurzivní modelové struktury se prochází tento systém od konce rekurze, kde jsou pravděpodobnosti |
---|
92 | známi, z důvodu ukončení rekurzivního rozvijení neinformovaným modelem. K výběru nejpravděpodobnější situace se používá |
---|
93 | tzv. užitečnosti. \cite{4_rmm_formalization} |
---|
94 | |
---|
95 | \begin{definition}[Užitečnost]\label{de:utility} |
---|
96 | Užitečnost akce $a^i_m$ podle agenta $R_i$ je definována jako |
---|
97 | $$ |
---|
98 | u^{R_i}_{a^i_m} = |
---|
99 | \sum_{a^1_q \in A_1} ... |
---|
100 | \sum_{a^{i-1}_v \in A_{i-1}} |
---|
101 | \sum_{a^{i+1}_w \in A_{i+1}} ... |
---|
102 | \sum_{a^n_x \in A_n} |
---|
103 | ( p^{R_i}_{a^1_q} ... p^{R_i}_{a^{i-1}_v} p^{R_i}_{a^{i-1}_w} ... p^{R_i}_{a^n_x} u^{R_i}_{ a^1_q ... a^i_m ... a^n_x } ) \;, |
---|
104 | $$ |
---|
105 | kde |
---|
106 | $$ u^{R_i}_{ a^1_q ... a^n_x } $$ |
---|
107 | je prvek matice zisků $P_{R_i}$ a pravděpodobnost $ p^{R_i}_{a_o^j} $ je definována jako |
---|
108 | $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} $$. |
---|
109 | |
---|
110 | |
---|
111 | \end{definition} |
---|
112 | |
---|
113 | kde $p^{R_i}_o$ je pravděpodobnost modelu z definice \ref{de:rm} a |
---|
114 | $p^{(R_i, o)}_{a_k^j} $ značí pravďěpodobnost, že podle agenta $R_i$ |
---|
115 | nastane v $o$-tém modelu agenta $R_j$ akce $a^j_k$. V případě, že je algoritmus v bodě racionálního modelu, |
---|
116 | určí se tato hodnota rekurzivně, pokud je model neinformovaný, je rovna $\frac{1}{|A_j|}$. |
---|
117 | $ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený pravděpodobností modelu |
---|
118 | a $ u^{R_i}_{a^i_m} $ se definuje jako součet všech prvků matice zisků, kromě těch, které zahrnují jiné akce agenta |
---|
119 | $R_i$, než je $a_k^j$, vyvažený touto pravděpodobností. |
---|
120 | |
---|