Changeset 1434 for applications/doprava/texty/novotny_vyzk_LQ/03_RMM
- Timestamp:
- 02/04/12 00:54:24 (13 years ago)
- Files:
-
- 1 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/novotny_vyzk_LQ/03_RMM/RMM.tex
r1424 r1434 5 5 v článku \cite{4_rmm_formalization} k modelování chování 6 6 agentů ovládajících ostatní dopravní uzly, slouží k odhadu chování ostatních a gentů. 7 Akce každého agenta z pravidl oovlivňuje do určité míry celý systém, tudíž8 výběr strategie každého agenta závisí na předpokládaném chování ostatních 9 agentů.Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím,7 Akce každého agenta z pravidla ovlivňuje do určité míry celý systém, tudíž 8 výběr strategie každého agenta závisí na předpokládaném chování ostatních. 9 Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím, 10 10 že každý agent je schopen modelovat rozhodnutí ostatních a podle známých parametrů 11 11 prostředí s určitou pravděpodobností stanovit jejich volbu. … … 23 23 $A$ je množina množin $A_j = \{a_1^j, a_2^j, ...\}$ alternativních akcí agenta $R_j$. 24 24 $A_j$ budeme nazývat rozhodovací prostor agenta $R_j$. 25 Uje funkce25 $U$ je funkce 26 26 $$U : A_1 \times A_2 \times ... \times A_n \rightarrow \mathbb{R}$$ 27 27 přiřazující hodnoty zisku všem kombinacím akcí všech agentů. … … 32 32 se z prvků $u^{R_i}_{a_k^1 ... a_l^i ... a_m^n}$, reprezentující zisky v dané situaci. 33 33 \\ 34 K určení pravděpodobnosti provedení strategií ostatních agentů se definuje rekursivní modelová struktura. \cite{4_rmm_formalization} 34 K určení pravděpodobnosti provedení strategií ostatních agentů se v publikaci \cite{4_rmm_formalization} 35 definuje rekursivní modelová struktura. 35 36 36 37 \begin{definition}[Rekursivní modelová struktura]\label{de:rms} 37 38 Rekursivní modelová struktura $RMS_{R_i}$ agenta $R_i$ je definována jako dvojice 38 $$ (P_{R_i}, RM_{R_i}) $$,39 $$ (P_{R_i}, RM_{R_i}) \;,$$ 39 40 kde $P_{R_i}$ je matice zisků definovaná v \ref{de:payoff_matrix} a $RM_{R_i}$ 40 41 je rekurzivní model \ref{de:rm}, který je použit k modelování rozhodování ostatních agentů. … … 45 46 \begin{definition}[Rekursivní model]\label{de:rm} 46 47 Rekursivní model $MR_{R_i}$ agenta $R_i$ je definován jako $m$-tice dvojic \footnotemark 47 $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) ) $$48 $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) ) \;, $$ 48 49 kde 49 50 $$ M^{(R_i, k )}_{\{-R_i\}} = ( M^{(R_i, k )}_{R_1}, ... , M^{(R_i, k )}_{R_{i-1}}, M^{(R_i, k )}_{R_{i+1}}, ... ,M^{(R_i, k )}_{R_n} )$$ … … 71 72 72 73 s parametry $p^{(R_i, k)}_{a^j_l}$ a $P_{R_j}^{(R_i, k)} $. 73 $P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije .74 což je Rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá,74 $P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije, 75 což je rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá, 75 76 že je agent $R_j$ použije k rozhodování.\\ 76 77 … … 80 81 $p^{(R_i, k)}_{a^j_l}$ značí pravďěpodobnost, že podle agenta $R_i$ nastane v $k$-tém modelu agenta $R_j$ akce $a^j_l$.\\ 81 82 82 Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tom pto případě modeluje83 Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tomto případě modeluje 83 84 podle situace pokaždé jinak.\\ 84 85 … … 106 107 $$ u^{R_i}_{ a^1_q ... a^n_x } $$ 107 108 je prvek matice zisků $P_{R_i}$ a pravděpodobnost $ p^{R_i}_{a_o^j} $ je definována jako 108 $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} $$. 109 110 109 $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} \;,$$ 111 110 \end{definition} 112 113 111 kde $p^{R_i}_o$ je pravděpodobnost modelu z definice \ref{de:rm} a 114 112 $p^{(R_i, o)}_{a_k^j} $ značí pravďěpodobnost, že podle agenta $R_i$ 115 113 nastane v $o$-tém modelu agenta $R_j$ akce $a^j_k$. V případě, že je algoritmus v bodě racionálního modelu, 116 114 určí se tato hodnota rekurzivně, pokud je model neinformovaný, je rovna $\frac{1}{|A_j|}$. 117 $ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený pravděpodobností modelu115 $ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený jeho pravděpodobností 118 116 a $ u^{R_i}_{a^i_m} $ se definuje jako součet všech prvků matice zisků, kromě těch, které zahrnují jiné akce agenta 119 117 $R_i$, než je $a_k^j$, vyvažený touto pravděpodobností.