Show
Ignore:
Timestamp:
02/04/12 00:54:24 (13 years ago)
Author:
jabu
Message:

finalni verze

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/novotny_vyzk_LQ/03_RMM/RMM.tex

    r1424 r1434  
    55v článku \cite{4_rmm_formalization} k modelování chování 
    66agentů ovládajících ostatní dopravní uzly, slouží k odhadu chování ostatních a gentů. 
    7 Akce každého agenta z pravidlo ovlivňuje do určité míry celý systém, tudíž 
    8 výběr strategie každého agenta závisí na předpokládaném chování ostatních 
    9 agentů. Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím, 
     7Akce každého agenta z pravidla ovlivňuje do určité míry celý systém, tudíž 
     8výběr strategie každého agenta závisí na předpokládaném chování ostatních.  
     9Tato metoda minimalizuje nutnost komunikace a vyjednávání o provedení jisté akce tím, 
    1010že každý agent je schopen modelovat rozhodnutí ostatních a podle známých parametrů 
    1111prostředí s určitou pravděpodobností stanovit jejich volbu. 
     
    2323  $A$ je množina množin $A_j = \{a_1^j, a_2^j, ...\}$ alternativních akcí agenta $R_j$.  
    2424  $A_j$ budeme nazývat rozhodovací prostor agenta $R_j$. 
    25   U je funkce  
     25  $U$ je funkce  
    2626  $$U : A_1 \times A_2 \times ... \times A_n \rightarrow \mathbb{R}$$ 
    2727  přiřazující hodnoty zisku všem kombinacím akcí všech agentů. 
     
    3232se z prvků $u^{R_i}_{a_k^1 ... a_l^i ... a_m^n}$, reprezentující zisky v dané situaci. 
    3333\\ 
    34 K určení pravděpodobnosti provedení strategií ostatních agentů se definuje rekursivní modelová struktura. \cite{4_rmm_formalization} 
     34K určení pravděpodobnosti provedení strategií ostatních agentů se v publikaci \cite{4_rmm_formalization} 
     35definuje rekursivní modelová struktura.  
    3536 
    3637\begin{definition}[Rekursivní modelová struktura]\label{de:rms} 
    3738 Rekursivní modelová struktura $RMS_{R_i}$ agenta $R_i$ je definována jako dvojice 
    38   $$ (P_{R_i}, RM_{R_i}) $$, 
     39  $$ (P_{R_i}, RM_{R_i}) \;,$$ 
    3940 kde $P_{R_i}$ je matice zisků definovaná v \ref{de:payoff_matrix} a $RM_{R_i}$ 
    4041 je rekurzivní model \ref{de:rm}, který je použit k modelování rozhodování ostatních agentů.  
     
    4546\begin{definition}[Rekursivní model]\label{de:rm} 
    4647  Rekursivní model $MR_{R_i}$ agenta $R_i$ je definován jako $m$-tice dvojic \footnotemark 
    47   $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) ) $$  
     48  $$ MR_{R_i} = ( (p^{R_i}_1, M^{(R_i, 1)}_{\{-R_i\}}), ... ,(p^{R_i}_m, M^{(R_i, m)}_{\{-R_i\}}) ) \;, $$  
    4849  kde 
    4950  $$ M^{(R_i, k )}_{\{-R_i\}} = ( M^{(R_i, k )}_{R_1}, ... , M^{(R_i, k )}_{R_{i-1}}, M^{(R_i, k )}_{R_{i+1}}, ... ,M^{(R_i, k )}_{R_n} )$$ 
     
    7172 
    7273s parametry $p^{(R_i, k)}_{a^j_l}$ a $P_{R_j}^{(R_i, k)} $. 
    73 $P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije. 
    74 což je Rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá, 
     74$P_{R_j}^{(R_i, k)} $ je matice zisků, kterou podle agenta $R_i$ v modelu $k$ agent $R_j$ použije, 
     75což je rekurzivní modelové struktura s $k$-tými daty, o kterých agent $R_i$ předpokládá, 
    7576že je agent $R_j$ použije k rozhodování.\\ 
    7677 
     
    8081$p^{(R_i, k)}_{a^j_l}$ značí pravďěpodobnost, že podle agenta $R_i$ nastane v $k$-tém modelu agenta $R_j$ akce $a^j_l$.\\ 
    8182 
    82 Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tompto případě modeluje  
     83Neracionální model odpovídá tomu, že se agent $A_j$ chová iracionálně. Chování se v tomto případě modeluje  
    8384podle situace pokaždé jinak.\\ 
    8485 
     
    106107  $$ u^{R_i}_{ a^1_q ... a^n_x } $$  
    107108  je prvek matice zisků $P_{R_i}$ a pravděpodobnost $ p^{R_i}_{a_o^j} $ je definována jako 
    108   $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} $$.  
    109    
    110    
     109  $$ p^{R_i}_{a_k^j} = \sum_{o} p^{R_i}_o p^{(R_i, o)}_{a_k^j} \;,$$ 
    111110\end{definition} 
    112  
    113111kde $p^{R_i}_o$ je pravděpodobnost modelu z definice \ref{de:rm} a  
    114112$p^{(R_i, o)}_{a_k^j} $ značí pravďěpodobnost, že podle agenta $R_i$  
    115113nastane v $o$-tém modelu agenta $R_j$ akce $a^j_k$. V případě, že je algoritmus v bodě racionálního modelu, 
    116114určí se tato hodnota rekurzivně, pokud je model neinformovaný, je rovna $\frac{1}{|A_j|}$. 
    117 $ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený pravděpodobností modelu 
     115$ p^{R_i}_{a_k^j}$ je tedy součet pravděpodobností dané akce v modelu vyvážený jeho pravděpodobností 
    118116a $ u^{R_i}_{a^i_m} $ se definuje jako součet všech prvků matice zisků, kromě těch, které zahrnují jiné akce agenta  
    119117$R_i$, než je $a_k^j$, vyvažený touto pravděpodobností.