Show
Ignore:
Timestamp:
02/04/12 00:54:24 (13 years ago)
Author:
jabu
Message:

finalni verze

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/novotny_vyzk_LQ/Pouziti/Pouziti.tex

    r1433 r1434  
    88\subsection{Použití LQ řízení ve strategii TUC} \label{sec:lq_tuc} 
    99LQ řízení bylo použito v \cite{6_tuc_lq} k nalezení optimální délky zelených v systému  
    10 13-ti signálních skupin. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$  
     1013-ti křižovatek. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$  
    1111spojující křižovatky $M$ a $N$. Účelem strategie je nalezení optimální délky zelených 
    1212$g$, $g_{N,i}$ značí délku zelené na signální skupiny křižovatky $N$ zprůjezdňující 
     
    3030je to tedy součet úbytků vozidel z ramen ústících do křižovatky $N$ vynásobených 
    3131koeficinety $t_{k,i}$, což jsou odbočovací poměry z ramene $k$ do ramene $i$. 
    32 V podovném tvaru se předpokládá $s_i(t)$ 
     32V podobném tvaru se předpokládá $s_i(t)$ 
    3333\begin{equation} 
    3434s_i(t) = t_{i,0} q_i(t) \;, 
     
    6969 
    7070\subsubsection{Kvadratické kritérium} 
    71 Účelem lagoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$ 
     71Účelem algoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$ 
    7272a penalizovat změnu délky trvání zelené oproti nominálním hodnotám. 
    7373Kvadratické kritérium optimálního řízení \ref{eq_quadratic_criterion} jetedy v \cite{6_tuc_lq} 
     
    9797Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 
    9898založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent 
    99 představuje pouze signální skupinu, jsou například v tom, že není potřeba 
     99představuje pouze ovládací prvek křižovatky, jsou například v tom, že není potřeba 
    100100odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci 
    101101\cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť. 
    102 Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí. 
     102Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí.\\ 
     103 
    103104Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování 
    104 tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů, 
    105 které jsou pro simulaci po dlouhou dobu optimalizovány a  
    106 jejichž nasazení značně zjednodušuje práci a urychluje vývoj. 
     105tento způsob znesnadňuje či úplně znemožňuje použít celou řadu dopravních simulátorů. 
    107106Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a  
    108 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 
    109 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 
    110 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 
     107lze nastavovat pouze vnější parametry, jako jsou délka cyklu a offset, je 
     108metoda, která potřebuje okamžitou změnu signalizace, naprosto nevhodná. 
     109Proto je toto řešení pro reálné nasazení v dnešní době jen obtížně použitelné.\\ 
     110 
    111111Pro použití zpětnovazebného učení obecně bychom museli problematiku 
    112 řízen délky cyklu diskretizovat a rozumně volit dimenzionalitu problému. 
     112řízení délky cyklu diskretizovat. Zpětnovazebné učení je metoda pracující  
     113s malým konečným počtem stavů a akcí. Zde jsou to akce nastavit jako průjezdný a  
     114nastavit jako neprůjezdný. V případě nastavování hodnot délky cyklu by neúnosně 
     115vzrostla dimenzionalita problému. 
    113116 
    114117\subsection{RMM a Bayesova učení} 
     
    117120způsob, jak hodnotit jejich užitečnost. Proto je tato metoda jen obtížně reprodukovatelná, 
    118121modifikovatelná či dále rozvinutelná. V naší situaci popsanné v dalších kapitolách také není nutné 
    119 modelovat chování agentů, neboť je možné ho vykomunikovat pomocí posílaných zpráv. V případě 
     122modelovat chování agentů, neboť ho můžeme zjistit pomocí posílaných zpráv. V případě 
    120123reálného nasazení by však bylo možné vylepšení zapojením RMM pro odhad chování agenta 
    121 pokud by nastal výpadek spojení nebo podobná situace. 
     124pokud by nastal výpadek spojení nebo podobná situace.\\ 
     125 
     126Bayesovske učení je velice účinná metoda ke stanovování pravděpodobností jistých situací 
     127a dala by se do budoucna zřejmě použít na stanovování odhadu dílčích parametrů, 
     128jako jsou poměry odbočení. 
    122129 
    123130\subsection{LQ řízení}