Changeset 1434 for applications/doprava/texty/novotny_vyzk_LQ/Pouziti
- Timestamp:
- 02/04/12 00:54:24 (13 years ago)
- Files:
-
- 1 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/novotny_vyzk_LQ/Pouziti/Pouziti.tex
r1433 r1434 8 8 \subsection{Použití LQ řízení ve strategii TUC} \label{sec:lq_tuc} 9 9 LQ řízení bylo použito v \cite{6_tuc_lq} k nalezení optimální délky zelených v systému 10 13-ti signálních skupin. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$10 13-ti křižovatek. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$ 11 11 spojující křižovatky $M$ a $N$. Účelem strategie je nalezení optimální délky zelených 12 12 $g$, $g_{N,i}$ značí délku zelené na signální skupiny křižovatky $N$ zprůjezdňující … … 30 30 je to tedy součet úbytků vozidel z ramen ústících do křižovatky $N$ vynásobených 31 31 koeficinety $t_{k,i}$, což jsou odbočovací poměry z ramene $k$ do ramene $i$. 32 V podo vném tvaru se předpokládá $s_i(t)$32 V podobném tvaru se předpokládá $s_i(t)$ 33 33 \begin{equation} 34 34 s_i(t) = t_{i,0} q_i(t) \;, … … 69 69 70 70 \subsubsection{Kvadratické kritérium} 71 Účelem lagoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$71 Účelem algoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$ 72 72 a penalizovat změnu délky trvání zelené oproti nominálním hodnotám. 73 73 Kvadratické kritérium optimálního řízení \ref{eq_quadratic_criterion} jetedy v \cite{6_tuc_lq} … … 97 97 Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 98 98 založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent 99 představuje pouze signální skupinu, jsou například v tom, že není potřeba99 představuje pouze ovládací prvek křižovatky, jsou například v tom, že není potřeba 100 100 odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci 101 101 \cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť. 102 Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí. 102 Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí.\\ 103 103 104 Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování 104 tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů, 105 které jsou pro simulaci po dlouhou dobu optimalizovány a 106 jejichž nasazení značně zjednodušuje práci a urychluje vývoj. 105 tento způsob znesnadňuje či úplně znemožňuje použít celou řadu dopravních simulátorů. 107 106 Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a 108 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 109 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 110 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 107 lze nastavovat pouze vnější parametry, jako jsou délka cyklu a offset, je 108 metoda, která potřebuje okamžitou změnu signalizace, naprosto nevhodná. 109 Proto je toto řešení pro reálné nasazení v dnešní době jen obtížně použitelné.\\ 110 111 111 Pro použití zpětnovazebného učení obecně bychom museli problematiku 112 řízen délky cyklu diskretizovat a rozumně volit dimenzionalitu problému. 112 řízení délky cyklu diskretizovat. Zpětnovazebné učení je metoda pracující 113 s malým konečným počtem stavů a akcí. Zde jsou to akce nastavit jako průjezdný a 114 nastavit jako neprůjezdný. V případě nastavování hodnot délky cyklu by neúnosně 115 vzrostla dimenzionalita problému. 113 116 114 117 \subsection{RMM a Bayesova učení} … … 117 120 způsob, jak hodnotit jejich užitečnost. Proto je tato metoda jen obtížně reprodukovatelná, 118 121 modifikovatelná či dále rozvinutelná. V naší situaci popsanné v dalších kapitolách také není nutné 119 modelovat chování agentů, neboť je možné ho vykomunikovat pomocí posílaných zpráv. V případě122 modelovat chování agentů, neboť ho můžeme zjistit pomocí posílaných zpráv. V případě 120 123 reálného nasazení by však bylo možné vylepšení zapojením RMM pro odhad chování agenta 121 pokud by nastal výpadek spojení nebo podobná situace. 124 pokud by nastal výpadek spojení nebo podobná situace.\\ 125 126 Bayesovske učení je velice účinná metoda ke stanovování pravděpodobností jistých situací 127 a dala by se do budoucna zřejmě použít na stanovování odhadu dílčích parametrů, 128 jako jsou poměry odbočení. 122 129 123 130 \subsection{LQ řízení}