Show
Ignore:
Timestamp:
02/03/12 14:43:10 (12 years ago)
Author:
jabu
Message:

restrukturalizace

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex

    r1424 r1427  
    1 \subsection{Použití zpětnovazebného učení} 
    2  
    3 \subsubsection{Zpětnovazebné učení na základě modelu} 
     1\section{Použití zpětnovazebného učení} 
    42 
    53V \cite{3_i_traff_light_c} je popsána simulace používající 
     
    3028hodnot $Q$.\\ 
    3129 
    32 \subsection{Zhodnocení} 
    3330 
    34 Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 
    35 založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent 
    36 představuje pouze signální skupinu, jsou například v tom, že není potřeba 
    37 odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci 
    38 \cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť. 
    39 Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí. 
    40 Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování 
    41 tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů, 
    42 které jsou pro simulaci po dlouhou dobu optimalizovány a  
    43 jejichž nasazení značně zjednodušuje práci a urychluje vývoj. 
    44 Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a  
    45 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 
    46 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 
    47 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 
    48 Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití 
    49 zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení 
    50 i do způsobu žešení popsaných v dalších kapitolách. 
    5131