Show
Ignore:
Timestamp:
02/02/12 12:40:37 (12 years ago)
Author:
jabu
Message:

Prvni verze bez vysledku

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex

    r1419 r1424  
    1 \section{Použití zpětnovazebného učení} 
     1\subsection{Použití zpětnovazebného učení} 
    22 
    3 \subsection{Zpětnovazebné učení na základě modelu} 
     3\subsubsection{Zpětnovazebné učení na základě modelu} 
    44 
    55V \cite{3_i_traff_light_c} je popsána simulace používající 
     
    3030hodnot $Q$.\\ 
    3131 
     32\subsection{Zhodnocení} 
     33 
    3234Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 
    3335založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent 
     
    4345lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 
    4446metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 
    45 proto je toto řešení pro reálné nasazení v dnešní době nepoužitelné. 
    46  
    47  
     47proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 
     48Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití 
     49zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení 
     50i do způsobu žešení popsaných v dalších kapitolách. 
    4851