Changeset 1424 for applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex
- Timestamp:
- 02/02/12 12:40:37 (12 years ago)
- Files:
-
- 1 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex
r1419 r1424 1 \s ection{Použití zpětnovazebného učení}1 \subsection{Použití zpětnovazebného učení} 2 2 3 \subs ection{Zpětnovazebné učení na základě modelu}3 \subsubsection{Zpětnovazebné učení na základě modelu} 4 4 5 5 V \cite{3_i_traff_light_c} je popsána simulace používající … … 30 30 hodnot $Q$.\\ 31 31 32 \subsection{Zhodnocení} 33 32 34 Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 33 35 založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent … … 43 45 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 44 46 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 45 proto je toto řešení pro reálné nasazení v dnešní době nepoužitelné. 46 47 47 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 48 Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití 49 zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení 50 i do způsobu žešení popsaných v dalších kapitolách. 48 51