- Timestamp:
- 02/02/12 12:40:37 (13 years ago)
- Location:
- applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti
- Files:
-
- 2 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex
r1419 r1424 1 \s ection{Použití zpětnovazebného učení}1 \subsection{Použití zpětnovazebného učení} 2 2 3 \subs ection{Zpětnovazebné učení na základě modelu}3 \subsubsection{Zpětnovazebné učení na základě modelu} 4 4 5 5 V \cite{3_i_traff_light_c} je popsána simulace používající … … 30 30 hodnot $Q$.\\ 31 31 32 \subsection{Zhodnocení} 33 32 34 Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 33 35 založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent … … 43 45 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 44 46 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 45 proto je toto řešení pro reálné nasazení v dnešní době nepoužitelné. 46 47 47 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 48 Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití 49 zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení 50 i do způsobu žešení popsaných v dalších kapitolách. 48 51 -
applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex.backup
r1419 r1424 1 \section{Použití zpětnovazebného učení} 1 \subsection{Použití zpětnovazebného učení} 2 3 \subsubsection{Zpětnovazebné učení na základě modelu} 2 4 3 5 V \cite{3_i_traff_light_c} je popsána simulace používající … … 28 30 hodnot $Q$.\\ 29 31 32 \subsubsection{Zhodnocení} 33 30 34 Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci 31 35 založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent … … 38 42 které jsou pro simulaci po dlouhou dobu optimalizovány a 39 43 jejichž nasazení značně zjednodušuje práci a urychluje vývoj. 44 Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a 45 lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je 46 metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, 47 proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. 48 49 50 V článku \cite{3_i_traff_light_c} také není 40 51 41