Context Navigation

← Previous Change
Next Change →

Reinforcement_learning_pouziti

Timestamp:

02/03/12 14:43:10 (14 years ago)

Author:

jabu

Message:

restrukturalizace

Files:

: 1 modified

applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex (modified) (2 diffs)

Legend:

: Unmodified
: Added
: Removed

applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex

r1424	r1427
1		\subsection{Použití zpětnovazebného učení}
2
3		\subsubsection{Zpětnovazebné učení na základě modelu}
	1	\section{Použití zpětnovazebného učení}
4	2
5	3	V \cite{3_i_traff_light_c} je popsána simulace používající
…	…
30	28	hodnot $Q$.\\
31	29
32		~~\subsection{Zhodnocení}~~
33	30
34		~~Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci~~
35		~~založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent~~
36		~~představuje pouze signální skupinu, jsou například v tom, že není potřeba~~
37		~~odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci~~
38		~~\cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť.~~
39		~~Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí.~~
40		~~Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování~~
41		~~tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů,~~
42		~~které jsou pro simulaci po dlouhou dobu optimalizovány a~~
43		~~jejichž nasazení značně zjednodušuje práci a urychluje vývoj.~~
44		~~Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a~~
45		~~lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je~~
46		~~metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná,~~
47		~~proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné.~~
48		~~Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití~~
49		~~zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení~~
50		~~i do způsobu žešení popsaných v dalších kapitolách.~~
51	31

Context Navigation

Changeset 1427 for applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti

Legend:

applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex

Download in other formats: