Context Navigation

Reinforcement_learning_pouziti.tex

Timestamp:

02/02/12 12:40:37 (12 years ago)

Author:

jabu

Message:

Prvni verze bez vysledku

Files:

r1419	r1424
1		\section{Použití zpětnovazebného učení}
	1	\subsection{Použití zpětnovazebného učení}
2	2
3		\subsection{Zpětnovazebné učení na základě modelu}
	3	\subsubsection{Zpětnovazebné učení na základě modelu}
4	4
5	5	V \cite{3_i_traff_light_c} je popsána simulace používající
…	…
30	30	hodnot $Q$.\\
31	31
	32	\subsection{Zhodnocení}
	33
32	34	Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci
33	35	založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent
…	…
43	45	lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je
44	46	metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná,
45		proto je toto řešení pro reálné nasazení v dnešní době nepoužitelné.
46
47
	47	proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné.
	48	Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití
	49	zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení
	50	i do způsobu žešení popsaných v dalších kapitolách.
48	51