- Timestamp:
- 02/04/12 00:54:24 (13 years ago)
- Files:
-
- 1 modified
Legend:
- Unmodified
- Added
- Removed
-
applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning_pouziti/Reinforcement_learning_pouziti.tex
r1429 r1434 3 3 V \cite{3_i_traff_light_c} je popsána simulace používající 4 4 zpětnovazebné učení na základě modelu popsané v \ref{sec:model_based_learning}. 5 Na rozdíl od ezperimentu popsaného v předchozí kapitole zde autoři zvolili 5 Autoři zde zvolili poměrně netradiční 6 6 variantu, kde existují 2 druhy agentů: agent-vozidlo a agent-křižovatka. 7 7 Agent-vozidlo má v každý časový krok následující parametry definující jeho stav,