Show
Ignore:
Timestamp:
02/03/12 14:43:10 (12 years ago)
Author:
jabu
Message:

restrukturalizace

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • applications/doprava/texty/novotny_vyzk_LQ/Reinforcement_learning.tex

    r1424 r1427  
     1\section{Zpětnovazebné učení} 
    12 
    2  
    3 \section{Markovův rozhodvací proces} 
     3\subsection{Markovův rozhodvací proces} 
    44Markovův rozhodvací proces je alternativní metoda sloužící 
    55k volbě strategií odhadem zisků z nich plynoucích do budoucna. 
     
    2929 
    3030 
    31 \subsubsection{Dynamické programování}\label{sec:dynamic_programming} 
     31\subsection{Dynamické programování}\label{sec:dynamic_programming} 
    3232 
    3333%asi trochu poupravit podle \cite{tlc_using_sarsa} 
     
    123123 
    124124 
    125 \subsection{Učení na základě modelu (Model-based learning)}\label{sec:model_based_learning} 
     125\subsubsection{Učení na základě modelu (Model-based learning)}\label{sec:model_based_learning} 
    126126V této metodě, popsané v \cite{3_i_traff_light_c}, se modeluje 
    127127prostředí funkcemi $P(i,a,j)$ a $R(i,a,j)$, které jsou definované v