| 1 | \section{Bayesovské učení} \label{sec:bayes} |
|---|
| 2 | |
|---|
| 3 | % \subsection{Úvod} |
|---|
| 4 | V této kapitole je naznačena metoda bayesovského učení, |
|---|
| 5 | což je bodový odhadu parametru rozdělení náhodné veličiny |
|---|
| 6 | založený na Bayesově větě. |
|---|
| 7 | Tato metoda byla použita v článku \cite{4_rmm_formalization} ke zlepšení |
|---|
| 8 | odhadu pravděpodobnosti uskutečnění se modelového chování ostatních agentů, |
|---|
| 9 | což bude popsáno v kapitole \ref{sec:rmm_bayes_pouziti}. |
|---|
| 10 | Jeho výhodou je využití experimentální i expertní znalosti. |
|---|
| 11 | V praxi se této metody hojně využívá tam, kde jsou data získávána postupně a zpočátku je nutné parametr |
|---|
| 12 | odhadnout na základě zkušenosti a nadále ho podle výsledků měření zpřesňovat. |
|---|
| 13 | |
|---|
| 14 | \begin{definition}[Podmíněná pravděpodobnost]\label{de:podm_pravd} |
|---|
| 15 | Nechť $A$ a $B$ jsou náhodné jevy. Podmíněná pravděpodobnost jevu $A$ na jevu $B$, tedy pravděpodobnost že nastane |
|---|
| 16 | jev $A$ pokud nastane jev $B$, je definována jako |
|---|
| 17 | $$ P(A|B) = \frac{P(A \cap B )}{P(B)} $$ |
|---|
| 18 | \end{definition} |
|---|
| 19 | |
|---|
| 20 | \begin{proposition}[Bayesova věta]\label{v:bayes} |
|---|
| 21 | Nechť $A$ a $B$ jsou náhodné jevy a platí $P(B) > 0$. Potom |
|---|
| 22 | $$ P(A|B) = \frac{P(B|A) P(A) }{P(B)} $$ |
|---|
| 23 | \end{proposition} |
|---|
| 24 | |
|---|
| 25 | % \subsubsection{Značení} |
|---|
| 26 | |
|---|
| 27 | V souladu s \cite{5_bayes_learn} zavedeme následující značení: |
|---|
| 28 | |
|---|
| 29 | \begin{itemize} |
|---|
| 30 | \item $y(t) = [ y_1, ..., y_T ] $ - vetor $T \in \mathbb{N}$ naměřených hodnot, kde $y_t \in \{ 0,1 \}$ a $y_t = 1$ značí, |
|---|
| 31 | že výsledek experimentu v čase $t \in \{ 1, ..., T \}$ dopadl v souladu s naší hypotézou |
|---|
| 32 | \item $\Theta$ - parametr rozdělení |
|---|
| 33 | \item $ \hat{\Theta}_{T} $ - odhad parametru při $T$ naměřených hodnotách |
|---|
| 34 | \item $f(y_t|\Theta)$ - hustota pravděpodobnosti náhodné veličiny v čase $t$ při parametru $\Theta$ |
|---|
| 35 | \end{itemize} |
|---|
| 36 | |
|---|
| 37 | \subsection{Věrohodnostní funkce} |
|---|
| 38 | |
|---|
| 39 | K odhadu parametru se v této metodě využívá věrohodnostní funkce, která vyjadřuje |
|---|
| 40 | pravděpodobnost, že při daném parametru se bude vektor naměřených výsledků rovnat |
|---|
| 41 | teoretické hodnotě. V publikaci \cite{5_bayes_learn} se tato funkce definuje jako: |
|---|
| 42 | |
|---|
| 43 | |
|---|
| 44 | \begin{definition}[Věrohodnostní funkce]\label{de:ver_fce}\footnotemark |
|---|
| 45 | $$f(y(T)|\Theta) = \prod_{t=1}^T f(y_t|\Theta) $$ |
|---|
| 46 | \end{definition} |
|---|
| 47 | |
|---|
| 48 | \footnotetext{Tato definice je poněkud zjednodušena a předpokládá, že výsledek $t$-tého pokusu nezávisí na |
|---|
| 49 | předchozích pokusech, ani na počátečních podmínkách před $t$-tým pokusem.} |
|---|
| 50 | |
|---|
| 51 | Při použití těchtu veličin nabývá Bayesova věta podle \cite{5_bayes_learn} tvaru |
|---|
| 52 | |
|---|
| 53 | $$ f(\Theta|y(T)) = \frac{f(y(T)|\Theta) f(\Theta)}{f(y(T))} $$ |
|---|
| 54 | |
|---|
| 55 | kde jsou |
|---|
| 56 | |
|---|
| 57 | \begin{itemize} |
|---|
| 58 | \item $ f(\Theta|y(T)) $ aposteriorní hustota pravděpodobnosti |
|---|
| 59 | \item $ f(y(T)|\Theta) $ Věrohodnostní funkce |
|---|
| 60 | \item $ f(\Theta) = f(\Theta|y(0)) $ je tzv. apriorní hustota pravděpodobnosti |
|---|
| 61 | \item $ f(y(T)) $ normalizační konstanta ($ f(\Theta|y(T)) $ se bere jako funkce $\Theta$ a parametrů $y(t)$) |
|---|
| 62 | \end{itemize} |
|---|
| 63 | |
|---|
| 64 | Apriorní hustota pravděpodobnosti zde vyjadřuje odhad parametru při nenaměřených datech. Jedná se tedy |
|---|
| 65 | o expertní odhad, předpokládané chování náhodné veličiny založené na známých faktech a zkušenosti. |
|---|
| 66 | Aposteriorní hustota pravděpodobnosti představuje pravděpodobnost parametru $\Theta$ závislou |
|---|
| 67 | na naměřených hodnotách náhodné veličiny a její střední hodnota je odhadem tohoto parametru. |
|---|
| 68 | Tedy platí: |
|---|
| 69 | |
|---|
| 70 | $$ \hat{\Theta}_T = \int_{\mathbb{R}} f(\Theta|y(T)) d\Theta $$ |
|---|
| 71 | |
|---|
| 72 | |
|---|
| 73 | |
|---|
| 74 | |
|---|
| 75 | |
|---|