[1427] | 1 | \section{Bayesovské učení} \label{sec:bayes} |
---|
[1419] | 2 | |
---|
[1424] | 3 | % \subsection{Úvod} |
---|
[1419] | 4 | V této kapitole je naznačena metoda bayesovského učení |
---|
| 5 | , což je bodový odhadu parametru rozdělení náhodné veličiny |
---|
| 6 | založený na Bayesovuě větě. |
---|
| 7 | Tato metoda byla použita v článku \cite{4_rmm_formalization} ke zlepšení |
---|
| 8 | odhadu pravděpodobnosti uskutečnění se modelového chování ostatních agentů. |
---|
| 9 | Jeho výhodou je využití experimentální i expertní znalosti. |
---|
| 10 | V praxi se této metody hojně využívá tam, kde jsou data získávána postupně a zpočátku je nutné parametr |
---|
| 11 | odhadnout na základě zkušenosti a nadále ho podle výsledků měření zpřesňovat. |
---|
| 12 | |
---|
| 13 | \begin{definition}[Podmíněná pravděpodobnost]\label{de:podm_pravd} |
---|
| 14 | Nechť $A$ a $B$ jsou náhodné jevy. Podmíněná pravděpodobnost jevu $A$ na jevu $B$, tedy pravděpodobnost že nastane |
---|
| 15 | jev $A$ pokud nastane jev $B$, je definována jako |
---|
| 16 | $$ P(A|B) = \frac{P(A \cap B )}{P(B)} $$ |
---|
| 17 | \end{definition} |
---|
| 18 | |
---|
| 19 | \begin{proposition}[Bayesova věta]\label{v:bayes} |
---|
| 20 | Nechť $A$ a $B$ jsou náhodné jevy a platí $P(B) > 0$. Potom |
---|
| 21 | $$ P(A|B) = \frac{P(B|A) P(A) }{P(B)} $$ |
---|
| 22 | \end{proposition} |
---|
| 23 | |
---|
[1424] | 24 | % \subsubsection{Značení} |
---|
[1419] | 25 | |
---|
| 26 | V souladu s \cite{5_bayes_learn} zavedeme následující značení: |
---|
| 27 | |
---|
| 28 | \begin{itemize} |
---|
| 29 | \item $y(t) = [ y_1, ..., y_T ] $ - vetor $T \in \mathbb{N}$ naměřených hodnot, kde $y_t \in \{ 0,1 \}$ a $y_t = 1$ značí, |
---|
| 30 | že výsledek experimentu v čase $t \in \{ 1, ..., T \}$ dopadlu v souladu s naší hypotézou |
---|
| 31 | \item $\Theta$ - parametr rozdělení |
---|
| 32 | \item $ \hat{\Theta}_{T} $ - odhad parametru při $T$ naměřených hodnotách |
---|
| 33 | \item $f(y_t|\Theta)$ - hustota pravděpodobnosti náhodné veličiny v čase $t$ při parametru $\Theta$ |
---|
| 34 | \end{itemize} |
---|
| 35 | |
---|
[1424] | 36 | \subsubsection{Věrohodnostní funkce} |
---|
[1419] | 37 | |
---|
| 38 | K odhadu parametru se v této metodě využívá věrohodnostní funkce, která vyjadřuje |
---|
| 39 | pravděpodobnost, že při daném parametru se bude vektor naměřených výsledků bude rovnat |
---|
| 40 | teoretické hodnotě. V \cite{5_bayes_learn} se tato funkce definuje jako: \footnotemark |
---|
| 41 | |
---|
| 42 | \footnotetext{Tato definice je poněkud zjednodušena a předpokládá, že výsledek $t$-tého pokusu nezávisí na |
---|
| 43 | předchozích pokusech, ani na počátečních podmínkách před $t$-tým pokusem.} |
---|
| 44 | |
---|
| 45 | \begin{definition}[Věrohodnostní funkce]\label{de:ver_fce} |
---|
| 46 | $$f(y(T)|\Theta) = \prod_{t=1}^T f(y_t|\Theta) $$ |
---|
| 47 | \end{definition} |
---|
| 48 | |
---|
| 49 | Při použití těchtu veličin nabývá Bayesova věta podle \cite{5_bayes_learn} tvaru |
---|
| 50 | |
---|
| 51 | $$ f(\Theta|y(T)) = \frac{f(y(T)|\Theta) f(\Theta)}{f(y(T))} $$ |
---|
| 52 | |
---|
| 53 | kde jsou |
---|
| 54 | |
---|
| 55 | \begin{itemize} |
---|
| 56 | \item $ f(\Theta|y(T)) $ aposteriorní hustota pravděpodobnosti |
---|
| 57 | \item $ f(y(T)|\Theta) $ Věrohodnostní funkce |
---|
| 58 | \item $ f(\Theta) = f(\Theta|y(0)) $ je tzv. apriorní hustota pravděpodobnosti |
---|
| 59 | \item $ f(y(T)) $ normalizační konstanta ($ f(\Theta|y(T)) $ se bere jako funkce $\Theta$ a parametrů $y(t)$) |
---|
| 60 | \end{itemize} |
---|
| 61 | |
---|
| 62 | Apriorní hustota pravděpodobnosti zde vyjadřuje odhad parametru při nenaměřených datech. Jedná se tedy |
---|
| 63 | o expertní odhad, předpokládané chování náhodné veličiny založené na známých faktech a zkušenosti. |
---|
| 64 | Aposteriorní hustota pravděpodobnosti představuje pravděpodobnost parametru $\Theta$ závislou |
---|
| 65 | na naměřených hodnotách náhodné veličiny a její střední hodnota je odhadem tohoto parametru. |
---|
| 66 | Tedy platí: |
---|
| 67 | |
---|
| 68 | $$ \hat{\Theta}_T = \int_{\mathbb{R}} f(\Theta|y(T)) d\Theta $$ |
---|
| 69 | |
---|
| 70 | |
---|
| 71 | |
---|
| 72 | |
---|
| 73 | |
---|