1 | \section{Bayesovské učení} \label{sec:bayes} |
---|
2 | |
---|
3 | % \subsection{Úvod} |
---|
4 | V této kapitole je naznačena metoda bayesovského učení, |
---|
5 | což je bodový odhadu parametru rozdělení náhodné veličiny |
---|
6 | založený na Bayesově větě. |
---|
7 | Tato metoda byla použita v článku \cite{4_rmm_formalization} ke zlepšení |
---|
8 | odhadu pravděpodobnosti uskutečnění se modelového chování ostatních agentů, |
---|
9 | což bude popsáno v kapitole \ref{sec:rmm_bayes_pouziti}. |
---|
10 | Jeho výhodou je využití experimentální i expertní znalosti. |
---|
11 | V praxi se této metody hojně využívá tam, kde jsou data získávána postupně a zpočátku je nutné parametr |
---|
12 | odhadnout na základě zkušenosti a nadále ho podle výsledků měření zpřesňovat. |
---|
13 | |
---|
14 | \begin{definition}[Podmíněná pravděpodobnost]\label{de:podm_pravd} |
---|
15 | Nechť $A$ a $B$ jsou náhodné jevy. Podmíněná pravděpodobnost jevu $A$ na jevu $B$, tedy pravděpodobnost že nastane |
---|
16 | jev $A$ pokud nastane jev $B$, je definována jako |
---|
17 | $$ P(A|B) = \frac{P(A \cap B )}{P(B)} $$ |
---|
18 | \end{definition} |
---|
19 | |
---|
20 | \begin{proposition}[Bayesova věta]\label{v:bayes} |
---|
21 | Nechť $A$ a $B$ jsou náhodné jevy a platí $P(B) > 0$. Potom |
---|
22 | $$ P(A|B) = \frac{P(B|A) P(A) }{P(B)} $$ |
---|
23 | \end{proposition} |
---|
24 | |
---|
25 | % \subsubsection{Značení} |
---|
26 | |
---|
27 | V souladu s \cite{5_bayes_learn} zavedeme následující značení: |
---|
28 | |
---|
29 | \begin{itemize} |
---|
30 | \item $y(t) = [ y_1, ..., y_T ] $ - vetor $T \in \mathbb{N}$ naměřených hodnot, kde $y_t \in \{ 0,1 \}$ a $y_t = 1$ značí, |
---|
31 | že výsledek experimentu v čase $t \in \{ 1, ..., T \}$ dopadl v souladu s naší hypotézou |
---|
32 | \item $\Theta$ - parametr rozdělení |
---|
33 | \item $ \hat{\Theta}_{T} $ - odhad parametru při $T$ naměřených hodnotách |
---|
34 | \item $f(y_t|\Theta)$ - hustota pravděpodobnosti náhodné veličiny v čase $t$ při parametru $\Theta$ |
---|
35 | \end{itemize} |
---|
36 | |
---|
37 | \subsection{Věrohodnostní funkce} |
---|
38 | |
---|
39 | K odhadu parametru se v této metodě využívá věrohodnostní funkce, která vyjadřuje |
---|
40 | pravděpodobnost, že při daném parametru se bude vektor naměřených výsledků rovnat |
---|
41 | teoretické hodnotě. V publikaci \cite{5_bayes_learn} se tato funkce definuje jako: |
---|
42 | |
---|
43 | |
---|
44 | \begin{definition}[Věrohodnostní funkce]\label{de:ver_fce}\footnotemark |
---|
45 | $$f(y(T)|\Theta) = \prod_{t=1}^T f(y_t|\Theta) $$ |
---|
46 | \end{definition} |
---|
47 | |
---|
48 | \footnotetext{Tato definice je poněkud zjednodušena a předpokládá, že výsledek $t$-tého pokusu nezávisí na |
---|
49 | předchozích pokusech, ani na počátečních podmínkách před $t$-tým pokusem.} |
---|
50 | |
---|
51 | Při použití těchtu veličin nabývá Bayesova věta podle \cite{5_bayes_learn} tvaru |
---|
52 | |
---|
53 | $$ f(\Theta|y(T)) = \frac{f(y(T)|\Theta) f(\Theta)}{f(y(T))} $$ |
---|
54 | |
---|
55 | kde jsou |
---|
56 | |
---|
57 | \begin{itemize} |
---|
58 | \item $ f(\Theta|y(T)) $ aposteriorní hustota pravděpodobnosti |
---|
59 | \item $ f(y(T)|\Theta) $ Věrohodnostní funkce |
---|
60 | \item $ f(\Theta) = f(\Theta|y(0)) $ je tzv. apriorní hustota pravděpodobnosti |
---|
61 | \item $ f(y(T)) $ normalizační konstanta ($ f(\Theta|y(T)) $ se bere jako funkce $\Theta$ a parametrů $y(t)$) |
---|
62 | \end{itemize} |
---|
63 | |
---|
64 | Apriorní hustota pravděpodobnosti zde vyjadřuje odhad parametru při nenaměřených datech. Jedná se tedy |
---|
65 | o expertní odhad, předpokládané chování náhodné veličiny založené na známých faktech a zkušenosti. |
---|
66 | Aposteriorní hustota pravděpodobnosti představuje pravděpodobnost parametru $\Theta$ závislou |
---|
67 | na naměřených hodnotách náhodné veličiny a její střední hodnota je odhadem tohoto parametru. |
---|
68 | Tedy platí: |
---|
69 | |
---|
70 | $$ \hat{\Theta}_T = \int_{\mathbb{R}} f(\Theta|y(T)) d\Theta $$ |
---|
71 | |
---|
72 | |
---|
73 | |
---|
74 | |
---|
75 | |
---|