root/applications/doprava/texty/novotny_vyzk_LQ/04_Bayes/Bayes.tex @ 1467

Revision 1434, 3.4 kB (checked in by jabu, 13 years ago)

finalni verze

Line 
1\section{Bayesovské učení} \label{sec:bayes}
2
3% \subsection{Úvod}
4V této kapitole je naznačena metoda bayesovského učení,
5což je bodový odhadu parametru rozdělení náhodné veličiny
6založený na Bayesově větě.
7Tato metoda byla použita v článku \cite{4_rmm_formalization} ke zlepšení
8odhadu pravděpodobnosti uskutečnění se modelového chování ostatních agentů,
9což bude popsáno v kapitole \ref{sec:rmm_bayes_pouziti}.
10Jeho výhodou je využití experimentální i expertní znalosti.
11V praxi se této metody hojně využívá tam, kde jsou data získávána postupně a zpočátku je nutné parametr
12odhadnout na základě zkušenosti a nadále ho podle výsledků měření zpřesňovat.
13
14\begin{definition}[Podmíněná pravděpodobnost]\label{de:podm_pravd}
15 Nechť $A$ a $B$ jsou náhodné jevy. Podmíněná pravděpodobnost jevu $A$ na jevu $B$, tedy pravděpodobnost že nastane
16 jev $A$ pokud nastane jev $B$, je definována jako
17  $$ P(A|B) = \frac{P(A \cap B )}{P(B)} $$
18\end{definition}
19
20\begin{proposition}[Bayesova věta]\label{v:bayes}
21 Nechť $A$ a $B$ jsou náhodné jevy a platí $P(B) > 0$. Potom
22  $$ P(A|B) = \frac{P(B|A) P(A) }{P(B)} $$
23\end{proposition}
24
25% \subsubsection{Značení}
26
27V souladu s \cite{5_bayes_learn} zavedeme následující značení:
28
29\begin{itemize}
30 \item $y(t) = [ y_1, ..., y_T ] $ - vetor $T \in \mathbb{N}$ naměřených hodnot, kde $y_t \in \{ 0,1 \}$ a $y_t = 1$ značí,
31                                      že výsledek experimentu v čase $t \in \{ 1, ..., T \}$ dopadl v souladu s naší hypotézou
32 \item $\Theta$  - parametr rozdělení
33 \item $ \hat{\Theta}_{T} $  - odhad parametru při $T$ naměřených hodnotách
34 \item $f(y_t|\Theta)$ - hustota pravděpodobnosti náhodné veličiny v čase $t$ při parametru $\Theta$ 
35\end{itemize}
36
37\subsection{Věrohodnostní funkce}
38
39K odhadu parametru se v této metodě využívá věrohodnostní funkce, která vyjadřuje
40pravděpodobnost, že při daném parametru se bude vektor naměřených výsledků rovnat
41teoretické hodnotě. V publikaci \cite{5_bayes_learn} se tato funkce definuje jako:
42
43
44\begin{definition}[Věrohodnostní funkce]\label{de:ver_fce}\footnotemark
45 $$f(y(T)|\Theta) = \prod_{t=1}^T f(y_t|\Theta) $$
46\end{definition}
47
48\footnotetext{Tato definice je poněkud zjednodušena a předpokládá, že výsledek $t$-tého pokusu nezávisí na
49předchozích pokusech, ani na počátečních podmínkách před $t$-tým pokusem.}
50
51Při použití těchtu veličin nabývá Bayesova věta podle \cite{5_bayes_learn} tvaru
52
53$$ f(\Theta|y(T)) = \frac{f(y(T)|\Theta) f(\Theta)}{f(y(T))} $$
54
55kde jsou
56
57\begin{itemize}
58 \item $ f(\Theta|y(T)) $ aposteriorní hustota pravděpodobnosti
59 \item $ f(y(T)|\Theta) $ Věrohodnostní funkce
60 \item $ f(\Theta) = f(\Theta|y(0)) $ je tzv. apriorní hustota pravděpodobnosti
61 \item $ f(y(T)) $ normalizační konstanta ($ f(\Theta|y(T)) $ se bere jako funkce $\Theta$ a parametrů $y(t)$)
62\end{itemize}
63
64Apriorní hustota pravděpodobnosti zde vyjadřuje odhad parametru při nenaměřených datech. Jedná se tedy
65o expertní odhad, předpokládané chování náhodné veličiny založené na známých faktech a zkušenosti.
66Aposteriorní hustota pravděpodobnosti představuje pravděpodobnost parametru $\Theta$ závislou
67na naměřených hodnotách náhodné veličiny a její střední hodnota je odhadem tohoto parametru.
68Tedy platí:
69
70$$ \hat{\Theta}_T = \int_{\mathbb{R}} f(\Theta|y(T)) d\Theta $$
71
72
73
74
75
Note: See TracBrowser for help on using the browser.