Context Navigation

exp_family.cpp @ 761

Revision 761, 13.3 kB (checked in by smidl, 16 years ago)
changes to dist identific example + wrapper for variance
Property svn:eol-style set to `native`

Line
1	#include <math.h>
2
3	#include <itpp/base/bessel.h>
4	#include "exp_family.h"
5
6	namespace bdm {
7
8	Uniform_RNG UniRNG;
9	Normal_RNG NorRNG;
10	Gamma_RNG GamRNG;
11
12	using std::cout;
13
14	///////////
15
16	void BMEF::bayes ( const vec &yt, const vec &cond ) {
17	this->bayes_weighted ( yt, cond, 1.0 );
18	};
19
20	void egiw::set_parameters ( int dimx0, ldmat V0, double nu0 ) {
21	dimx = dimx0;
22	nPsi = V0.rows() - dimx;
23	dim = dimx * ( dimx + nPsi ); // size(R) + size(Theta)
24
25	V = V0;
26	if ( nu0 < 0 ) {
27	nu = 0.1 + nPsi + 2 * dimx + 2; // +2 assures finite expected value of R
28	// terms before that are sufficient for finite normalization
29	} else {
30	nu = nu0;
31	}
32	}
33
34	vec egiw::sample() const {
35	mat M;
36	chmat R;
37	sample_mat ( M, R );
38
39	return concat ( cvectorize ( M ), cvectorize ( R.to_mat() ) );
40	}
41
42	mat egiw::sample_mat ( int n ) const {
43	// TODO - correct approach - convert to product of norm * Wishart
44	mat M;
45	ldmat Vz;
46	ldmat Lam;
47	factorize ( M, Vz, Lam );
48
49	chmat ChLam ( Lam.to_mat() );
50	chmat iChLam;
51	ChLam.inv ( iChLam );
52
53	eWishartCh Omega; //inverse Wishart, result is R,
54	Omega.set_parameters ( iChLam, nu - 2nPsi - dimx ); // 2nPsi is there to match numercial simulations - check if analytically correct
55
56	mat OmChi;
57	mat Z ( M.rows(), M.cols() );
58
59	mat Mi;
60	mat RChiT;
61	mat tmp ( dimension(), n );
62	for ( int i = 0; i < n; i++ ) {
63	OmChi = Omega.sample_mat();
64	RChiT = inv ( OmChi );
65	Z = randn ( M.rows(), M.cols() );
66	Mi = M + RChiT * Z * inv ( Vz._L().T() * diag ( sqrt ( Vz._D() ) ) );
67
68	tmp.set_col ( i, concat ( cvectorize ( Mi ), cvectorize ( RChiT*RChiT.T() ) ) );
69	}
70	return tmp;
71	}
72
73	void egiw::sample_mat ( mat &Mi, chmat &Ri ) const {
74
75	// TODO - correct approach - convert to product of norm * Wishart
76	mat M;
77	ldmat Vz;
78	ldmat Lam;
79	factorize ( M, Vz, Lam );
80
81	chmat Ch;
82	Ch.setCh ( Lam._L() *diag ( sqrt ( Lam._D() ) ) );
83	chmat iCh;
84	Ch.inv ( iCh );
85
86	eWishartCh Omega; //inverse Wishart, result is R,
87	Omega.set_parameters ( iCh, nu - 2nPsi - dimx ); // 2nPsi is there to match numercial simulations - check if analytically correct
88
89	chmat Omi;
90	Omi.setCh ( Omega.sample_mat() );
91
92	mat Z = randn ( M.rows(), M.cols() );
93	Mi = M + Omi._Ch() * Z * inv ( Vz._L() * diag ( sqrt ( Vz._D() ) ) );
94	Omi.inv ( Ri );
95	}
96
97	double egiw::evallog_nn ( const vec &val ) const {
98	bdm_assert_debug(val.length()==nPsi+dimx,"Incorrect cond in egiw::evallog_nn" );
99
100	int vend = val.length() - 1;
101
102	if ( dimx == 1 ) { //same as the following, just quicker.
103	double r = val ( vend ); //last entry!
104	if ( r < 0 ) return -inf;
105	vec Psi ( nPsi + dimx );
106	Psi ( 0 ) = -1.0;
107	Psi.set_subvector ( 1, val ( 0, vend - 1 ) ); // fill the rest
108
109	double Vq = V.qform ( Psi );
110	return -0.5* ( nu*log ( r ) + Vq / r );
111	} else {
112	mat Th = reshape ( val ( 0, nPsi * dimx - 1 ), nPsi, dimx );
113	fsqmat R ( reshape ( val ( nPsi*dimx, vend ), dimx, dimx ) );
114	double ldetR = R.logdet();
115	if ( ldetR ) return -inf;
116	mat Tmp = concat_vertical ( -eye ( dimx ), Th );
117	fsqmat iR ( dimx );
118	R.inv ( iR );
119
120	return -0.5* ( nuldetR + trace ( iR.to_mat() Tmp.T() V.to_mat() Tmp ) );
121	}
122	}
123
124	double egiw::lognc() const {
125	const vec& D = V._D();
126
127	double m = nu - nPsi - dimx - 1;
128	#define log2 0.693147180559945286226763983
129	#define logpi 1.144729885849400163877476189
130	#define log2pi 1.83787706640935
131	#define Inf std::numeric_limits<double>::infinity()
132
133	double nkG = 0.5 * dimx * ( -nPsi * log2pi + sum ( log ( D ( dimx, D.length() - 1 ) ) ) );
134	// temporary for lgamma in Wishart
135	double lg = 0;
136	for ( int i = 0; i < dimx; i++ ) {
137	lg += lgamma ( 0.5 * ( m - i ) );
138	}
139
140	double nkW = 0.5 * ( m * sum ( log ( D ( 0, dimx - 1 ) ) ) ) \
141	- 0.5 * dimx * ( m * log2 + 0.5 * ( dimx - 1 ) * log2pi ) - lg;
142
143	// bdm_assert_debug ( ( ( -nkG - nkW ) > -Inf ) && ( ( -nkG - nkW ) < Inf ), "ARX improper" );
144	if ( -nkG - nkW == Inf ) {
145	cout << "??" << endl;
146	}
147	return -nkG - nkW;
148	}
149
150	vec egiw::est_theta() const {
151	if ( dimx == 1 ) {
152	const mat &L = V._L();
153	int end = L.rows() - 1;
154
155	mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
156
157	vec L0 = L.get_col ( 0 );
158
159	return iLsub * L0 ( 1, end );
160	} else {
161	bdm_error ( "ERROR: est_theta() not implemented for dimx>1" );
162	return vec();
163	}
164	}
165
166	void egiw::factorize ( mat &M, ldmat &Vz, ldmat &Lam ) const {
167	const mat &L = V._L();
168	const vec &D = V._D();
169	int end = L.rows() - 1;
170
171	Vz = ldmat ( L ( dimx, end, dimx, end ), D ( dimx, end ) );
172	mat iLsub = ltuinv ( Vz._L() );
173	// set mean value
174	mat Lpsi = L ( dimx, end, 0, dimx - 1 );
175	M = iLsub * Lpsi;
176
177	Lam = ldmat ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) ); //exp val of R
178	if ( 1 ) { // test with Peterka
179	mat VF = V.to_mat();
180	mat Vf = VF ( 0, dimx - 1, 0, dimx - 1 );
181	mat Vzf = VF ( dimx, end, 0, dimx - 1 );
182	mat VZ = VF ( dimx, end, dimx, end );
183
184	mat Lam2 = Vf - Vzf.T() * inv ( VZ ) * Vzf;
185	}
186	}
187
188	ldmat egiw::est_theta_cov() const {
189	if ( dimx == 1 ) {
190	const mat &L = V._L();
191	const vec &D = V._D();
192	int end = D.length() - 1;
193
194	mat Lsub = L ( 1, end, 1, end );
195	// mat Dsub = diag ( D ( 1, end ) );
196
197	ldmat LD ( inv ( Lsub ).T(), 1.0 / D ( 1, end ) );
198	return LD;
199
200	} else {
201	bdm_error ( "ERROR: est_theta_cov() not implemented for dimx>1" );
202	return ldmat();
203	}
204
205	}
206
207	vec egiw::mean() const {
208
209	if ( dimx == 1 ) {
210	const vec &D = V._D();
211	int end = D.length() - 1;
212
213	vec m ( dim );
214	m.set_subvector ( 0, est_theta() );
215	m ( end ) = D ( 0 ) / ( nu - nPsi - 2 * dimx - 2 );
216	return m;
217	} else {
218	mat M;
219	mat R;
220	mean_mat ( M, R );
221	return concat ( cvectorize ( M ), cvectorize ( R ) );
222	}
223
224	}
225
226	vec egiw::variance() const {
227	int l = V.rows();
228	// cut out rest of lower-right part of V
229	const ldmat tmp ( V, linspace ( dimx, l - 1 ) );
230	// invert it
231	ldmat itmp ( l );
232	tmp.inv ( itmp );
233
234	// following Wikipedia notation
235	// m=nu-nPsi-dimx-1, p=dimx
236	double mp1p = nu - nPsi - 2 * dimx; // m-p+1
237	double mp1m = mp1p - 2; // m-p-1
238
239	if ( dimx == 1 ) {
240	double cove = V._D() ( 0 ) / mp1m ;
241
242	vec var ( l );
243	var.set_subvector ( 0, diag ( itmp.to_mat() ) *cove );
244	var ( l - 1 ) = cove * cove / ( mp1m - 2 );
245	return var;
246	} else {
247	ldmat Vll ( V, linspace ( 0, dimx - 1 ) ); // top-left part of V
248	mat Y = Vll.to_mat();
249	mat varY ( Y.rows(), Y.cols() );
250
251	double denom = ( mp1p - 1 ) * mp1m * mp1m * ( mp1m - 2 ); // (m-p)(m-p-1)^2(m-p-3)
252
253	int i, j;
254	for ( i = 0; i < Y.rows(); i++ ) {
255	for ( j = 0; j < Y.cols(); j++ ) {
256	varY ( i, j ) = ( mp1p * Y ( i, j ) * Y ( i, j ) + mp1m * Y ( i, i ) * Y ( j, j ) ) / denom;
257	}
258	}
259	vec mean_dR = diag ( Y ) / mp1m; // corresponds to cove
260	vec var_th = diag ( itmp.to_mat() );
261	vec var_Th ( mean_dR.length() *var_th.length() );
262	// diagonal of diag(mean_dR) \kron diag(var_th)
263	for ( int i = 0; i < mean_dR.length(); i++ ) {
264	var_Th.set_subvector ( ivar_th.length(), var_thmean_dR ( i ) );
265	}
266
267	return concat ( var_Th, cvectorize ( varY ) );
268	}
269	}
270
271	void egiw::mean_mat ( mat &M, mat&R ) const {
272	const mat &L = V._L();
273	const vec &D = V._D();
274	int end = L.rows() - 1;
275
276	ldmat ldR ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) / ( nu - nPsi - 2*dimx - 2 ) ); //exp val of R
277	mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
278
279	// set mean value
280	mat Lpsi = L ( dimx, end, 0, dimx - 1 );
281	M = iLsub * Lpsi;
282	R = ldR.to_mat() ;
283	}
284
285	void egiw::log_register ( bdm::logger& L, const string& prefix ) {
286	if ( log_level == 3 ) {
287	root::log_register ( L, prefix );
288	logrec->ids.set_length ( 2 );
289	int th_dim = dimension() - dimx * ( dimx + 1 ) / 2;
290	logrec->ids ( 0 ) = L.add_vector ( RV ( "", th_dim ), prefix + logrec->L.prefix_sep() + "mean" );
291	logrec->ids ( 1 ) = L.add_vector ( RV ( "", th_dim * th_dim ), prefix + logrec->L.prefix_sep() + "variance" );
292	} else {
293	epdf::log_register ( L, prefix );
294	}
295	}
296
297	void egiw::log_write() const {
298	if ( log_level == 3 ) {
299	mat M;
300	ldmat Lam;
301	ldmat Vz;
302	factorize ( M, Vz, Lam );
303	logrec->L.log_vector ( logrec->ids ( 0 ), est_theta() );
304	logrec->L.log_vector ( logrec->ids ( 1 ), cvectorize ( est_theta_cov().to_mat() ) );
305	} else {
306	epdf::log_write();
307	}
308
309	}
310
311	void multiBM::bayes ( const vec &yt, const vec &cond ) {
312	if ( frg < 1.0 ) {
313	beta *= frg;
314	last_lognc = est.lognc();
315	}
316	beta += yt;
317	if ( evalll ) {
318	ll = est.lognc() - last_lognc;
319	}
320	}
321
322	double multiBM::logpred ( const vec &yt ) const {
323	eDirich pred ( est );
324	vec &beta = pred._beta();
325
326	double lll;
327	if ( frg < 1.0 ) {
328	beta *= frg;
329	lll = pred.lognc();
330	} else if ( evalll ) {
331	lll = last_lognc;
332	} else {
333	lll = pred.lognc();
334	}
335
336	beta += yt;
337	return pred.lognc() - lll;
338	}
339	void multiBM::flatten ( const BMEF* B ) {
340	const multiBM* E = dynamic_cast<const multiBM*> ( B );
341	// sum(beta) should be equal to sum(B.beta)
342	const vec &Eb = E->beta;//const_cast<multiBM*> ( E )->_beta();
343	beta *= ( sum ( Eb ) / sum ( beta ) );
344	if ( evalll ) {
345	last_lognc = est.lognc();
346	}
347	}
348
349	vec egamma::sample() const {
350	vec smp ( dim );
351	int i;
352
353	for ( i = 0; i < dim; i++ ) {
354	if ( beta ( i ) > std::numeric_limits<double>::epsilon() ) {
355	GamRNG.setup ( alpha ( i ), beta ( i ) );
356	} else {
357	GamRNG.setup ( alpha ( i ), std::numeric_limits<double>::epsilon() );
358	}
359	#pragma omp critical
360	smp ( i ) = GamRNG();
361	}
362
363	return smp;
364	}
365
366	// mat egamma::sample ( int N ) const {
367	// mat Smp ( rv.count(),N );
368	// int i,j;
369	//
370	// for ( i=0; i<rv.count(); i++ ) {
371	// GamRNG.setup ( alpha ( i ),beta ( i ) );
372	//
373	// for ( j=0; j<N; j++ ) {
374	// Smp ( i,j ) = GamRNG();
375	// }
376	// }
377	//
378	// return Smp;
379	// }
380
381	double egamma::evallog ( const vec &val ) const {
382	double res = 0.0; //the rest will be added
383	int i;
384
385	if ( any ( val <= 0. ) ) return -inf;
386	if ( any ( beta <= 0. ) ) return -inf;
387	for ( i = 0; i < dim; i++ ) {
388	res += ( alpha ( i ) - 1 ) * std::log ( val ( i ) ) - beta ( i ) * val ( i );
389	}
390	double tmp = res - lognc();;
391	bdm_assert_debug ( std::isfinite ( tmp ), "Infinite value" );
392	return tmp;
393	}
394
395	double egamma::lognc() const {
396	double res = 0.0; //will be added
397	int i;
398
399	for ( i = 0; i < dim; i++ ) {
400	res += lgamma ( alpha ( i ) ) - alpha ( i ) * std::log ( beta ( i ) ) ;
401	}
402
403	return res;
404	}
405
406	void mgamma::set_parameters ( double k0, const vec &beta0 ) {
407	k = k0;
408	iepdf.set_parameters ( k * ones ( beta0.length() ), beta0 );
409	dimc = iepdf.dimension();
410	dim = iepdf.dimension();
411	}
412
413	void eEmp::resample ( ivec &ind, RESAMPLING_METHOD method ) {
414	ind = zeros_i ( n );
415	ivec N_babies = zeros_i ( n );
416	vec cumDist = cumsum ( w );
417	vec u ( n );
418	int i, j, parent;
419	double u0;
420
421	switch ( method ) {
422	case MULTINOMIAL:
423	u ( n - 1 ) = pow ( UniRNG.sample(), 1.0 / n );
424
425	for ( i = n - 2; i >= 0; i-- ) {
426	u ( i ) = u ( i + 1 ) * pow ( UniRNG.sample(), 1.0 / ( i + 1 ) );
427	}
428
429	break;
430
431	case STRATIFIED:
432
433	for ( i = 0; i < n; i++ ) {
434	u ( i ) = ( i + UniRNG.sample() ) / n;
435	}
436
437	break;
438
439	case SYSTEMATIC:
440	u0 = UniRNG.sample();
441
442	for ( i = 0; i < n; i++ ) {
443	u ( i ) = ( i + u0 ) / n;
444	}
445
446	break;
447
448	default:
449	bdm_error ( "PF::resample(): Unknown resampling method" );
450	}
451
452	// U is now full
453	j = 0;
454
455	for ( i = 0; i < n; i++ ) {
456	while ( u ( i ) > cumDist ( j ) ) j++;
457
458	N_babies ( j ) ++;
459	}
460	// We have assigned new babies for each Particle
461	// Now, we fill the resulting index such that:
462	// * particles with at least one baby should not move *
463	// This assures that reassignment can be done inplace;
464
465	// find the first parent;
466	parent = 0;
467	while ( N_babies ( parent ) == 0 ) parent++;
468
469	// Build index
470	for ( i = 0; i < n; i++ ) {
471	if ( N_babies ( i ) > 0 ) {
472	ind ( i ) = i;
473	N_babies ( i ) --; //this index was now replicated;
474	} else {
475	// test if the parent has been fully replicated
476	// if yes, find the next one
477	while ( ( N_babies ( parent ) == 0 ) \|\| ( N_babies ( parent ) == 1 && parent > i ) ) parent++;
478
479	// Replicate parent
480	ind ( i ) = parent;
481
482	N_babies ( parent ) --; //this index was now replicated;
483	}
484
485	}
486
487	// copy the internals according to ind
488	for ( i = 0; i < n; i++ ) {
489	if ( ind ( i ) != i ) {
490	samples ( i ) = samples ( ind ( i ) );
491	}
492	w ( i ) = 1.0 / n;
493	}
494	}
495
496	void eEmp::set_statistics ( const vec &w0, const epdf &epdf0 ) {
497	dim = epdf0.dimension();
498	w = w0;
499	w /= sum ( w0 );//renormalize
500	n = w.length();
501	samples.set_size ( n );
502
503	for ( int i = 0; i < n; i++ ) {
504	samples ( i ) = epdf0.sample();
505	}
506	}
507
508	void eEmp::set_samples ( const epdf* epdf0 ) {
509	w = 1;
510	w /= sum ( w );//renormalize
511
512	for ( int i = 0; i < n; i++ ) {
513	samples ( i ) = epdf0->sample();
514	}
515	}
516
517	void migamma_ref::from_setting ( const Setting &set ) {
518	vec ref;
519	UI::get ( ref, set, "ref" , UI::compulsory );
520	set_parameters ( set["k"], ref, set["l"] );
521	}
522
523	void mlognorm::from_setting ( const Setting &set ) {
524	vec mu0;
525	UI::get ( mu0, set, "mu0", UI::compulsory );
526	set_parameters ( mu0.length(), set["k"] );
527	condition ( mu0 );
528	}
529
530	void mlstudent::condition ( const vec &cond ) {
531	if ( cond.length() > 0 ) {
532	iepdf._mu() = A * cond + mu_const;
533	} else {
534	iepdf._mu() = mu_const;
535	}
536	double zeta;
537	//ugly hack!
538	if ( ( cond.length() + 1 ) == Lambda.rows() ) {
539	zeta = Lambda.invqform ( concat ( cond, vec_1 ( 1.0 ) ) );
540	} else {
541	zeta = Lambda.invqform ( cond );
542	}
543	_R = Re;
544	_R *= ( 1 + zeta );// / ( nu ); << nu is in Re!!!!!!
545	}
546
547	void eEmp::qbounds ( vec &lb, vec &ub, double perc ) const {
548	// lb in inf so than it will be pushed below;
549	lb.set_size ( dim );
550	ub.set_size ( dim );
551	lb = std::numeric_limits<double>::infinity();
552	ub = -std::numeric_limits<double>::infinity();
553	int j;
554	for ( int i = 0; i < n; i++ ) {
555	for ( j = 0; j < dim; j++ ) {
556	if ( samples ( i ) ( j ) < lb ( j ) ) {
557	lb ( j ) = samples ( i ) ( j );
558	}
559	if ( samples ( i ) ( j ) > ub ( j ) ) {
560	ub ( j ) = samples ( i ) ( j );
561	}
562	}
563	}
564	}
565
566
567	};

Note: See TracBrowser for help on using the browser.

Context Navigation

root/library/bdm/stat/exp_family.cpp @ 761

Download in other formats: