root/library/bdm/stat/exp_family.cpp @ 761

Revision 761, 13.3 kB (checked in by smidl, 14 years ago)

changes to dist identific example + wrapper for variance

  • Property svn:eol-style set to native
Line 
1#include <math.h>
2
3#include <itpp/base/bessel.h>
4#include "exp_family.h"
5
6namespace bdm {
7
8Uniform_RNG UniRNG;
9Normal_RNG NorRNG;
10Gamma_RNG GamRNG;
11
12using std::cout;
13
14///////////
15
16void BMEF::bayes ( const vec &yt, const vec &cond ) {
17        this->bayes_weighted ( yt, cond, 1.0 );
18};
19
20void egiw::set_parameters ( int dimx0, ldmat V0, double nu0 ) {
21        dimx = dimx0;
22        nPsi = V0.rows() - dimx;
23        dim = dimx * ( dimx + nPsi ); // size(R) + size(Theta)
24
25        V = V0;
26        if ( nu0 < 0 ) {
27                nu = 0.1 + nPsi + 2 * dimx + 2; // +2 assures finite expected value of R
28                // terms before that are sufficient for finite normalization
29        } else {
30                nu = nu0;
31        }
32}
33
34vec egiw::sample() const {
35        mat M;
36        chmat R;
37        sample_mat ( M, R );
38
39        return concat ( cvectorize ( M ), cvectorize ( R.to_mat() ) );
40}
41
42mat egiw::sample_mat ( int n ) const {
43        // TODO - correct approach - convert to product of norm * Wishart
44        mat M;
45        ldmat Vz;
46        ldmat Lam;
47        factorize ( M, Vz, Lam );
48
49        chmat ChLam ( Lam.to_mat() );
50        chmat iChLam;
51        ChLam.inv ( iChLam );
52
53        eWishartCh Omega; //inverse Wishart, result is R,
54        Omega.set_parameters ( iChLam, nu - 2*nPsi - dimx ); // 2*nPsi is there to match numercial simulations - check if analytically correct
55
56        mat OmChi;
57        mat Z ( M.rows(), M.cols() );
58
59        mat Mi;
60        mat RChiT;
61        mat tmp ( dimension(), n );
62        for ( int i = 0; i < n; i++ ) {
63                OmChi = Omega.sample_mat();
64                RChiT = inv ( OmChi );
65                Z = randn ( M.rows(), M.cols() );
66                Mi = M + RChiT * Z * inv ( Vz._L().T() * diag ( sqrt ( Vz._D() ) ) );
67
68                tmp.set_col ( i, concat ( cvectorize ( Mi ), cvectorize ( RChiT*RChiT.T() ) ) );
69        }
70        return tmp;
71}
72
73void egiw::sample_mat ( mat &Mi, chmat &Ri ) const {
74
75        // TODO - correct approach - convert to product of norm * Wishart
76        mat M;
77        ldmat Vz;
78        ldmat Lam;
79        factorize ( M, Vz, Lam );
80
81        chmat Ch;
82        Ch.setCh ( Lam._L() *diag ( sqrt ( Lam._D() ) ) );
83        chmat iCh;
84        Ch.inv ( iCh );
85
86        eWishartCh Omega; //inverse Wishart, result is R,
87        Omega.set_parameters ( iCh, nu - 2*nPsi - dimx ); // 2*nPsi is there to match numercial simulations - check if analytically correct
88
89        chmat Omi;
90        Omi.setCh ( Omega.sample_mat() );
91
92        mat Z = randn ( M.rows(), M.cols() );
93        Mi = M + Omi._Ch() * Z * inv ( Vz._L() * diag ( sqrt ( Vz._D() ) ) );
94        Omi.inv ( Ri );
95}
96
97double egiw::evallog_nn ( const vec &val ) const {
98        bdm_assert_debug(val.length()==nPsi+dimx,"Incorrect cond in egiw::evallog_nn" );
99       
100        int vend = val.length() - 1;
101
102        if ( dimx == 1 ) { //same as the following, just quicker.
103                double r = val ( vend ); //last entry!
104                if ( r < 0 ) return -inf;
105                vec Psi ( nPsi + dimx );
106                Psi ( 0 ) = -1.0;
107                Psi.set_subvector ( 1, val ( 0, vend - 1 ) ); // fill the rest
108
109                double Vq = V.qform ( Psi );
110                return -0.5* ( nu*log ( r ) + Vq / r );
111        } else {
112                mat Th = reshape ( val ( 0, nPsi * dimx - 1 ), nPsi, dimx );
113                fsqmat R ( reshape ( val ( nPsi*dimx, vend ), dimx, dimx ) );
114                double ldetR = R.logdet();
115                if ( ldetR ) return -inf;
116                mat Tmp = concat_vertical ( -eye ( dimx ), Th );
117                fsqmat iR ( dimx );
118                R.inv ( iR );
119
120                return -0.5* ( nu*ldetR + trace ( iR.to_mat() *Tmp.T() *V.to_mat() *Tmp ) );
121        }
122}
123
124double egiw::lognc() const {
125        const vec& D = V._D();
126
127        double m = nu - nPsi - dimx - 1;
128#define log2  0.693147180559945286226763983
129#define logpi 1.144729885849400163877476189
130#define log2pi 1.83787706640935
131#define Inf std::numeric_limits<double>::infinity()
132
133        double nkG = 0.5 * dimx * ( -nPsi * log2pi + sum ( log ( D ( dimx, D.length() - 1 ) ) ) );
134        // temporary for lgamma in Wishart
135        double lg = 0;
136        for ( int i = 0; i < dimx; i++ ) {
137                lg += lgamma ( 0.5 * ( m - i ) );
138        }
139
140        double nkW = 0.5 * ( m * sum ( log ( D ( 0, dimx - 1 ) ) ) ) \
141                     - 0.5 * dimx * ( m * log2 + 0.5 * ( dimx - 1 ) * log2pi )  - lg;
142
143//      bdm_assert_debug ( ( ( -nkG - nkW ) > -Inf ) && ( ( -nkG - nkW ) < Inf ), "ARX improper" );
144        if ( -nkG - nkW == Inf ) {
145                cout << "??" << endl;
146        }
147        return -nkG - nkW;
148}
149
150vec egiw::est_theta() const {
151        if ( dimx == 1 ) {
152                const mat &L = V._L();
153                int end = L.rows() - 1;
154
155                mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
156
157                vec L0 = L.get_col ( 0 );
158
159                return iLsub * L0 ( 1, end );
160        } else {
161                bdm_error ( "ERROR: est_theta() not implemented for dimx>1" );
162                return vec();
163        }
164}
165
166void egiw::factorize ( mat &M, ldmat &Vz, ldmat &Lam ) const {
167        const mat &L = V._L();
168        const vec &D = V._D();
169        int end = L.rows() - 1;
170
171        Vz = ldmat ( L ( dimx, end, dimx, end ), D ( dimx, end ) );
172        mat iLsub = ltuinv ( Vz._L() );
173        // set mean value
174        mat Lpsi = L ( dimx, end, 0, dimx - 1 );
175        M = iLsub * Lpsi;
176
177        Lam = ldmat ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) );  //exp val of R
178        if ( 1 ) { // test with Peterka
179                mat VF = V.to_mat();
180                mat Vf = VF ( 0, dimx - 1, 0, dimx - 1 );
181                mat Vzf = VF ( dimx, end, 0, dimx - 1 );
182                mat VZ = VF ( dimx, end, dimx, end );
183
184                mat Lam2 = Vf - Vzf.T() * inv ( VZ ) * Vzf;
185        }
186}
187
188ldmat egiw::est_theta_cov() const {
189        if ( dimx == 1 ) {
190                const mat &L = V._L();
191                const vec &D = V._D();
192                int end = D.length() - 1;
193
194                mat Lsub = L ( 1, end, 1, end );
195//              mat Dsub = diag ( D ( 1, end ) );
196
197                ldmat LD ( inv ( Lsub ).T(), 1.0 / D ( 1, end ) );
198                return LD;
199
200        } else {
201                bdm_error ( "ERROR: est_theta_cov() not implemented for dimx>1" );
202                return ldmat();
203        }
204
205}
206
207vec egiw::mean() const {
208
209        if ( dimx == 1 ) {
210                const vec &D = V._D();
211                int end = D.length() - 1;
212
213                vec m ( dim );
214                m.set_subvector ( 0, est_theta() );
215                m ( end ) = D ( 0 ) / ( nu - nPsi - 2 * dimx - 2 );
216                return m;
217        } else {
218                mat M;
219                mat R;
220                mean_mat ( M, R );
221                return concat ( cvectorize ( M ), cvectorize ( R ) );
222        }
223
224}
225
226vec egiw::variance() const {
227        int l = V.rows();
228        // cut out rest of lower-right part of V
229        const ldmat tmp ( V, linspace ( dimx, l - 1 ) );
230        // invert it
231        ldmat itmp ( l );
232        tmp.inv ( itmp );
233
234        // following Wikipedia notation
235        // m=nu-nPsi-dimx-1, p=dimx
236        double mp1p = nu - nPsi - 2 * dimx; // m-p+1
237        double mp1m = mp1p - 2;     // m-p-1
238
239        if ( dimx == 1 ) {
240                double cove = V._D() ( 0 ) / mp1m ;
241
242                vec var ( l );
243                var.set_subvector ( 0, diag ( itmp.to_mat() ) *cove );
244                var ( l - 1 ) = cove * cove / ( mp1m - 2 );
245                return var;
246        } else {
247                ldmat Vll ( V, linspace ( 0, dimx - 1 ) ); // top-left part of V
248                mat Y = Vll.to_mat();
249                mat varY ( Y.rows(), Y.cols() );
250
251                double denom = ( mp1p - 1 ) * mp1m * mp1m * ( mp1m - 2 );         // (m-p)(m-p-1)^2(m-p-3)
252
253                int i, j;
254                for ( i = 0; i < Y.rows(); i++ ) {
255                        for ( j = 0; j < Y.cols(); j++ ) {
256                                varY ( i, j ) = ( mp1p * Y ( i, j ) * Y ( i, j ) + mp1m * Y ( i, i ) * Y ( j, j ) ) / denom;
257                        }
258                }
259                vec mean_dR = diag ( Y ) / mp1m; // corresponds to cove
260                vec var_th = diag ( itmp.to_mat() );
261                vec var_Th ( mean_dR.length() *var_th.length() );
262                // diagonal of diag(mean_dR) \kron diag(var_th)
263                for ( int i = 0; i < mean_dR.length(); i++ ) {
264                        var_Th.set_subvector ( i*var_th.length(), var_th*mean_dR ( i ) );
265                }
266
267                return concat ( var_Th, cvectorize ( varY ) );
268        }
269}
270
271void egiw::mean_mat ( mat &M, mat&R ) const {
272        const mat &L = V._L();
273        const vec &D = V._D();
274        int end = L.rows() - 1;
275
276        ldmat ldR ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) / ( nu - nPsi - 2*dimx - 2 ) ); //exp val of R
277        mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
278
279        // set mean value
280        mat Lpsi = L ( dimx, end, 0, dimx - 1 );
281        M = iLsub * Lpsi;
282        R = ldR.to_mat()  ;
283}
284
285void egiw::log_register ( bdm::logger& L, const string& prefix ) {
286        if ( log_level == 3 ) {
287                root::log_register ( L, prefix );
288                logrec->ids.set_length ( 2 );
289                int th_dim = dimension() - dimx * ( dimx + 1 ) / 2;
290                logrec->ids ( 0 ) = L.add_vector ( RV ( "", th_dim ), prefix + logrec->L.prefix_sep() + "mean" );
291                logrec->ids ( 1 ) = L.add_vector ( RV ( "", th_dim * th_dim ), prefix + logrec->L.prefix_sep() + "variance" );
292        } else {
293                epdf::log_register ( L, prefix );
294        }
295}
296
297void egiw::log_write() const {
298        if ( log_level == 3 ) {
299                mat M;
300                ldmat Lam;
301                ldmat Vz;
302                factorize ( M, Vz, Lam );
303                logrec->L.log_vector ( logrec->ids ( 0 ), est_theta() );
304                logrec->L.log_vector ( logrec->ids ( 1 ), cvectorize ( est_theta_cov().to_mat() ) );
305        } else {
306                epdf::log_write();
307        }
308
309}
310
311void multiBM::bayes ( const vec &yt, const vec &cond ) {
312        if ( frg < 1.0 ) {
313                beta *= frg;
314                last_lognc = est.lognc();
315        }
316        beta += yt;
317        if ( evalll ) {
318                ll = est.lognc() - last_lognc;
319        }
320}
321
322double multiBM::logpred ( const vec &yt ) const {
323        eDirich pred ( est );
324        vec &beta = pred._beta();
325
326        double lll;
327        if ( frg < 1.0 ) {
328                beta *= frg;
329                lll = pred.lognc();
330        } else if ( evalll ) {
331                lll = last_lognc;
332        } else {
333                lll = pred.lognc();
334        }
335
336        beta += yt;
337        return pred.lognc() - lll;
338}
339void multiBM::flatten ( const BMEF* B ) {
340        const multiBM* E = dynamic_cast<const multiBM*> ( B );
341        // sum(beta) should be equal to sum(B.beta)
342        const vec &Eb = E->beta;//const_cast<multiBM*> ( E )->_beta();
343        beta *= ( sum ( Eb ) / sum ( beta ) );
344        if ( evalll ) {
345                last_lognc = est.lognc();
346        }
347}
348
349vec egamma::sample() const {
350        vec smp ( dim );
351        int i;
352
353        for ( i = 0; i < dim; i++ ) {
354                if ( beta ( i ) > std::numeric_limits<double>::epsilon() ) {
355                        GamRNG.setup ( alpha ( i ), beta ( i ) );
356                } else {
357                        GamRNG.setup ( alpha ( i ), std::numeric_limits<double>::epsilon() );
358                }
359#pragma omp critical
360                smp ( i ) = GamRNG();
361        }
362
363        return smp;
364}
365
366// mat egamma::sample ( int N ) const {
367//      mat Smp ( rv.count(),N );
368//      int i,j;
369//
370//      for ( i=0; i<rv.count(); i++ ) {
371//              GamRNG.setup ( alpha ( i ),beta ( i ) );
372//
373//              for ( j=0; j<N; j++ ) {
374//                      Smp ( i,j ) = GamRNG();
375//              }
376//      }
377//
378//      return Smp;
379// }
380
381double egamma::evallog ( const vec &val ) const {
382        double res = 0.0; //the rest will be added
383        int i;
384
385        if ( any ( val <= 0. ) ) return -inf;
386        if ( any ( beta <= 0. ) ) return -inf;
387        for ( i = 0; i < dim; i++ ) {
388                res += ( alpha ( i ) - 1 ) * std::log ( val ( i ) ) - beta ( i ) * val ( i );
389        }
390        double tmp = res - lognc();;
391        bdm_assert_debug ( std::isfinite ( tmp ), "Infinite value" );
392        return tmp;
393}
394
395double egamma::lognc() const {
396        double res = 0.0; //will be added
397        int i;
398
399        for ( i = 0; i < dim; i++ ) {
400                res += lgamma ( alpha ( i ) ) - alpha ( i ) * std::log ( beta ( i ) ) ;
401        }
402
403        return res;
404}
405
406void mgamma::set_parameters ( double k0, const vec &beta0 ) {
407        k = k0;
408        iepdf.set_parameters ( k * ones ( beta0.length() ), beta0 );
409        dimc = iepdf.dimension();
410        dim = iepdf.dimension();
411}
412
413void eEmp::resample ( ivec &ind, RESAMPLING_METHOD method ) {
414        ind = zeros_i ( n );
415        ivec N_babies = zeros_i ( n );
416        vec cumDist = cumsum ( w );
417        vec u ( n );
418        int i, j, parent;
419        double u0;
420
421        switch ( method ) {
422        case MULTINOMIAL:
423                u ( n - 1 ) = pow ( UniRNG.sample(), 1.0 / n );
424
425                for ( i = n - 2; i >= 0; i-- ) {
426                        u ( i ) = u ( i + 1 ) * pow ( UniRNG.sample(), 1.0 / ( i + 1 ) );
427                }
428
429                break;
430
431        case STRATIFIED:
432
433                for ( i = 0; i < n; i++ ) {
434                        u ( i ) = ( i + UniRNG.sample() ) / n;
435                }
436
437                break;
438
439        case SYSTEMATIC:
440                u0 = UniRNG.sample();
441
442                for ( i = 0; i < n; i++ ) {
443                        u ( i ) = ( i + u0 ) / n;
444                }
445
446                break;
447
448        default:
449                bdm_error ( "PF::resample(): Unknown resampling method" );
450        }
451
452        // U is now full
453        j = 0;
454
455        for ( i = 0; i < n; i++ ) {
456                while ( u ( i ) > cumDist ( j ) ) j++;
457
458                N_babies ( j ) ++;
459        }
460        // We have assigned new babies for each Particle
461        // Now, we fill the resulting index such that:
462        // * particles with at least one baby should not move *
463        // This assures that reassignment can be done inplace;
464
465        // find the first parent;
466        parent = 0;
467        while ( N_babies ( parent ) == 0 ) parent++;
468
469        // Build index
470        for ( i = 0; i < n; i++ ) {
471                if ( N_babies ( i ) > 0 ) {
472                        ind ( i ) = i;
473                        N_babies ( i ) --; //this index was now replicated;
474                } else {
475                        // test if the parent has been fully replicated
476                        // if yes, find the next one
477                        while ( ( N_babies ( parent ) == 0 ) || ( N_babies ( parent ) == 1 && parent > i ) ) parent++;
478
479                        // Replicate parent
480                        ind ( i ) = parent;
481
482                        N_babies ( parent ) --; //this index was now replicated;
483                }
484
485        }
486
487// copy the internals according to ind
488        for ( i = 0; i < n; i++ ) {
489                if ( ind ( i ) != i ) {
490                        samples ( i ) = samples ( ind ( i ) );
491                }
492                w ( i ) = 1.0 / n;
493        }
494}
495
496void eEmp::set_statistics ( const vec &w0, const epdf &epdf0 ) {
497        dim = epdf0.dimension();
498        w = w0;
499        w /= sum ( w0 );//renormalize
500        n = w.length();
501        samples.set_size ( n );
502
503        for ( int i = 0; i < n; i++ ) {
504                samples ( i ) = epdf0.sample();
505        }
506}
507
508void eEmp::set_samples ( const epdf* epdf0 ) {
509        w = 1;
510        w /= sum ( w );//renormalize
511
512        for ( int i = 0; i < n; i++ ) {
513                samples ( i ) = epdf0->sample();
514        }
515}
516
517void migamma_ref::from_setting ( const Setting &set ) {
518        vec ref;
519        UI::get ( ref, set, "ref" , UI::compulsory );
520        set_parameters ( set["k"], ref, set["l"] );
521}
522
523void mlognorm::from_setting ( const Setting &set ) {
524        vec mu0;
525        UI::get ( mu0, set, "mu0", UI::compulsory );
526        set_parameters ( mu0.length(), set["k"] );
527        condition ( mu0 );
528}
529
530void mlstudent::condition ( const vec &cond ) {
531        if ( cond.length() > 0 ) {
532                iepdf._mu() = A * cond + mu_const;
533        } else {
534                iepdf._mu() =  mu_const;
535        }
536        double zeta;
537        //ugly hack!
538        if ( ( cond.length() + 1 ) == Lambda.rows() ) {
539                zeta = Lambda.invqform ( concat ( cond, vec_1 ( 1.0 ) ) );
540        } else {
541                zeta = Lambda.invqform ( cond );
542        }
543        _R = Re;
544        _R *= ( 1 + zeta );// / ( nu ); << nu is in Re!!!!!!
545}
546
547void eEmp::qbounds ( vec &lb, vec &ub, double perc ) const {
548        // lb in inf so than it will be pushed below;
549        lb.set_size ( dim );
550        ub.set_size ( dim );
551        lb = std::numeric_limits<double>::infinity();
552        ub = -std::numeric_limits<double>::infinity();
553        int j;
554        for ( int i = 0; i < n; i++ ) {
555                for ( j = 0; j < dim; j++ ) {
556                        if ( samples ( i ) ( j ) < lb ( j ) ) {
557                                lb ( j ) = samples ( i ) ( j );
558                        }
559                        if ( samples ( i ) ( j ) > ub ( j ) ) {
560                                ub ( j ) = samples ( i ) ( j );
561                        }
562                }
563        }
564}
565
566
567};
Note: See TracBrowser for help on using the browser.