root/library/bdm/stat/exp_family.cpp @ 847

Revision 847, 13.5 kB (checked in by smidl, 14 years ago)

egiw - patch - TODO

  • Property svn:eol-style set to native
Line 
1#include <math.h>
2
3#include <itpp/base/bessel.h>
4#include "exp_family.h"
5
6namespace bdm {
7
8Uniform_RNG UniRNG;
9Normal_RNG NorRNG;
10Gamma_RNG GamRNG;
11
12using std::cout;
13
14///////////
15
16void BMEF::bayes ( const vec &yt, const vec &cond ) {
17        this->bayes_weighted ( yt, cond, 1.0 );
18};
19
20void egiw::set_parameters ( int dimx0, ldmat V0, double nu0 ) {
21        dimx = dimx0;
22        nPsi = V0.rows() - dimx;
23        dim = dimx * ( dimx + nPsi ); // size(R) + size(Theta)
24
25        V = V0;
26        if ( nu0 < 0 ) {
27                nu = 0.1 + nPsi + 2 * dimx + 2; // +2 assures finite expected value of R
28                // terms before that are sufficient for finite normalization
29        } else {
30                nu = nu0;
31        }
32}
33
34vec egiw::sample() const {
35        mat M;
36        chmat R;
37        sample_mat ( M, R );
38
39        return concat ( cvectorize ( M ), cvectorize ( R.to_mat() ) );
40}
41
42mat egiw::sample_mat ( int n ) const {
43        // TODO - correct approach - convert to product of norm * Wishart
44        mat M;
45        ldmat Vz;
46        ldmat Lam;
47        factorize ( M, Vz, Lam );
48
49        chmat ChLam ( Lam.to_mat() );
50        chmat iChLam;
51        ChLam.inv ( iChLam );
52
53        eWishartCh Omega; //inverse Wishart, result is R,
54        Omega.set_parameters ( iChLam, nu - 2*nPsi - dimx ); // 2*nPsi is there to match numercial simulations - check if analytically correct
55
56        mat OmChi;
57        mat Z ( M.rows(), M.cols() );
58
59        mat Mi;
60        mat RChiT;
61        mat tmp ( dimension(), n );
62        M=M.T();// ugly hack == decide what to do with M.
63        for ( int i = 0; i < n; i++ ) {
64                OmChi = Omega.sample_mat();
65                RChiT = inv ( OmChi );
66                Z = randn ( M.rows(), M.cols() );
67                Mi = M + RChiT * Z * inv ( Vz._L().T() * diag ( sqrt ( Vz._D() ) ) );
68
69                tmp.set_col ( i, concat ( cvectorize ( Mi ), cvectorize ( RChiT*RChiT.T() ) ) );
70        }
71        return tmp;
72}
73
74void egiw::sample_mat ( mat &Mi, chmat &Ri ) const {
75
76        // TODO - correct approach - convert to product of norm * Wishart
77        mat M;
78        ldmat Vz;
79        ldmat Lam;
80        factorize ( M, Vz, Lam );
81
82        chmat Ch;
83        Ch.setCh ( Lam._L() *diag ( sqrt ( Lam._D() ) ) );
84        chmat iCh;
85        Ch.inv ( iCh );
86
87        eWishartCh Omega; //inverse Wishart, result is R,
88        Omega.set_parameters ( iCh, nu - 2*nPsi - dimx ); // 2*nPsi is there to match numercial simulations - check if analytically correct
89
90        chmat Omi;
91        Omi.setCh ( Omega.sample_mat() );
92
93        if (M._datasize()>0){
94                mat Z = randn ( M.rows(), M.cols() );
95                Mi = M + Omi._Ch() * Z * inv ( Vz._L() * diag ( sqrt ( Vz._D() ) ) );
96        }
97        Omi.inv ( Ri );
98}
99
100double egiw::evallog_nn ( const vec &val ) const {
101        bdm_assert_debug(val.length()==dimx*(nPsi+dimx),"Incorrect cond in egiw::evallog_nn" );
102       
103        int vend = val.length() - 1;
104
105        if ( dimx == 1 ) { //same as the following, just quicker.
106                double r = val ( vend ); //last entry!
107                if ( r < 0 ) return -inf;
108                vec Psi ( nPsi + dimx );
109                Psi ( 0 ) = -1.0;
110                Psi.set_subvector ( 1, val ( 0, vend - 1 ) ); // fill the rest
111
112                double Vq = V.qform ( Psi );
113                return -0.5* ( nu*log ( r ) + Vq / r );
114        } else {
115                mat Tmp;
116                if (nPsi>0){
117                        mat Th = reshape ( val ( 0, nPsi * dimx - 1 ), nPsi, dimx );
118                        Tmp = concat_vertical ( -eye ( dimx ), Th );
119                } else {
120                        Tmp = -eye(dimx);
121                }
122                fsqmat R ( reshape ( val ( nPsi*dimx, vend ), dimx, dimx ) );
123                double ldetR = R.logdet();
124                if ( !std::isfinite(ldetR) ) return -inf;
125                fsqmat iR ( dimx );
126                R.inv ( iR );
127
128                return -0.5* ( nu*ldetR + trace ( iR.to_mat() *Tmp.T() *V.to_mat() *Tmp ) );
129        }
130}
131
132double egiw::lognc() const {
133        const vec& D = V._D();
134
135        double m = nu - nPsi - dimx - 1;
136#define log2  0.693147180559945286226763983
137#define logpi 1.144729885849400163877476189
138#define log2pi 1.83787706640935
139#define Inf std::numeric_limits<double>::infinity()
140
141        double nkG = 0.5 * dimx * ( -nPsi * log2pi + sum ( log ( D.mid ( dimx, nPsi ) ) ) );
142        // temporary for lgamma in Wishart
143        double lg = 0;
144        for ( int i = 0; i < dimx; i++ ) {
145                lg += lgamma ( 0.5 * ( m - i ) );
146        }
147
148        double nkW = 0.5 * ( m * sum ( log ( D ( 0, dimx - 1 ) ) ) ) \
149                     - 0.5 * dimx * ( m * log2 + 0.5 * ( dimx - 1 ) * log2pi )  - lg;
150
151//      bdm_assert_debug ( ( ( -nkG - nkW ) > -Inf ) && ( ( -nkG - nkW ) < Inf ), "ARX improper" );
152        if ( -nkG - nkW == Inf ) {
153                cout << "??" << endl;
154        }
155        return -nkG - nkW;
156}
157
158vec egiw::est_theta() const {
159        if ( dimx == 1 ) {
160                const mat &L = V._L();
161                int end = L.rows() - 1;
162
163                mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
164
165                vec L0 = L.get_col ( 0 );
166
167                return iLsub * L0 ( 1, end );
168        } else {
169                bdm_error ( "ERROR: est_theta() not implemented for dimx>1" );
170                return vec();
171        }
172}
173
174void egiw::factorize ( mat &M, ldmat &Vz, ldmat &Lam ) const {
175        const mat &L = V._L();
176        const vec &D = V._D();
177        int end = L.rows() - 1;
178
179        Lam = ldmat ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) );  //exp val of R
180
181        if (dimx<=end){
182                Vz = ldmat ( L ( dimx, end, dimx, end ), D ( dimx, end ) );
183                mat iLsub = ltuinv ( Vz._L() );
184                // set mean value
185                mat Lpsi = L ( dimx, end, 0, dimx - 1 );
186                M = iLsub * Lpsi;
187        }
188/*      if ( 0 ) { // test with Peterka
189                mat VF = V.to_mat();
190                mat Vf = VF ( 0, dimx - 1, 0, dimx - 1 );
191                mat Vzf = VF ( dimx, end, 0, dimx - 1 );
192                mat VZ = VF ( dimx, end, dimx, end );
193
194                mat Lam2 = Vf - Vzf.T() * inv ( VZ ) * Vzf;
195        }*/
196}
197
198ldmat egiw::est_theta_cov() const {
199        if ( dimx == 1 ) {
200                const mat &L = V._L();
201                const vec &D = V._D();
202                int end = D.length() - 1;
203
204                mat Lsub = L ( 1, end, 1, end );
205//              mat Dsub = diag ( D ( 1, end ) );
206
207                ldmat LD ( inv ( Lsub ).T(), 1.0 / D ( 1, end ) );
208                return LD;
209
210        } else {
211                bdm_error ( "ERROR: est_theta_cov() not implemented for dimx>1" );
212                return ldmat();
213        }
214
215}
216
217vec egiw::mean() const {
218
219        if ( dimx == 1 ) {
220                const vec &D = V._D();
221                int end = D.length() - 1;
222
223                vec m ( dim );
224                m.set_subvector ( 0, est_theta() );
225                m ( end ) = D ( 0 ) / ( nu - nPsi - 2 * dimx - 2 );
226                return m;
227        } else {
228                mat M;
229                mat R;
230                mean_mat ( M, R );
231                return concat ( cvectorize ( M ), cvectorize ( R ) );
232        }
233
234}
235
236vec egiw::variance() const {
237        int l = V.rows();
238        // cut out rest of lower-right part of V
239        // invert it
240        ldmat itmp ( l );
241        if (dimx<l){
242                const ldmat tmp ( V, linspace ( dimx, l - 1 ) );
243                tmp.inv ( itmp );
244        }
245        // following Wikipedia notation
246        // m=nu-nPsi-dimx-1, p=dimx
247        double mp1p = nu - nPsi - 2 * dimx; // m-p+1
248        double mp1m = mp1p - 2;     // m-p-1
249
250        if ( dimx == 1 ) {
251                double cove = V._D() ( 0 ) / mp1m ;
252
253                vec var ( l );
254                var.set_subvector ( 0, diag ( itmp.to_mat() ) *cove );
255                var ( l - 1 ) = cove * cove / ( mp1m - 2 );
256                return var;
257        } else {
258                ldmat Vll ( V, linspace ( 0, dimx - 1 ) ); // top-left part of V
259                mat Y = Vll.to_mat();
260                mat varY ( Y.rows(), Y.cols() );
261
262                double denom = ( mp1p - 1 ) * mp1m * mp1m * ( mp1m - 2 );         // (m-p)(m-p-1)^2(m-p-3)
263
264                int i, j;
265                for ( i = 0; i < Y.rows(); i++ ) {
266                        for ( j = 0; j < Y.cols(); j++ ) {
267                                varY ( i, j ) = ( mp1p * Y ( i, j ) * Y ( i, j ) + mp1m * Y ( i, i ) * Y ( j, j ) ) / denom;
268                        }
269                }
270                vec mean_dR = diag ( Y ) / mp1m; // corresponds to cove
271                vec var_th = diag ( itmp.to_mat() );
272                vec var_Th ( mean_dR.length() *var_th.length() );
273                // diagonal of diag(mean_dR) \kron diag(var_th)
274                for ( int i = 0; i < mean_dR.length(); i++ ) {
275                        var_Th.set_subvector ( i*var_th.length(), var_th*mean_dR ( i ) );
276                }
277
278                return concat ( var_Th, cvectorize ( varY ) );
279        }
280}
281
282void egiw::mean_mat ( mat &M, mat&R ) const {
283        const mat &L = V._L();
284        const vec &D = V._D();
285        int end = L.rows() - 1;
286
287        ldmat ldR ( L ( 0, dimx - 1, 0, dimx - 1 ), D ( 0, dimx - 1 ) / ( nu - nPsi - 2*dimx - 2 ) ); //exp val of R
288
289        // set mean value
290        if (dimx<=end){
291                mat iLsub = ltuinv ( L ( dimx, end, dimx, end ) );
292                mat Lpsi = L ( dimx, end, 0, dimx - 1 );
293                M = iLsub * Lpsi;
294        }
295        R = ldR.to_mat()  ;
296}
297
298void egiw::log_register ( bdm::logger& L, const string& prefix ) {
299        if ( log_level == 3 ) {
300                root::log_register ( L, prefix );
301                logrec->ids.set_length ( 2 );
302                int th_dim = dimension() - dimx * ( dimx + 1 ) / 2;
303                logrec->ids ( 0 ) = L.add_vector ( RV ( "", th_dim ), prefix + logrec->L.prefix_sep() + "mean" );
304                logrec->ids ( 1 ) = L.add_vector ( RV ( "", th_dim * th_dim ), prefix + logrec->L.prefix_sep() + "variance" );
305        } else {
306                epdf::log_register ( L, prefix );
307        }
308}
309
310void egiw::log_write() const {
311        if ( log_level == 3 ) {
312                mat M;
313                ldmat Lam;
314                ldmat Vz;
315                factorize ( M, Vz, Lam );
316                logrec->L.log_vector ( logrec->ids ( 0 ), est_theta() );
317                logrec->L.log_vector ( logrec->ids ( 1 ), cvectorize ( est_theta_cov().to_mat() ) );
318        } else {
319                epdf::log_write();
320        }
321
322}
323
324void multiBM::bayes ( const vec &yt, const vec &cond ) {
325        if ( frg < 1.0 ) {
326                beta *= frg;
327                last_lognc = est.lognc();
328        }
329        beta += yt;
330        if ( evalll ) {
331                ll = est.lognc() - last_lognc;
332        }
333}
334
335double multiBM::logpred ( const vec &yt ) const {
336        eDirich pred ( est );
337        vec &beta = pred._beta();
338
339        double lll;
340        if ( frg < 1.0 ) {
341                beta *= frg;
342                lll = pred.lognc();
343        } else if ( evalll ) {
344                lll = last_lognc;
345        } else {
346                lll = pred.lognc();
347        }
348
349        beta += yt;
350        return pred.lognc() - lll;
351}
352void multiBM::flatten ( const BMEF* B ) {
353        const multiBM* E = dynamic_cast<const multiBM*> ( B );
354        // sum(beta) should be equal to sum(B.beta)
355        const vec &Eb = E->beta;//const_cast<multiBM*> ( E )->_beta();
356        beta *= ( sum ( Eb ) / sum ( beta ) );
357        if ( evalll ) {
358                last_lognc = est.lognc();
359        }
360}
361
362vec egamma::sample() const {
363        vec smp ( dim );
364        int i;
365
366        for ( i = 0; i < dim; i++ ) {
367                if ( beta ( i ) > std::numeric_limits<double>::epsilon() ) {
368                        GamRNG.setup ( alpha ( i ), beta ( i ) );
369                } else {
370                        GamRNG.setup ( alpha ( i ), std::numeric_limits<double>::epsilon() );
371                }
372#pragma omp critical
373                smp ( i ) = GamRNG();
374        }
375
376        return smp;
377}
378
379// mat egamma::sample ( int N ) const {
380//      mat Smp ( rv.count(),N );
381//      int i,j;
382//
383//      for ( i=0; i<rv.count(); i++ ) {
384//              GamRNG.setup ( alpha ( i ),beta ( i ) );
385//
386//              for ( j=0; j<N; j++ ) {
387//                      Smp ( i,j ) = GamRNG();
388//              }
389//      }
390//
391//      return Smp;
392// }
393
394double egamma::evallog ( const vec &val ) const {
395        double res = 0.0; //the rest will be added
396        int i;
397
398        if ( any ( val <= 0. ) ) return -inf;
399        if ( any ( beta <= 0. ) ) return -inf;
400        for ( i = 0; i < dim; i++ ) {
401                res += ( alpha ( i ) - 1 ) * std::log ( val ( i ) ) - beta ( i ) * val ( i );
402        }
403        double tmp = res - lognc();;
404        bdm_assert_debug ( std::isfinite ( tmp ), "Infinite value" );
405        return tmp;
406}
407
408double egamma::lognc() const {
409        double res = 0.0; //will be added
410        int i;
411
412        for ( i = 0; i < dim; i++ ) {
413                res += lgamma ( alpha ( i ) ) - alpha ( i ) * std::log ( beta ( i ) ) ;
414        }
415
416        return res;
417}
418
419void mgamma::set_parameters ( double k0, const vec &beta0 ) {
420        k = k0;
421        iepdf.set_parameters ( k * ones ( beta0.length() ), beta0 );
422        dimc = iepdf.dimension();
423        dim = iepdf.dimension();
424}
425
426void eEmp::resample ( ivec &ind, RESAMPLING_METHOD method ) {
427        ind = zeros_i ( n );
428        ivec N_babies = zeros_i ( n );
429        vec cumDist = cumsum ( w );
430        vec u ( n );
431        int i, j, parent;
432        double u0;
433
434        switch ( method ) {
435        case MULTINOMIAL:
436                u ( n - 1 ) = pow ( UniRNG.sample(), 1.0 / n );
437
438                for ( i = n - 2; i >= 0; i-- ) {
439                        u ( i ) = u ( i + 1 ) * pow ( UniRNG.sample(), 1.0 / ( i + 1 ) );
440                }
441
442                break;
443
444        case STRATIFIED:
445
446                for ( i = 0; i < n; i++ ) {
447                        u ( i ) = ( i + UniRNG.sample() ) / n;
448                }
449
450                break;
451
452        case SYSTEMATIC:
453                u0 = UniRNG.sample();
454
455                for ( i = 0; i < n; i++ ) {
456                        u ( i ) = ( i + u0 ) / n;
457                }
458
459                break;
460
461        default:
462                bdm_error ( "PF::resample(): Unknown resampling method" );
463        }
464
465        // U is now full
466        j = 0;
467
468        for ( i = 0; i < n; i++ ) {
469                while ( u ( i ) > cumDist ( j ) ) j++;
470
471                N_babies ( j ) ++;
472        }
473        // We have assigned new babies for each Particle
474        // Now, we fill the resulting index such that:
475        // * particles with at least one baby should not move *
476        // This assures that reassignment can be done inplace;
477
478        // find the first parent;
479        parent = 0;
480        while ( N_babies ( parent ) == 0 ) parent++;
481
482        // Build index
483        for ( i = 0; i < n; i++ ) {
484                if ( N_babies ( i ) > 0 ) {
485                        ind ( i ) = i;
486                        N_babies ( i ) --; //this index was now replicated;
487                } else {
488                        // test if the parent has been fully replicated
489                        // if yes, find the next one
490                        while ( ( N_babies ( parent ) == 0 ) || ( N_babies ( parent ) == 1 && parent > i ) ) parent++;
491
492                        // Replicate parent
493                        ind ( i ) = parent;
494
495                        N_babies ( parent ) --; //this index was now replicated;
496                }
497
498        }
499
500// copy the internals according to ind
501        for ( i = 0; i < n; i++ ) {
502                if ( ind ( i ) != i ) {
503                        samples ( i ) = samples ( ind ( i ) );
504                }
505                w ( i ) = 1.0 / n;
506        }
507}
508
509void eEmp::set_statistics ( const vec &w0, const epdf &epdf0 ) {
510        dim = epdf0.dimension();
511        w = w0;
512        w /= sum ( w0 );//renormalize
513        n = w.length();
514        samples.set_size ( n );
515
516        for ( int i = 0; i < n; i++ ) {
517                samples ( i ) = epdf0.sample();
518        }
519}
520
521void eEmp::set_samples ( const epdf* epdf0 ) {
522        w = 1;
523        w /= sum ( w );//renormalize
524
525        for ( int i = 0; i < n; i++ ) {
526                samples ( i ) = epdf0->sample();
527        }
528}
529
530void migamma_ref::from_setting ( const Setting &set ) {
531        vec ref;
532        UI::get ( ref, set, "ref" , UI::compulsory );
533        set_parameters ( set["k"], ref, set["l"] );
534}
535
536void mlognorm::from_setting ( const Setting &set ) {
537        vec mu0;
538        UI::get ( mu0, set, "mu0", UI::compulsory );
539        set_parameters ( mu0.length(), set["k"] );
540        condition ( mu0 );
541}
542
543void mlstudent::condition ( const vec &cond ) {
544        if ( cond.length() > 0 ) {
545                iepdf._mu() = A * cond + mu_const;
546        } else {
547                iepdf._mu() =  mu_const;
548        }
549        double zeta;
550        //ugly hack!
551        if ( ( cond.length() + 1 ) == Lambda.rows() ) {
552                zeta = Lambda.invqform ( concat ( cond, vec_1 ( 1.0 ) ) );
553        } else {
554                zeta = Lambda.invqform ( cond );
555        }
556        _R = Re;
557        _R *= ( 1 + zeta );// / ( nu ); << nu is in Re!!!!!!
558}
559
560void eEmp::qbounds ( vec &lb, vec &ub, double perc ) const {
561        // lb in inf so than it will be pushed below;
562        lb.set_size ( dim );
563        ub.set_size ( dim );
564        lb = std::numeric_limits<double>::infinity();
565        ub = -std::numeric_limits<double>::infinity();
566        int j;
567        for ( int i = 0; i < n; i++ ) {
568                for ( j = 0; j < dim; j++ ) {
569                        if ( samples ( i ) ( j ) < lb ( j ) ) {
570                                lb ( j ) = samples ( i ) ( j );
571                        }
572                        if ( samples ( i ) ( j ) > ub ( j ) ) {
573                                ub ( j ) = samples ( i ) ( j );
574                        }
575                }
576        }
577}
578
579
580};
Note: See TracBrowser for help on using the browser.