root/library/bdm/estim/kalman.cpp @ 907

Revision 907, 11.8 kB (checked in by mido, 14 years ago)

LOG LEVEL improved and hopefully finished

  • Property svn:eol-style set to native
Line 
1
2#include "kalman.h"
3
4namespace bdm {
5
6using std::endl;
7
8
9
10void KalmanFull::bayes ( const vec &yt, const vec &cond ) {
11        bdm_assert_debug ( yt.length() == ( dimy ), "KalmanFull::bayes wrong size of dt" );
12
13        const vec &u = cond; // in this case cond=ut
14        const vec &y = yt;
15
16        vec& mu = est._mu();
17        mat &P = est._R();
18        mat& _Ry = fy._R();
19        vec& yp = fy._mu();
20        //Time update
21        mu = A * mu + B * u;
22        P  = A * P * A.transpose() + ( mat ) Q;
23
24        //Data update
25        _Ry = C * P * C.transpose() + ( mat ) R;
26        _K = P * C.transpose() * inv ( _Ry );
27        P -= _K * C * P; // P = P -KCP;
28        yp = C * mu + D * u;
29        mu += _K * ( y - yp );
30
31        if ( evalll ) {
32                ll = fy.evallog ( y );
33        }
34};
35
36
37
38/////////////////////////////// EKFS
39EKFfull::EKFfull ( ) : KalmanFull () {};
40
41void EKFfull::set_parameters ( const shared_ptr<diffbifn> &pfxu0, const shared_ptr<diffbifn> &phxu0, const mat Q0, const mat R0 ) {
42        pfxu = pfxu0;
43        phxu = phxu0;
44
45        set_dim ( pfxu0->_dimx() );
46        dimy = phxu0->dimension();
47        dimc = pfxu0->_dimu();
48        est.set_parameters ( zeros ( dimension() ), eye ( dimension() ) );
49
50        A.set_size ( dimension(), dimension() );
51        C.set_size ( dimy, dimension() );
52        //initialize matrices A C, later, these will be only updated!
53        pfxu->dfdx_cond ( est._mu(), zeros ( dimc ), A, true );
54        B.clear();
55        phxu->dfdx_cond ( est._mu(), zeros ( dimc ), C, true );
56        D.clear();
57
58        R = R0;
59        Q = Q0;
60}
61
62void EKFfull::bayes ( const vec &yt, const vec &cond ) {
63        bdm_assert_debug ( yt.length() == ( dimy ), "EKFull::bayes wrong size of dt" );
64        bdm_assert_debug ( cond.length() == ( dimc ), "EKFull::bayes wrong size of dt" );
65
66        const vec &u = cond;
67        const vec &y = yt; //lazy to change it
68        vec &mu = est._mu();
69        mat &P = est._R();
70        mat& _Ry = fy._R();
71        vec& yp = fy._mu();
72
73        pfxu->dfdx_cond ( mu, zeros ( dimc ), A, true );
74        phxu->dfdx_cond ( mu, zeros ( dimc ), C, true );
75
76        //Time update
77        mu = pfxu->eval ( mu, u );// A*mu + B*u;
78        P  = A * P * A.transpose() + ( mat ) Q;
79
80        //Data update
81        _Ry = C * P * C.transpose() + ( mat ) R;
82        _K = P * C.transpose() * inv ( _Ry );
83        P -= _K * C * P; // P = P -KCP;
84        yp = phxu->eval ( mu, u );
85        mu += _K * ( y - yp );
86
87        if ( BM::evalll ) {
88                ll = fy.evallog ( y );
89        }
90};
91
92
93
94void KalmanCh::set_parameters ( const mat &A0, const mat &B0, const mat &C0, const mat &D0, const chmat &Q0, const chmat &R0 ) {
95
96        ( ( StateSpace<chmat>* ) this )->set_parameters ( A0, B0, C0, D0, Q0, R0 );
97
98        _K = zeros ( dimension(), dimy );
99}
100
101void KalmanCh::initialize() {
102        preA = zeros ( dimy + dimension() + dimension(), dimy + dimension() );
103//      preA.clear();
104        preA.set_submatrix ( 0, 0, R._Ch() );
105        preA.set_submatrix ( dimy + dimension(), dimy, Q._Ch() );
106}
107
108void KalmanCh::bayes ( const vec &yt, const vec &cond ) {
109        bdm_assert_debug ( yt.length() == dimy, "yt mismatch" );
110        bdm_assert_debug ( cond.length() == dimc, "yt mismatch" );
111
112        const vec &u = cond;
113        const vec &y = yt;
114        vec pom ( dimy );
115
116        chmat &_P = est._R();
117        vec &_mu = est._mu();
118        mat _K ( dimension(), dimy );
119        chmat &_Ry = fy._R();
120        vec &_yp = fy._mu();
121        //TODO get rid of Q in qr()!
122        //      mat Q;
123
124        //R and Q are already set in set_parameters()
125        preA.set_submatrix ( dimy, 0, ( _P._Ch() ) *C.T() );
126        //Fixme can be more efficient if .T() is not used
127        preA.set_submatrix ( dimy, dimy, ( _P._Ch() ) *A.T() );
128
129        if ( !qr ( preA, postA ) ) {
130                bdm_warning ( "QR in KalmanCh unstable!" );
131        }
132
133        ( _Ry._Ch() ) = postA ( 0, dimy - 1, 0, dimy - 1 );
134        _K = inv ( A ) * ( postA ( 0, dimy - 1 , dimy, dimy + dimension() - 1 ) ).T();
135        ( _P._Ch() ) = postA ( dimy, dimy + dimension() - 1, dimy, dimy + dimension() - 1 );
136
137        _mu = A * ( _mu ) + B * u;
138        _yp = C * _mu - D * u;
139
140        backward_substitution ( _Ry._Ch(), ( y - _yp ), pom );
141        _mu += ( _K ) * pom;
142
143        /*              cout << "P:" <<_P.to_mat() <<endl;
144                        cout << "Ry:" <<_Ry.to_mat() <<endl;
145                        cout << "_K:" <<_K <<endl;*/
146
147        if ( evalll == true ) { //likelihood of observation y
148                ll = fy.evallog ( y );
149        }
150}
151
152void StateCanonical::connect_mlnorm ( const mlnorm<fsqmat> &ml ) {
153        //get ids of yrv
154        const RV &yrv = ml._rv();
155        //need to determine u_t - it is all in _rvc that is not in ml._rv()
156        RV rgr0 = ml._rvc().remove_time();
157        RV urv = rgr0.subt ( yrv );
158
159        //We can do only 1d now... :(
160        bdm_assert ( yrv._dsize() == 1, "Only for SISO so far..." );
161
162        // create names for
163        RV xrv; //empty
164        RV Crv; //empty
165        int td = ml._rvc().mint();
166        // assuming strictly proper function!!!
167        for ( int t = -1; t >= td; t-- ) {
168                xrv.add ( yrv.copy_t ( t ) );
169                Crv.add ( urv.copy_t ( t ) );
170        }
171
172        // get mapp
173        th2A.set_connection ( xrv, ml._rvc() );
174        th2C.set_connection ( Crv, ml._rvc() );
175        th2D.set_connection ( urv, ml._rvc() );
176
177        //set matrix sizes
178        this->A = zeros ( xrv._dsize(), xrv._dsize() );
179        for ( int j = 1; j < xrv._dsize(); j++ ) {
180                A ( j, j - 1 ) = 1.0;    // off diagonal
181        }
182        this->B = zeros ( xrv._dsize(), 1 );
183        this->B ( 0 ) = 1.0;
184        this->C = zeros ( 1, xrv._dsize() );
185        this->D = zeros ( 1, urv._dsize() );
186        this->Q = zeros ( xrv._dsize(), xrv._dsize() );
187        // R is set by update
188
189        //set cache
190        this->A1row = zeros ( xrv._dsize() );
191        this->C1row = zeros ( xrv._dsize() );
192        this->D1row = zeros ( urv._dsize() );
193
194        update_from ( ml );
195        validate();
196};
197
198void StateCanonical::update_from ( const mlnorm<fsqmat> &ml ) {
199
200        vec theta = ml._A().get_row ( 0 ); // this
201
202        th2A.filldown ( theta, A1row );
203        th2C.filldown ( theta, C1row );
204        th2D.filldown ( theta, D1row );
205
206        R = ml._R();
207
208        A.set_row ( 0, A1row );
209        C.set_row ( 0, C1row + D1row ( 0 ) *A1row );
210        D.set_row ( 0, D1row );
211}
212
213void StateFromARX::connect_mlnorm ( const mlnorm<chmat> &ml, RV &xrv, RV &urv ) {
214        //get ids of yrv
215        const RV &yrv = ml._rv();
216        //need to determine u_t - it is all in _rvc that is not in ml._rv()
217        const RV &rgr = ml._rvc();
218        RV rgr0 = rgr.remove_time();
219        urv = rgr0.subt ( yrv );
220
221        // create names for state variables
222        xrv = yrv;
223
224        int y_multiplicity = -rgr.mint ( yrv );
225        int y_block_size = yrv.length() * ( y_multiplicity ); // current yt + all delayed yts
226        for ( int m = 0; m < y_multiplicity - 1; m++ ) { // ========= -1 is important see arx2statespace_notes
227                xrv.add ( yrv.copy_t ( -m - 1 ) ); //add delayed yt
228        }
229        //! temporary RV for connection to ml.rvc, since notation of xrv and ml.rvc does not match
230        RV xrv_ml = xrv.copy_t ( -1 );
231
232        // add regressors
233        ivec u_block_sizes ( urv.length() ); // no_blocks = yt + unique rgr
234        for ( int r = 0; r < urv.length(); r++ ) {
235                RV R = urv.subselect ( vec_1 ( r ) ); //non-delayed element of rgr
236                int r_size = urv.size ( r );
237                int r_multiplicity = -rgr.mint ( R );
238                u_block_sizes ( r ) = r_size * r_multiplicity ;
239                for ( int m = 0; m < r_multiplicity; m++ ) {
240                        xrv.add ( R.copy_t ( -m - 1 ) ); //add delayed yt
241                        xrv_ml.add ( R.copy_t ( -m - 1 ) ); //add delayed yt
242                }
243        }
244        // add constant
245        if ( any ( ml._mu_const() != 0.0 ) ) {
246                have_constant = true;
247                xrv.add ( RV ( "bdm_reserved_constant_one", 1 ) );
248        } else {
249                have_constant = false;
250        }
251
252
253        // get mapp
254        th2A.set_connection ( xrv_ml, ml._rvc() );
255        th2B.set_connection ( urv, ml._rvc() );
256
257        //set matrix sizes
258        this->A = zeros ( xrv._dsize(), xrv._dsize() );
259        //create y block
260        diagonal_part ( this->A, yrv._dsize(), 0, y_block_size - yrv._dsize() );
261
262        this->B = zeros ( xrv._dsize(), urv._dsize() );
263        //add diagonals for rgr
264        int active_x = y_block_size;
265        int active_Bcol = 0;
266        for ( int r = 0; r < urv.length(); r++ ) {
267                if (u_block_sizes(r)>0){
268                        diagonal_part ( this->A, active_x + urv.size ( r ), active_x, u_block_sizes ( r ) - urv.size ( r ) );
269                        this->B.set_submatrix ( active_x, active_Bcol, eye ( urv.size ( r ) ) );
270                        active_Bcol+=u_block_sizes(r);
271                }
272                active_x += u_block_sizes ( r );
273        }
274        this->C = zeros ( yrv._dsize(), xrv._dsize() );
275        this->C.set_submatrix ( 0, 0, eye ( yrv._dsize() ) );
276        this->D = zeros ( yrv._dsize(), urv._dsize() );
277        this->R.setCh ( zeros ( yrv._dsize(), yrv._dsize() ) );
278        this->Q.setCh ( zeros ( xrv._dsize(), xrv._dsize() ) );
279        // Q is set by update
280
281        update_from ( ml );
282        validate();
283}
284       
285void StateFromARX::update_from ( const mlnorm<chmat> &ml ) {
286        vec Arow = zeros ( A.cols() );
287        vec Brow = zeros ( B.cols() );
288        //  ROW- WISE EVALUATION =====
289        for ( int i = 0; i < ml._rv()._dsize(); i++ ) {
290
291                vec theta = ml._A().get_row ( i );
292
293                th2A.filldown ( theta, Arow );
294                if ( have_constant ) {
295                        // constant is always at the end no need for datalink
296                        Arow ( A.cols() - 1 ) = ml._mu_const() ( i );
297                }
298                this->A.set_row ( i, Arow );
299
300                th2B.filldown ( theta, Brow );
301                this->B.set_row ( i, Brow );
302        }
303        this->Q._Ch().set_submatrix ( 0, 0, ml.__R()._Ch() );
304
305}
306
307
308void EKFCh::set_parameters ( const shared_ptr<diffbifn> &pfxu0, const shared_ptr<diffbifn> &phxu0, const chmat Q0, const chmat R0 ) {
309        pfxu = pfxu0;
310        phxu = phxu0;
311
312        set_dim ( pfxu0->_dimx() );
313        dimy = phxu0->dimension();
314        dimc = pfxu0->_dimu();
315
316        vec &_mu = est._mu();
317        // if mu is not set, set it to zeros, just for constant terms of A and C
318        if ( _mu.length() != dimension() ) _mu = zeros ( dimension() );
319        A = zeros ( dimension(), dimension() );
320        C = zeros ( dimy, dimension() );
321        preA = zeros ( dimy + dimension() + dimension(), dimy + dimension() );
322
323        //initialize matrices A C, later, these will be only updated!
324        pfxu->dfdx_cond ( _mu, zeros ( dimc ), A, true );
325//      pfxu->dfdu_cond ( *_mu,zeros ( dimu ),B,true );
326        B.clear();
327        phxu->dfdx_cond ( _mu, zeros ( dimc ), C, true );
328//      phxu->dfdu_cond ( *_mu,zeros ( dimu ),D,true );
329        D.clear();
330
331        R = R0;
332        Q = Q0;
333
334        // Cholesky special!
335        preA.clear();
336        preA.set_submatrix ( 0, 0, R._Ch() );
337        preA.set_submatrix ( dimy + dimension(), dimy, Q._Ch() );
338}
339
340
341void EKFCh::bayes ( const vec &yt, const vec &cond ) {
342
343        vec pom ( dimy );
344        const vec &u = cond;
345        const vec &y = yt;
346        vec &_mu = est._mu();
347        chmat &_P = est._R();
348        chmat &_Ry = fy._R();
349        vec &_yp = fy._mu();
350
351        pfxu->dfdx_cond ( _mu, u, A, false ); //update A by a derivative of fx
352        phxu->dfdx_cond ( _mu, u, C, false ); //update A by a derivative of fx
353
354        //R and Q are already set in set_parameters()
355        preA.set_submatrix ( dimy, 0, ( _P._Ch() ) *C.T() );
356        //Fixme can be more efficient if .T() is not used
357        preA.set_submatrix ( dimy, dimy, ( _P._Ch() ) *A.T() );
358
359//      mat Sttm = _P->to_mat();
360//      cout << preA <<endl;
361//      cout << "_mu:" << _mu <<endl;
362
363        if ( !qr ( preA, postA ) ) {
364                bdm_warning ( "QR in EKFCh unstable!" );
365        }
366
367
368        ( _Ry._Ch() ) = postA ( 0, dimy - 1, 0, dimy - 1 );
369        _K = inv ( A ) * ( postA ( 0, dimy - 1 , dimy, dimy + dimension() - 1 ) ).T();
370        ( _P._Ch() ) = postA ( dimy, dimy + dimension() - 1, dimy, dimy + dimension() - 1 );
371
372//      mat iRY = inv(_Ry->to_mat());
373//      mat Stt = Sttm - Sttm * C.T() * iRY * C * Sttm;
374//      mat _K2 = Stt*C.T()*inv(R.to_mat());
375
376        // prediction
377        _mu = pfxu->eval ( _mu , u );
378        _yp = phxu->eval ( _mu, u );
379
380        /*      vec mu2 = *_mu + ( _K2 ) * ( y-*_yp );*/
381
382        //correction //= initial value is already prediction!
383        backward_substitution ( _Ry._Ch(), ( y - _yp ), pom );
384        _mu += ( _K ) * pom ;
385
386        /*      _K = (_P->to_mat())*C.transpose() * ( _iRy->to_mat() );
387                *_mu = pfxu->eval ( *_mu ,u ) + ( _K )* ( y-*_yp );*/
388
389//              cout << "P:" <<_P.to_mat() <<endl;
390//              cout << "Ry:" <<_Ry.to_mat() <<endl;
391//      cout << "_mu:" <<_mu <<endl;
392//      cout << "dt:" <<dt <<endl;
393
394        if ( evalll == true ) { //likelihood of observation y
395                ll = fy.evallog ( y );
396        }
397}
398
399void EKFCh::from_setting ( const Setting &set ) {
400        BM::from_setting ( set );
401        shared_ptr<diffbifn> IM = UI::build<diffbifn> ( set, "IM", UI::compulsory );
402        shared_ptr<diffbifn> OM = UI::build<diffbifn> ( set, "OM", UI::compulsory );
403
404        //statistics
405        int dim = IM->dimension();
406        vec mu0;
407        if ( !UI::get ( mu0, set, "mu0" ) )
408                mu0 = zeros ( dim );
409
410        mat P0;
411        vec dP0;
412        if ( UI::get ( dP0, set, "dP0" ) )
413                P0 = diag ( dP0 );
414        else if ( !UI::get ( P0, set, "P0" ) )
415                P0 = eye ( dim );
416
417        set_statistics ( mu0, P0 );
418
419        //parameters
420        vec dQ, dR;
421        UI::get ( dQ, set, "dQ", UI::compulsory );
422        UI::get ( dR, set, "dR", UI::compulsory );
423        set_parameters ( IM, OM, diag ( dQ ), diag ( dR ) );
424}
425
426void MultiModel::from_setting ( const Setting &set ) {
427        Array<EKFCh*> A;
428        UI::get ( A, set, "models", UI::compulsory );
429
430        set_parameters ( A );
431        set_yrv ( A ( 0 )->_yrv() );
432        //set_rv(A(0)->_rv());
433}
434
435}
Note: See TracBrowser for help on using the browser.