root/library/bdm/base/datasources.h @ 700

Revision 700, 10.0 kB (checked in by smidl, 15 years ago)

Making tutorial/userguide example work again (changes of mpdf and bayes)

  • Property svn:eol-style set to native
Line 
1/*!
2  \file
3  \brief Common DataSources.
4  \author Vaclav Smidl.
5
6  -----------------------------------
7  BDM++ - C++ library for Bayesian Decision Making under Uncertainty
8
9  Using IT++ for numerical operations
10  -----------------------------------
11*/
12
13#ifndef DATASOURCE_H
14#define DATASOURCE_H
15
16
17#include "../base/bdmbase.h"
18#include "../stat/exp_family.h"
19#include "../base/user_info.h"
20
21namespace bdm {
22/*!
23* \brief Memory storage of off-line data column-wise
24
25The data are stored in an internal matrix \c Data . Each column of Data corresponds to one discrete time observation \f$t\f$. Access to this matrix is via indices \c rowid.
26
27The data can be loaded from a file.
28*/
29class MemDS : public DS {
30        protected:
31                //! internal matrix of data
32                mat Data;
33                //! active column in the Data matrix
34                int time;
35                //!  vector of rows that are presented in Dt
36                ivec rowid;
37
38        public:
39                int max_length() {return Data.cols();}
40                void getdata ( vec &dt ) const;
41                void getdata ( vec &dt, const ivec &indeces );
42                void set_drv (const RV &drv,const  RV &urv );
43
44                void write ( const vec &ut ) {
45                        bdm_error ( "MemDS::write is not supported" );
46                }
47
48                void write ( const vec &ut, const ivec &indices ) {
49                        bdm_error ( "MemDS::write is not supported" );
50                }
51
52                void step();
53                //!Default constructor
54                MemDS () {};
55                //! Convenience constructor
56                MemDS ( mat &Dat, ivec &rowid0);
57                /*! Create object from the following structure
58                \code
59                { class = "MemDS";
60                   Data = (...);            // Data matrix or data vector
61                   --- optional ---
62                   drv = {class="RV"; ...} // Identification how rows of the matrix Data will be known to others
63                   time = 0;               // Index of the first column to user_info,
64                   rowid = [1,2,3...];     // ids of rows to be used
65                }
66                \endcode
67               
68                If the optional fields are not given, they will be filled as follows:
69                \code
70                rowid= [0, 1, 2, ...number_of_rows_of_Data];
71                drv = {names=("ch0", "ch1", "ch2", ..."number_of_rows_of_Data");
72                      sizes=( 1    1    1 ...);
73                          times=( 0    0    0 ...);
74                          };
75                time = 0;
76                \endcode
77                If \c rowid is given, \c drv will be named after indeces in rowids.
78               
79                Hence the data provided by method \c getdata() will be full column of matrix Data starting from the first record.
80                */
81                void from_setting(const Setting &set){
82                        UI::get(Data, set, "Data", UI::compulsory);
83                        if(!UI::get(time, set,"time", UI::optional)) {time =0;}
84                        if(!UI::get(rowid, set, "rowid",UI::optional)) {rowid =linspace(0,Data.rows()-1);}
85                        shared_ptr<RV> r=UI::build<RV>(set,"drv",UI::optional);
86                        if (!r) {r=new RV();
87                                for (int i=0; i<rowid.length(); i++){ r->add(RV("ch"+num2str(rowid(i)), 1, 0));}
88                        }
89                        set_drv(*r,RV()); //empty urv
90                        dtsize=r->_dsize();
91                        ytsize = dtsize;
92                        utsize=0;
93                }
94};
95UIREGISTER(MemDS);
96
97/*!  \brief Simulate data from a static pdf (epdf)
98
99Trivial example of a data source, could be used for tests of some estimation algorithms. For example, simulating data from a mixture model and feeding them to mixture model estimators.
100*/
101
102class EpdfDS: public DS {
103        protected:
104                //! internal pointer to epdf from which we samplecond
105                shared_ptr<epdf> iepdf;
106                //! internal storage of data sample
107                vec dt;
108        public:
109                void step() {
110                        dt=iepdf->sample();
111                }
112                void getdata ( vec &dt_out ) const {
113                        dt_out = dt;
114                }
115                void getdata ( vec &dt_out, const ivec &ids ) {
116                        dt_out = dt ( ids );
117                }
118                const RV& _drv() const {
119                        return iepdf->_rv();
120                }
121
122                /*!
123                \code
124                class = "EpdfDS";
125                epdf = {class="epdf_offspring", ...}// uncondtitional density to sample from
126                \endcode
127
128                */
129                void from_setting ( const Setting &set ) {
130                        iepdf=UI::build<epdf> ( set,"epdf",UI::compulsory );
131                        bdm_assert(iepdf->isnamed(), "Input epdf must be named, check if RV is given correctly");
132                        dt =  zeros(iepdf->dimension());
133                        dtsize=dt.length();
134                        ytsize=dt.length();
135                        set_drv(iepdf->_rv(),RV());
136                        utsize =0;
137                        validate();
138                }
139                void validate() {
140                        dt = iepdf->sample();
141                }
142};
143UIREGISTER ( EpdfDS );
144
145/*!  \brief Simulate data from conditional density
146Still having only one density but allowing conditioning on either input or delayed values.
147*/
148class PdfDS :public DS {
149        protected:
150                //! internal pointer to epdf from which we samplecond
151                shared_ptr<pdf> ipdf;
152                //! internal storage of data sample
153                vec yt;
154                //! input vector
155                vec ut;
156                //! datalink between ut and regressor
157                datalink_buffered ut2rgr;
158                //! datalink between yt and regressor
159                datalink_buffered yt2rgr;
160                //! numeric values of regressor
161                vec rgr;
162               
163        public:
164                void step() {
165                        yt2rgr.step(yt); // y is now history
166                        ut2rgr.filldown ( ut,rgr );
167                        yt2rgr.filldown ( yt,rgr );
168                        yt=ipdf->samplecond ( rgr );
169                        ut2rgr.step(ut); //u is now history
170                }
171                void getdata ( vec &dt_out ) const {
172                        bdm_assert_debug(dt_out.length()>=utsize+ytsize,"Short output vector");
173                        dt_out.set_subvector(0, yt);
174                        dt_out.set_subvector(ytsize, ut);
175                }
176                void write(const vec &ut0){ut=ut0;}
177
178                /*!
179                \code
180                class = "PdfDS";
181                pdf = {class="pdf_offspring", ...};  // pdf to simulate
182                --- optional ---
183                init_rv = {class="RV",names=...};      // define what rv to initialize - typically delayed values!
184                init_values = [...];                   // vector of initial values corresponding to init_rv
185                \endcode
186
187                If init_rv is not given, init_values are set to zero.
188                */
189                void from_setting ( const Setting &set ) {
190                        ipdf=UI::build<pdf> ( set,"pdf",UI::compulsory );
191                       
192                        Yrv = ipdf->_rv();
193                        // get unique rvs form rvc
194                        RV rgrv0=ipdf->_rvc().remove_time();
195                        // input is what in not in Yrv
196                        Urv=rgrv0.subt(Yrv); 
197                        set_drv(Yrv, Urv);
198                        // connect input and output to rvc
199                        ut2rgr.set_connection(ipdf->_rvc(), Urv); 
200                        yt2rgr.set_connection(ipdf->_rvc(), Yrv); 
201                       
202                        //set history - if given
203                        shared_ptr<RV> rv_ini=UI::build<RV>(set,"init_rv",UI::optional);
204                        if(rv_ini){ // check if
205                                vec val;
206                                UI::get(val, set, "init_values", UI::optional);
207                                if (val.length()!=rv_ini->_dsize()){
208                                        bdm_error("init_rv and init_values fields have incompatible sizes");
209                                } else {
210                                        ut2rgr.set_history(*rv_ini, val);
211                                        yt2rgr.set_history(*rv_ini, val);
212                                }
213                        }
214
215                        yt = zeros ( ipdf->dimension() );
216                        rgr = zeros ( ipdf->dimensionc() );
217                        ut = zeros(Urv._dsize());
218
219                        ytsize=yt.length();
220                        utsize=ut.length();
221                        dtsize = ytsize+utsize;
222                        validate();
223                }
224                void validate() {
225                        //taken from sample() - shift of history is not done here
226                        ut2rgr.filldown ( ut,rgr );
227                        yt2rgr.filldown ( yt,rgr );
228                        yt=ipdf->samplecond ( rgr );
229                }
230};
231UIREGISTER ( PdfDS );
232
233/*! Pseudovirtual class for reading data from files
234
235*/
236class FileDS: public MemDS {
237
238        public:
239                void getdata ( vec &dt ) {
240                        dt = Data.get_col ( time );
241                }
242
243                void getdata ( vec &dt, const ivec &indices ) {
244                        vec tmp = Data.get_col ( time );
245                        dt = tmp ( indices );
246                }
247
248                //! returns number of data in the file;
249                int ndat() {
250                        return Data.cols();
251                }
252                //! no sense to log this type
253                void log_register(logger &L, const string &prefix){};
254                //! no sense to log this type
255                void log_write ( ) const {};
256};
257
258/*!
259* \brief Read Data Matrix from an IT file
260
261The constructor creates an internal matrix \c Data from an IT++ file. The file is binary and can be made using the IT++ library or the Matlab/Octave function itsave. NB: the data are stored columnwise, i.e. each column contains the data for time \f$t\f$!
262
263*/
264class ITppFileDS: public FileDS {
265
266        public:
267                //! Convenience constructor
268                ITppFileDS ( const string &fname, const string &varname ) : FileDS() {
269                        it_file it ( fname );
270                        it << Name ( varname );
271                        it >> Data;
272                        time = 0;
273                        //rowid and delays are ignored
274                };
275
276                ITppFileDS () : FileDS() {
277                };
278
279                void from_setting ( const Setting &set );
280
281                // TODO dodelat void to_setting( Setting &set ) const;
282
283};
284
285UIREGISTER ( ITppFileDS );
286SHAREDPTR ( ITppFileDS );
287
288/*!
289* \brief CSV file data storage
290The constructor creates \c Data matrix from the records in a CSV file \c fname. The orientation can be of two types:
2911. \c BY_COL which is default - the data are stored in columns; one column per time \f$t\f$, one row per data item.
2922. \c BY_ROW if the data are stored the classical CSV style. Then each column stores the values for data item, for ex. \f$[y_{t} y_{t-1} ...]\f$, one row for each discrete time instant.
293
294*/
295class CsvFileDS: public FileDS {
296
297        public:
298                //! Constructor - create DS from a CSV file.
299                CsvFileDS ( const string& fname, const string& orientation = "BY_COL" );
300};
301
302
303
304// ARXDs - DELETED
305
306//! State-space data source simulating two densities
307class StateDS : public DS {
308        protected:
309                //!conditional pdf of the state evolution \f$ f(x_t|x_{t-1}) \f$
310                shared_ptr<pdf> IM;
311
312                //!conditional pdf of the observations \f$ f(d_t|x_t) \f$
313                shared_ptr<pdf> OM;
314
315                //! result storage
316                vec dt;
317                //! state storage
318                vec xt;
319                //! input storage
320                vec ut;
321
322                //! datalink from ut to IM.rvc
323                datalink_part u2imc;
324                //! datalink from ut to OM.rvc
325                datalink_part u2omc;
326        public:
327                void getdata ( vec &dt0 ) const {
328                        dt0 = dt;
329                }
330                void write (const vec &ut0 ) {
331                        ut = ut0;
332                }
333               
334                void getdata ( vec &dt0, const ivec &indices ) {
335                        dt0 = dt ( indices );
336                }
337
338                virtual void step() {
339                        vec imc(IM->dimensionc());
340                        imc.set_subvector(0,xt);
341                        u2imc.filldown(ut,imc);
342                        xt = IM->samplecond ( imc );
343                       
344                        vec omc(OM->dimensionc());
345                        omc.set_subvector(0,xt);
346                        u2omc.filldown(ut,omc);
347                        vec yt;
348                        yt = OM->samplecond ( omc );
349                        //fill all data
350                        dt.set_subvector(0,yt);
351                        dt.set_subvector(yt.length(),xt);
352                        dt.set_subvector(ytsize,ut);
353                }
354
355                //! set parameters
356                void set_parameters(shared_ptr<pdf> IM0, shared_ptr<pdf> OM0){
357                        IM=IM0;
358                        OM = OM0;
359                }
360                void set_initx(const vec &x0){xt=x0;}
361
362                /*! UI for stateDS
363
364                The DS is constructed from a structure with fields:
365                \code
366                class = "stateDS";
367                //Internal model
368                IM = { type = "pdf-offspring"; };
369                //Observation model
370                OM = { type = "pdf-offspring"; }
371                //initial state
372                x0 = [...]; //vector of data
373                \endcode
374                Both models must have defined \c rv. and \c rvc
375                Random variables not found in any rv are considered to be inputs.
376                */
377                void from_setting ( const Setting &set );
378
379                // TODO dodelat void to_setting( Setting &set ) const;
380
381                void validate();
382};
383
384UIREGISTER ( StateDS );
385SHAREDPTR ( StateDS );
386
387}; //namespace
388
389#endif // DS_H
Note: See TracBrowser for help on using the browser.