Context Navigation

matrix_vs.cpp @ 1454

Revision 1340, 18.1 kB (checked in by smidl, 14 years ago)
format of D is now explicitely qD. Good choice for 2d model is 13

Line
1	/************************************
2	Extended Kalman Filter
3	Matrix operations
4
5	V. Smidl, Z. Peroutka
6
7	Rev. 28.10.2010 (ZP)
8
9	26.10.2010 Prvni verze (VS)
10
11	26.10.2010 Upravena chyba v Thorton_fast - spatne shiftovani o vypoctu SIGMA.
12	27.10.2010 Pokus o odstraneni problemu v Thorton_fast - potize dela omezovani (orezavani) varianci.
13	28.10.2010 Drobne upravy v kodu.
14
15	*************************************/
16
17	#include "matrix_vs.h"
18	#include <math.h>
19	#include "matrix.h"
20
21	#include <stdio.h>
22	/* Matrix multiply Full matrix by upper diagonal matrix; */
23	void mmultAU(int16 m1, int16 up, int16 *result, unsigned int16 rows, unsigned int16 columns) {
24	unsigned int16 i, j, k;
25	int32 tmp_sum=0L; //in 15+qAU
26	int16 *m2pom;
27	int16 *m1pom=m1;
28	int16 *respom=result;
29
30	for (i=0; i<rows; i++) //rows of result
31	{
32	for (j=0; j<columns; j++) //columns of result
33	{
34	m2pom=up+j;//??
35
36	for (k=0; k<j; k++) //inner loop up to "j" - U(j,j)==1;
37	{
38	tmp_sum+=((int32)((m1pom++))*m2pom)>>(15-qAU);
39	m2pom+=columns;
40	}
41	// add the missing A(i,j)
42	tmp_sum +=(int32)(*m1pom)<<qAU; // no need to shift
43	m1pom-=(j); // shift back to first element
44
45	*respom++=tmp_sum>>15;
46
47	tmp_sum=0;
48	}
49	m1pom+=(columns);
50	}
51	};
52
53	//same as mmultAU but different precision
54	void mmultCU(int16 m1, int16 up, int16 *result, unsigned int16 rows, unsigned int16 columns) {
55	unsigned int16 i, j, k;
56	int32 tmp_sum=0L; //in 15+qAU
57	int16 *m2pom;
58	int16 *m1pom=m1;
59	int16 *respom=result;
60
61	for (i=0; i<rows; i++) //rows of result
62	{
63	for (j=0; j<columns; j++) //columns of result
64	{
65	m2pom=up+j;//??
66
67	for (k=0; k<j; k++) //inner loop up to "j" - U(j,j)==1;
68	{
69	tmp_sum+=((int32)((m1pom++))*m2pom)>>(15-qCU);
70	m2pom+=columns;
71	}
72	// add the missing A(i,j)
73	tmp_sum +=(int32)(*m1pom)<<qCU; // no need to shift
74	m1pom-=(j); // shift back to first element
75
76	*respom++=tmp_sum>>15;
77
78	tmp_sum=0;
79	}
80	m1pom+=(columns);
81	}
82	};
83
84
85	void bierman_fast(int16 difz, int16 xp, int16 U, int16 D, int16 *R, unsigned int16 dimy, unsigned int16 dimx )
86	{
87	int16 alpha; // in qD!!
88	int16 beta,lambda;
89	int16 b[5]; // ok even for 4-dim state // in qD!!!
90	int16 *a; // in [0,1] -> q15
91	unsigned int16 iy,j,i;
92
93	int16 b_j,b_i;
94	int16 *a_j;
95	int16 *D_j;
96	int16 *U_ij;
97	int16 *x_i;
98
99	int16 Ucopy[16];
100
101	/* copy U for vector a */
102	int16 *Uc_i=Ucopy;
103	int16 *U_i=U;
104	for (i=0;i<dimxdimx;i++) (Uc_i++)=*(U_i++);
105
106	a = Ucopy; // iyth row of U
107	for (iy=0; iy<dimy; iy++, a+=dimx) {
108	// a is a row
109	for (j=0,a_j=a,b_j=b,D_j=D; j<dimx; j++,b_j++,D_j++,a_j++)
110	b_j=((int32)(D_j)(a_j))>>15;
111
112	alpha = (R[iy])>>(15-qD); //\alpha = R+vDv = R+a*b
113	for (j=0,a_j=a,b_j=b,D_j=D; j<dimx; j++,a_j++,b_j++,D_j++) {
114
115	lambda=alpha; // in qD
116	alpha += ((int32)(a_j)(*b_j))>>15;
117	D[j] = ((int32)lambda**D_j)/alpha;
118
119	if (D_j==0) D_j=1;
120
121	for (i=0,b_i=b,U_ij=U+j; i<j; i++, b_i++,U_ij+=dimx) {
122	beta = *U_ij;
123	U_ij -= ((int32)(a_j)(b_i))/lambda; // pozadovane optimalni reseni
124	b_i += ((int32)beta(*b_j))>>15;
125	}
126	}
127	// no shift due to gamma
128	for (i=0,x_i=xp,b_i=b; i<dimx; i++,x_i++,b_i++) {
129	x_i += ((int32)difz[iy](*b_i))/alpha; // multiply by unscaled Kalman gain
130	}
131	}
132	}
133
134	void bierman_fastC(int16 difz, int16 xp, int16 U, int16 D, int16 C, int16 R, unsigned int16 dimy, unsigned int16 dimx )
135	{
136	int16 alpha; // in qD
137	int16 beta,lambda;
138	int16 b[5]; // ok even for 4-dim state // in qD
139	int16 *a; // in [0,1] -> qCU
140	unsigned int16 iy,j,i;
141
142	int16 b_j,b_i;
143	int16 *a_j;
144	int16 *D_j;
145	int16 *U_ij;
146	int16 *x_i;
147
148	// int32 z_pom;
149	// int16 z_pom_int16;
150
151	int16 UC[16]; // in q15
152
153	/* copy U for vector a */
154	mmultCU(C,U,UC,dimy,dimx);
155
156	a = UC; // iyth row of U
157	for (iy=0; iy<dimy; iy++, a+=dimx) {
158	// a is a row
159	for (j=0,a_j=a,b_j=b,D_j=D; j<dimx; j++,b_j++,D_j++,a_j++)
160	b_j=((int32)(D_j)(a_j))>>15;
161
162	alpha = (R[iy])>>(15-qD); //\alpha = R+vDv = R+a*b
163	// R in q15, a in q15, b=q15
164	// gamma = (1<<15)/alpha; //(in q15)
165	//min alpha = R[iy] = 164
166	//max gamma = 0.0061 => gamma_ref = q7
167	for (j=0,a_j=a,b_j=b,D_j=D; j<dimx; j++,a_j++,b_j++,D_j++) {
168	/* beta=alpha;
169	* lambda = -((int32)(*a_j)<<15)/beta;
170	* alpha += ((int32)(a_j)(*b_j))>>15;
171	* D[j] = ((int32)beta*D_j)/alpha;/
172	/xx/
173	lambda=alpha;
174	alpha += ((int32)(a_j)(*b_j))>>15;
175	D[j] = ((int32)lambda**D_j)/alpha;
176	// z_pom_int16 = -((int32)(*a_j)<<15)/lambda;
177	/xx/
178
179	if (D_j==0) D_j=1;
180
181	for (i=0,b_i=b,U_ij=U+j; i<j; i++, b_i++,U_ij+=dimx) {
182	beta = *U_ij;
183	// U_ij += ((int32)lambda(*b_i))>>15; // puvodni reseni
184	U_ij -= ((int32)(a_j)(b_i))/lambda; // pozadovane optimalni reseni
185	b_i += ((int32)beta(*b_j))>>15;
186	//printf("%d, %d, %d\n", ((int32)(a_j)(b_i))/lambda, b_i, beta);
187	}
188	}
189	// no shift due to gamma
190	for (i=0,x_i=xp,b_i=b; i<dimx; i++,x_i++,b_i++) {
191	x_i += ((int32)difz[iy](*b_i))/alpha; // multiply by unscaled Kalman gain
192	}
193	}
194	}
195
196	// Thorton procedure - Kalman predictive variance in UD
197	void thorton(int16 U, int16 D, int16 PSIU, int16 Q, int16 G, int16 Dold, unsigned int16 rows) {
198	thorton_fast(U, D, PSIU, Q, G, Dold, rows);
199	}
200
201	// Thorton procedure - Kalman predictive variance in UD
202	void thorton_fast(int16 U, int16 D, int16 PSIU, int16 Q, int16 G, int16 Dold, unsigned int16 rows) {
203	unsigned int16 i,j,k;
204	// copy D to Dold
205	int16 Dold_i,Dold_k;
206	int16 *D_i;
207	int16 PSIU_ij,PSIU_ik,*PSIU_jk;
208	int16 Q_jj,Q_ii,*Q_kk;
209	int16 *U_ji;
210	int16 G_ik,G_jk;
211	int16 irows,jrows;
212	int32 sigma; // in qAU+qD!!
213	int32 z;
214
215	for (i=0,Dold_i=Dold,D_i=D;i<rows;i++,Dold_i++,D_i++) {
216	Dold_i=D_i;
217	}
218
219	// initialize G = eye()
220	G_ik= G;
221	*G_ik++=32767;
222	for (i=0;i<rows-1;i++) {
223	// clean elem before diag
224	for (k=0; k<rows; k++) {
225	*G_ik++=0;
226	}
227	*G_ik++=32767;
228	}
229	// eye created
230
231	for (i=rows-1, Dold_i=Dold+i, D_i=D+i;
232	1; i--, Dold_i--,D_i--) { // stop if i==0 at the END!
233	irows=i*rows;
234	sigma = 0;
235	for (k=0, PSIU_ik=PSIU+irows,Dold_k=Dold;
236	k<rows; k++, PSIU_ik++,Dold_k++) {
237	sigma += (((int32)(PSIU_ik)PSIU_ik)>>(qAU))(*Dold_k);
238	}
239	sigma += (int32)(*(Q+i+irows))<<(qAU+qD-15);
240	for (j=i+1, G_ik=G+irows+i+1; j<rows; j++,G_ik++) {
241	sigma += ((((int32)(G_ik)G_ik)>>15)(Q+j+jrows))>>(30-qAU-qD);
242	}
243
244	if (sigma>((int32)1<<(qAU+15))) {
245	*D_i = 32767;
246	// (Dold+i)-=(Q+i+irows);
247	} else {
248	*D_i=sigma>>qAU;
249	}
250	if (D_i==0) D_i=1;
251
252	for (j=0;j<i;j++) {
253	jrows = j*rows;
254
255	sigma =0;
256	for (k=0, PSIU_ik=PSIU+irows, PSIU_jk=PSIU+jrows, Dold_k=Dold;
257	k<rows; k++, PSIU_ik++, PSIU_jk++, Dold_k++) {
258
259	sigma += ((((int32)(PSIU_ik)PSIU_jk)>>qAU)*Dold_k);
260	}
261
262	for (k=i,G_ik=G+irows+i,G_jk=G+jrows+i,Q_kk=Q+k*rows+k;
263	k<rows;k++,G_ik++,G_jk++,Q_kk+=rows+1) {
264	sigma += (((((int32)G_ik)G_jk)>>15)*Q_kk)>>(30-qD-qAU);
265	}
266
267	z=(sigma/(*D_i))<<(15-qAU); // shift to q15
268	if (z>32767) z=32767;
269	if (z<-32768) z=-32768;
270
271	U_ji=U+jrows+i;
272	*U_ji = (int16)z;
273
274
275	for (k=0,PSIU_ik=PSIU+irows,PSIU_jk=PSIU+jrows;
276	k<rows;k++,PSIU_ik++,PSIU_jk++) {
277	PSIU_jk -= ((int32)U_ji**PSIU_ik)>>15;
278	}
279
280	for (k=0,G_jk=G+jrows,G_ik=G+irows;
281	k<rows;k++, G_jk++, G_ik++) {
282	G_jk -= ((int32)U_ji**G_ik)>>15;
283	}
284
285	}
286	if (i==0) return;
287	}
288	}
289
290	void householder(int16 Ch /= int16 PSICh/, int16 *Q, unsigned int16 dimx) {
291	int16 k,j,i;
292	int16 alpha,beta;
293	int32 sigma; // 2*qCh
294	int32 tmp_long;
295	int16 B[25];//Q in qCh
296	int16 w[5];
297	int16 v[5];
298
299	// copy Q to B
300	for (i=0;i<dimx*dimx;i++)
301	{
302	B[i]=Q[i]>>(15-qCh);
303	}
304
305	for (k=dimx-1; k>=0; k--)
306	{
307	sigma=0;
308	for (j=0;j<dimx;j++)
309	{
310	sigma+=((int32)B[kdimx+j]B[k*dimx+j]);
311	}
312	for (j=0;j<=k;j++)
313	{
314	sigma+=((int32)Ch[kdimx+j]Ch[k*dimx+j]);
315	}
316
317	//alpha in qCh
318	alpha = (int16)(sqrt((double)sigma)+0.5); // predelat pro DSP
319
320	sigma=0;
321	for (j=0;j<dimx;j++) {
322	w[j]=B[k*dimx+j];
323	sigma+=(int32)w[j]*w[j];
324	}
325	for (j=0; j<=k;j++) {
326	if (j==k) {
327	v[j]=Ch[k*dimx+j]-alpha;
328	} else {
329	v[j]=Ch[k*dimx+j];
330	}
331	sigma+=(int32)v[j]*v[j];
332	}
333
334	alpha=sigma>>(qCh+1); // alpha = sigma /2;
335	if (alpha==0) alpha =1;
336
337	for (i=0;i<=k;i++) {
338	sigma=0;
339	for (j=0;j<dimx;j++) {
340	sigma+=((int32)B[idimx+j]w[j]);
341	}
342	for (j=0;j<=k;j++) {
343	sigma+=(int32)Ch[idimx+j]v[j];
344	}
345
346	sigma = sigma >> 15; // navrat do Q15
347	// if (sigma>32767)sigma=32767;
348
349	for (j=0;j<dimx;j++)
350	{
351	tmp_long=B[idimx+j]-(sigmaw[j])/alpha;
352	if (tmp_long>32767) {
353	B[i*dimx+j]=32767;
354	} else {
355	if (tmp_long<-32767){
356	B[i*dimx+j]=-32767;
357	} else {
358	B[i*dimx+j]=tmp_long;
359	}
360	}
361	};
362
363	for (j=0;j<=k;j++)
364	{
365	tmp_long=Ch[idimx+j]-(sigmav[j])/alpha;
366	if (tmp_long>32767) {
367	Ch[i*dimx+j]=32767;
368	} else {
369	if (tmp_long<-32767){
370	Ch[i*dimx+j]=-32767;
371	} else {
372	Ch[i*dimx+j]=tmp_long;
373	}
374	}
375	}
376	}
377	}
378
379	}
380
381	void carlson(int16 difz, int16 xp, int16 Ch, int16 R, unsigned int16 dimy, unsigned int16 dimx ) {
382	int16 alpha,beta,gamma;
383	int16 delta, eta,epsilon,zeta,sigma,tau;
384	int16 i,j,iy;
385	int16 w[5];
386	int32 tmp_long;
387
388	for (iy=0; iy<dimy; iy++)
389	{
390	alpha=R[iy];
391	delta = difz[iy];
392
393	for (j=0;j<dimx;j++)
394	{
395	sigma=Ch[iy*dimx+j];
396	beta=alpha;
397	alpha+=((int32)sigma*sigma)>>15;
398	// double ab=(double)alpha*beta/32768./32768.;
399	// double s_ab=sqrt(ab);
400	gamma=(int16)(sqrt((double)((int32)alpha*beta))+0.5); // predelat v DSP
401	//gamma = round(s_ab*(1<<15));
402	// eta=((long)beta<<15) / gamma;
403	//zeta=(long(sigma)<<15)/ gamma;
404	w[j]=0;
405	for (i=0;i<=j;i++) {
406	tau=Ch[i*dimx+j];
407	tmp_long=((int32)betaCh[idimx+j] -(int32)sigma*w[i])/gamma;
408	/* if (tmp_long>32767) {
409	Ch[i*dimx+j]=32767;
410	} else {
411	if (tmp_long<-32767){
412	Ch[i*dimx+j]=-32767;
413	} else {
414	/ Ch[idimx+j]=tmp_long;
415	/* }
416	}
417	*/
418	w[i]+=((int32)tau*sigma)>>15;
419	}
420	}
421
422	//epsilon=(long(difz)<<15) / (alpha); // q15*q13/q13 = q15
423	for (i=0;i<dimx;i++) {
424	xp[i]+=((int32)w[i]*delta)/alpha;
425	}
426	}
427	}
428
429	/* perform Householder update of Ch matrix using PSICh , Q, /
430	extern void givens(int16 Ch /= int16 PSICh/, int16 *Q, unsigned int16 dimx){
431	int16 i,j,k;
432	int16 rho,s,c,tau;
433	int32 tmp_long;
434
435	int16 A[25];//beware
436	// copy Q to A
437	for (i=0;i<dimx*dimx;i++) {
438	A[i]=Q[i]>>(15-qCh);
439	}
440
441
442	for (i=dimx-1; i>=0; i--){
443	for (j=0; j<dimx; j++) {
444	tmp_long=(int32)Ch[idimx+i]Ch[idimx+i]+int32(A[idimx+j])A[idimx+j];
445	if (tmp_long>0){
446	rho=sqrt(double(tmp_long));
447	s=(int32(A[i*dimx+j])<<15)/rho;
448	c=(int32(Ch[i*dimx+i])<<15)/rho;
449	for (k=0;k<=i; k++){
450	tau=(int32(c)A[kdimx+j]-int32(s)Ch[kdimx+i])>>15;
451	Ch[kdimx +i]=(int32(s)A[kdimx+j]+int32(c)Ch[k*dimx+i])>>15;
452	A[k*dimx +j]=tau;
453	}
454	}
455	}
456
457	for (j=0; j<i; j++){
458	tmp_long=(int32(Ch[idimx+i])Ch[idimx+i]+int32(Ch[idimx+j])Ch[idimx+j]);
459	if (tmp_long>0){
460	rho=sqrt((double)(tmp_long));
461	s=(int32(Ch[i*dimx+j])<<15)/rho;
462	c=(int32(Ch[i*dimx+i])<<15)/rho;
463	for (k=0; k<=i; k++){
464	tau=(int32(c)Ch[kdimx+j]-int32(s)Ch[kdimx+i])>>15;
465	Ch[kdimx+i]=(int32(s)Ch[kdimx+j]+int32(c)Ch[k*dimx+i])>>15;
466	Ch[k*dimx+j]=tau;
467	}
468	}
469	}
470
471	}
472	}
473
474	/* Matrix multiply Full matrix by upper diagonal matrix; */
475	void mmultACh(int16 m1, int16 up, int16 *result, unsigned int16 rows, unsigned int16 columns) {
476	unsigned int16 i, j, k;
477	int32 tmp_sum=0L;
478	int16 *m2pom;
479	int16 *m1pom=m1;
480	int16 *respom=result;
481
482	for (i=0; i<rows; i++) //rows of result
483	{
484	for (j=0; j<columns; j++) //columns of result
485	{
486	m2pom=up+j;//??
487
488	for (k=0; k<=j; k++) //inner loop up to "j" - U(j,j)==1;
489	{
490	tmp_sum+=(int32)((m1pom++))*m2pom;
491	m2pom+=columns;
492	}
493	m1pom-=(j+1); // shift back to first element
494
495	/* if (tmp_sum>(1<<29)-1)
496	*respom++=(1<<14);
497	else
498	*/
499	*respom++=(tmp_sum+(1<<14))>>15;
500
501	tmp_sum=0;
502	}
503	m1pom+=(columns);
504	}
505	}
506
507
508	void givens_fast(int16 Ch, int16 Q, unsigned int16 dimx)
509	{
510	int16 i,j,k;
511	int16 rho,s,c,tau;
512	int32 tmp_long;
513
514	//c,s in q14!!
515
516	int16 A[25];//beware
517
518	int16 A_ij, Q_i, Ch_ki, Ch_kj, Ch_ii, Ch_ij, *A_kj;
519
520	A_ij=A;
521	Q_i=Q;
522	// copy Q to A
523	for (i=0;i<dimx*dimx;i++)
524	{
525	// A[i]=Q[i]>>(15-qCh);
526	A_ij++=(Q_i++)>>(15-qCh);
527	}
528
529	for (i=dimx-1; i>=0; i--)
530	{
531	Ch_ii=Ch+i*dimx+i;
532	A_ij=A+i*dimx;
533
534	for (j=0; j<dimx; j++)
535	{
536	if (*A_ij!=0)
537	{
538	tmp_long=(int32)Ch_iiCh_ii+(int32)A_ij**A_ij;
539	// rho=qsqrt(tmp_long); // verze pro DSP
540	rho=(int16)(sqrt((double)tmp_long)); // verze pro PC
541	s=(((int32)*A_ij)<<14)/rho;
542	c=(((int32)*Ch_ii)<<14)/rho;
543
544	Ch_ki=Ch+i;
545	A_kj=A+j;
546
547	for (k=0;k<=i; k++)
548	{
549	tau=((int32)cA_kj-(int32)sCh_ki)>>14;
550	tmp_long=(int32)sA_kj+(int32)cCh_ki;
551	if (tmp_long>(1<<29)) //q14 + q14
552	*Ch_ki = (1<<15)-1;
553	else
554	*Ch_ki=tmp_long>>14;
555	*A_kj=tau;
556
557	Ch_ki+=dimx;
558	A_kj+=dimx;
559	}
560	}
561	A_ij++;
562	}
563
564	Ch_ij = Ch+i*dimx;
565
566	for (j=0; j<i; j++)
567	{
568
569	if (*Ch_ij>0)
570	{
571	tmp_long=(int32)Ch_iiCh_ii+(int32)Ch_ij**Ch_ij;
572	// rho=qsqrt(tmp_long); // verze pro DSP
573	if (tmp_long>(1<<30)-1)
574	rho=(1<<15)-1;
575	else
576	rho=(int16)(sqrt((double)tmp_long)); // verze pro PC
577
578	s=(((int32)*Ch_ij)<<14)/rho;
579	c=(((int32)*Ch_ii)<<14)/rho;
580
581	Ch_kj = Ch + j;
582	Ch_ki = Ch + i;
583
584	for (k=0; k<=i; k++)
585	{
586	tau=((int32)cCh_kj-(int32)sCh_ki)>>14;
587	tmp_long =((int32)sCh_kj+(int32)cCh_ki);
588	if (tmp_long>(1<<29))
589	*Ch_ki = (1<<15)-1;
590	else
591	*Ch_ki=tmp_long>>14;
592	*Ch_kj=tau;
593
594	Ch_kj += dimx;
595	Ch_ki += dimx;
596	}
597	}
598	Ch_ij++;
599	}
600	}
601	}
602
603	void carlson_fast(int16 difz, int16 xp, int16 Ch, int16 R, unsigned int16 dimy, unsigned int16 dimx ) {
604	int16 alpha,beta,gamma;
605	int16 delta, eta,epsilon,zeta,sigma,tau;
606	int16 i,j,iy;
607	int16 w[5];
608	int32 tmp_long;
609
610	int16 Ch_ij, w_i, *x_i;
611
612
613	for (iy=0; iy<dimy; iy++)
614	{
615	alpha=R[iy];
616	delta = difz[iy];
617
618	for (j=0;j<dimx;j++)
619	{
620	sigma=Ch[iy*dimx+j];
621	beta=alpha;
622	// alpha+=((long)sigma*sigma)>>15;
623	alpha=(((int32)alpha<<15)+(int32)sigma*sigma)>>15; // vyssi presnost
624	// gamma= qsqrt(((long)alpha*beta)); // verze pro DSP
625	gamma= (int16)(sqrt((double)((int32)alpha*beta))); // verze pro PC
626
627	w[j]=0;
628
629	Ch_ij=Ch+j;
630	w_i=w;
631
632	for (i=0;i<=j;i++)
633	{
634	// tau=Ch[i*dimx+j];
635	tau=*Ch_ij;
636	// tmp_long=((long)betaCh[idimx+j] -(long)sigma*w[i])/gamma;
637	tmp_long=((int32)betaCh_ij -(int32)sigmaw_i)/gamma;
638
639	if (tmp_long>32767)
640	tmp_long=32767;
641	if (tmp_long<-32768)
642	tmp_long=-32768;
643	*Ch_ij=tmp_long;
644
645	// w_i+=((long)tau*sigma)>>15;
646	w_i=(((int32)w_i<<15)+(int32)tau*sigma)>>15;
647
648	w_i++;
649	Ch_ij+=dimx;
650	}
651	}
652
653	x_i=xp;
654	w_i=w;
655	for (i=0;i<dimx;i++) {
656	// xp[i]+=((long)w[i]*delta)/alpha;
657	// x_i+=((long)w_i*delta)/alpha;
658	x_i=((int32)x_ialpha+(int32)w_i*delta)/alpha; // vyssi presnost
659	x_i++;
660	w_i++;
661	}
662	}
663	}
664
665	void carlson_fastC(int16 difz, int16 xp, int16 Ch, int16 C, int16 *R, unsigned int16 dimy, unsigned int16 dimx ) {
666	int16 alpha,beta,gamma;
667	int16 delta, eta,epsilon,zeta,sigma,tau;
668	int16 i,j,iy;
669	int16 w[5];
670	int32 tmp_long;
671
672	int16 Ch_ij, w_i, x_i, C_yi;
673
674
675	for (iy=0; iy<dimy; iy++)
676	{
677	alpha=R[iy];
678	delta = difz[iy];
679
680	for (j=0;j<dimx;j++)
681	{
682	C_yi = C+iy*dimx;
683	sigma = 0;
684	Ch_ij=Ch+j;
685	for (i=0;i<=j;i++){
686	sigma += ((int32)Ch_ij*C_yi)>>15; //sigma in qCh
687	Ch_ij+=dimx;
688	C_yi++;
689	}
690
691	//sigma=Ch[iy*dimx+j];
692	beta=alpha; // in q15
693	// alpha+=((long)sigma*sigma)>>15;
694	tmp_long=((int32)alpha<<15)+(((int32)sigmasigma)<<(30-2qCh));
695	alpha=(tmp_long+(1<<14))>>15; // vyssi presnost
696
697	// gamma= qsqrt(((long)alpha*beta)); // verze pro DSP
698	gamma= (int16)(sqrt((double)((int32)alpha*beta))); // verze pro PC
699	// in q15
700	w[j]=0;
701
702	Ch_ij=Ch+j;
703	w_i=w; // in q15
704
705	for (i=0;i<=j;i++)
706	{
707	// tau=Ch[i*dimx+j];
708	tau=*Ch_ij;
709	// tmp_long=((long)betaCh[idimx+j] -(long)sigma*w[i])/gamma;
710	tmp_long=((int32)betaCh_ij -(int32)sigmaw_i)/gamma; // in qCh
711
712	/* if (tmp_long>32767)
713	tmp_long=32767;
714	if (tmp_long<-32768)
715	tmp_long=-32768;*/
716	*Ch_ij=tmp_long;
717
718	// w_i+=((long)tau*sigma)>>15;
719	tmp_long = ((int32)w_i<<15)+((int32)tausigma<<(30-2*qCh));
720	*w_i=(tmp_long+(1<<14))>>15;
721
722	w_i++;
723	Ch_ij+=dimx;
724	}
725	}
726
727	x_i=xp;
728	w_i=w;
729	for (i=0;i<dimx;i++) {
730	// xp[i]+=((long)w[i]*delta)/alpha;
731	// x_i+=((long)w_i*delta)/alpha;
732	x_i=((int32)x_ialpha+(int32)w_i*delta)/alpha; // vyssi presnost
733	x_i++;
734	w_i++;
735	}
736	}
737	}

Note: See TracBrowser for help on using the browser.

Context Navigation

root/applications/pmsm/simulator_zdenek/ekf_example/matrix_vs.cpp @ 1454

Download in other formats: