root/applications/doprava/texty/novotny_vyzk_LQ/LQ_rizeni.tex @ 1424

Revision 1424, 5.6 kB (checked in by jabu, 12 years ago)

Prvni verze bez vysledku

Line 
1\section{LQ řízení}
2
3LQ je zkratka slovního spojení linaer-quadratic, tedy lineárně kvadratický.
4Jedná se obecně o metodu, kdy je systém v diskrétním časovém kroku $t$ 
5popsán vektorem proměnných $x(t) = ( x_1(t), ..., x_n(t) )$
6a my můžeme nastavovat vektor parametrů $y(t) = ( y_1(t), ..., y_n(t) )$.
7Metoda je popsána a použita v článku \cite{6_tuc_lq} pro nastavování časů zelených na křižovatce.
8Princip přechodu z času $t$ do $t+1$ je popsán lineárním vztahem
9\begin{equation}
10  x(t+1) = A x(t) + B y(t) \;,
11\end{equation}
12
13kde matice $A$ a $B$ jsou matice stavů a vstupů vyjadřující odezvu systému vzhledem
14k $x(t)$ a $y(t)$. Účelem LQ řízení je najít optimální hodnoty $y(t)$ v závislosti
15na $x(t)$ dané zpětnovazebnou maticí $L$ vztahem
16\begin{equation}\label{eq_lq_feedback}
17y(t) = -L x(t) \;.
18\end{equation}
19Optimalita je definována pomocí
20kvadratického kritéria
21\begin{equation}\label{eq_quadratic_criterion}
22J = \sum_{t=1}^{\infty} x(t)^T Q x(t) + y(t)^T R y(t) \;,
23\end{equation}
24kde $Q$ a $R$ jsou diagonální pozitivně semidefinitní matice vah určující významnost jednotlivých členů kritéria.
25Zpětnovazebná matice $L$ se podle \cite{6_tuc_lq} dostane minimalizací kritéria $J$ jako
26\begin{equation}\label{eq_riccati}
27L = (R + B^T P B)^{-1} B^T P A \;,
28\end{equation} kde $P$ je jednoznačné řešení Riccatiho rovnice pro diskrétní časový krok
29
30\begin{equation}\label{eq_riccati_2}
31P = Q + A^T ( P - P B ( R + B^T P B ) B^T P ) A \;.
32\end{equation}
33Rovnici a její řešení popisuje například \cite{7_lq_methods}.
34
35
36\subsection{Použití LQ řízení ve strategii TUC}
37LQ řízení bylo použito v \cite{6_tuc_lq} k nalezení optimální délky zelených v systému
3813-ti signálních skupin. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$ 
39spojující křižovatky $M$ a $N$. Účelem strategie je nalezení optimální délky zelených
40$g$, $g_{N,i}$ značí délku zelené na signální skupiny křižovatky $N$ zprůjezdňující
41směr do ramene $i$. Předpokládaný vztah pro přechod systému z času $t$ do času $t+1$ je
42\begin{equation}\label{eq_tuc_1}
43 x_i(t+1) = x_i(t) + T [ q_i(t) + s_i(t) + d_i(t) + u_i(t) ] \;,
44\end{equation} kde proměnné značí:
45
46\begin{itemize}
47 \item $T$ - časový krok
48 \item $q_i(t)$ - přírůstek vozidel z křižovatek
49 \item $u_i(t)$ - úbytek vozidel do ostatních křižovatek
50 \item $s_i(t)$ - přírůstek vozidel z okolí sítě
51 \item $d_i(t)$ - úbytek vozidel mimo síť
52\end{itemize}
53
54Přírůstek vozidel z křižovatek je dán vztahem
55\begin{equation}
56 q_i(t) = \sum_{k\in I_m} t_{k,i} u_k(t) \;,
57\end{equation}
58je to tedy součet úbytků vozidel z ramen ústících do křižovatky $N$ vynásobených
59koeficinety $t_{k,i}$, což jsou odbočovací poměry z ramene $k$ do ramene $i$.
60V podovném tvaru se předpokládá $s_i(t)$
61\begin{equation}
62s_i(t) = t_{i,0} q_i(t) \;,
63\end{equation}
64kde $t_{i,0}$ je odbočovací koeficient ramene $i$ mimo sledovanou síť.
65Při délce cyklu $C$, saturovaném toku $S_i$ a délce zelených $g_{N,i}(t)$ ramene $i$ platí
66\begin{equation} \label{eq:tuc_u}
67 u_i(t) = \frac{S_i \sum g_{N,i}(t)}{C}
68\end{equation}.
69Rovnice \ref{eq_tuc_1} tedy přechází do tvaru
70\begin{equation}\label{eq_tuc_2}
71 x_i(t+1) = x_i(t) + T \left[
72    (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum g_{M,k}(t)}{C} 
73    - \frac{S_i \sum g_{N,i}(t)}{C}
74    + d_i(t) \right]
75\end{equation}. Uvažujeme-li nominální hodnoty $d^n$ a $g^n$ vedoucí
76vždy na stav $x^n$, platí podle rovnice \ref{eq_tuc_2} 
77\begin{equation}\label{eq_tuc_nom}
78 0 = T \left[
79    (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum g_{M,k}^n}{C} 
80    - \frac{S_i \sum g_{N,i}^n}{C}
81    + d_i^n \right]
82\end{equation}. Označíme-li
83\begin{equation}\label{eq_delta_g}
84 \Delta g(t) = g(t) - g^n
85\end{equation}, můžeme psát rovnici \ref{eq_tuc_2} jako
86\begin{equation}\label{eq_tuc_3}
87 x_i(t+1) = x_i(t) + T \left[
88    (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum \Delta g_{M,k}(t)}{C} 
89    - \frac{S_i \sum \Delta g_{N,i}(t)}{C}
90     \right]
91\end{equation}, což dovoluje tuto rovnici zapsat pomocí matic v požadovaném tvaru
92\begin{equation}\label{eq_tuc_4}
93 x(t+1) = A x(t) + B \Delta g(t)
94\end{equation}, kde $A$ je jednotková matice.
95
96\subsubsection{Kvadratické kritérium}
97Účelem lagoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$
98a penalizovat změnu délky trvání zelené oproti nominálním hodnotám.
99Kvadratické kritérium optimálního řízení \ref{eq_quadratic_criterion} jetedy v \cite{6_tuc_lq}
100definováno vztahem
101\begin{equation}\label{eq_tuc_crit}
102 J = \sum_{t=0}^{\infty} x(t)^T Q x(t) + \Delta g(t)^T R \Delta g(t)
103\end{equation}. Diagonální matice $Q$ je zde zodpovědná za vyvažování
104počtu vozidel jednotlivých úseků. V \cite{6_tuc_lq} je každý diagonální
105prvek $Q_{i,i}$ matice $Q$ položen převrácené hodnotě maximálního
106povoleného počtu vozidel daného úseku $i$. $R = rI$ penalizuje změnu
107časů zelených. Parametr $r$ ovlivňuje míru reakce systému a ja volen metodu pokus-oprava.
108Minimalizací tohoto kritéria pomcí \ref{eq_riccati} získáme zpětnovazebnou matici $L$,
109která určuje $g(t)$. Z rovnic \ref{eq_lq_feedback} a \ref{eq_delta_g} dostaneme výsledný vztah
110\begin{equation}\label{eq_tuc_feedback}
111 g(t) = g^n - L x(t)
112\end{equation}. Toto řešení předpokládá, že známe hodnotu $g^n$, při které systém
113zůstává ve stavu $x^n$. Tak tomu ale většinou není. Při absenci znalosti $g^n$
114podle \cite{6_tuc_lq} odečteme $g(t) - g(t-1)$ a rovnice \ref{eq_tuc_feedback} nabývá tvaru
115\begin{equation}\label{eq_tuc_feedback_2}
116 g(t) = g(t-1) - L( x(t) - x(t-1) )
117\end{equation}.
118
119
120
121
122
123
124
125
126
127
128
129
130
Note: See TracBrowser for help on using the browser.