1 | \section{LQ řízení} |
---|
2 | |
---|
3 | LQ je zkratka slovního spojení linaer-quadratic, tedy lineárně kvadratický. |
---|
4 | Jedná se obecně o metodu, kdy je systém v diskrétním časovém kroku $t$ |
---|
5 | popsán vektorem proměnných $x(t) = ( x_1(t), ..., x_n(t) )$ |
---|
6 | a my můžeme nastavovat vektor parametrů $y(t) = ( y_1(t), ..., y_n(t) )$. |
---|
7 | Metoda je popsána a použita v článku \cite{6_tuc_lq} pro nastavování časů zelených na křižovatce. |
---|
8 | Princip přechodu z času $t$ do $t+1$ je popsán lineárním vztahem |
---|
9 | \begin{equation} |
---|
10 | x(t+1) = A x(t) + B y(t) |
---|
11 | \end{equation} |
---|
12 | . |
---|
13 | kde matice $A$ a $B$ jsou matice stavů a vstupů vyjadřující odezvu systému vzhledem |
---|
14 | k $x(t)$ a $y(t)$. Účelem LQ řízení je najít optimální hodnoty $y(t)$ v závislosti |
---|
15 | na $x(t)$ dané zpětnovazebnou maticí $L$ vztahem |
---|
16 | \begin{equation}\label{eq_lq_feedback} |
---|
17 | y(t) = -L x(t) |
---|
18 | \end{equation} |
---|
19 | . Optimalita je definována pomocí |
---|
20 | kvadratického kritéria |
---|
21 | \begin{equation}\label{eq_quadratic_criterion} |
---|
22 | J = \sum_{t=1}^{\infty} x(t)^T Q x(t) + y(t)^T R y(t) |
---|
23 | \end{equation} |
---|
24 | |
---|
25 | |
---|
26 | , kde $Q$ a $R$ jsou diagonální pozitivně semidefinitní matice vah určující významnost jednotlivých členů kritéria. |
---|
27 | Zpětnovazebná matice $L$ se podle \cite{6_tuc_lq} dostane minimalizací kritéria $J$ jako |
---|
28 | \begin{equation}\label{eq_riccati} |
---|
29 | L = (R + B^T P B)^{-1} B^T P A |
---|
30 | \end{equation}, kde $P$ je jednoznačné řešení Riccatiho rovnice pro diskrétní časový krok |
---|
31 | |
---|
32 | \begin{equation}\label{eq_riccati_2} |
---|
33 | P = Q + A^T ( P - P B ( R + B^T P B ) B^T P ) A |
---|
34 | \end{equation} |
---|
35 | . Rovnici a její řešení popisuje například \cite{7_lq_methods}. |
---|
36 | |
---|
37 | |
---|
38 | \subsection{Použití LQ řízení ve strategii TUC} |
---|
39 | LQ řízení bylo použito v \cite{6_tuc_lq} k nalezení optimální délky zelených v systému |
---|
40 | 13-ti signálních skupin. Proměnné $x_i(t)$ zde představují obsazenost ramene $i$ |
---|
41 | spojující křižovatky $M$ a $N$. Účelem strategie je nalezení optimální délky zelených |
---|
42 | $g$, $g_{N,i}$ značí délku zelené na signální skupiny křižovatky $N$ zprůjezdňující |
---|
43 | směr do ramene $i$. Předpokládaný vztah pro přechod systému z času $t$ do času $t+1$ je |
---|
44 | \begin{equation}\label{eq_tuc_1} |
---|
45 | x_i(t+1) = x_i(t) + T [ q_i(t) + s_i(t) + d_i(t) + u_i(t) ] |
---|
46 | \end{equation}, kde proměnné značí: |
---|
47 | |
---|
48 | \begin{itemize} |
---|
49 | \item $T$ - časový krok |
---|
50 | \item $q_i(t)$ - přírůstek vozidel z křižovatek |
---|
51 | \item $u_i(t)$ - úbytek vozidel do ostatních křižovatek |
---|
52 | \item $s_i(t)$ - přírůstek vozidel z okolí sítě |
---|
53 | \item $d_i(t)$ - úbytek vozidel mimo síť |
---|
54 | \end{itemize} |
---|
55 | |
---|
56 | Přírůstek vozidel z křižovatek je dán vztahem |
---|
57 | \begin{equation} |
---|
58 | q_i(t) = \sum_{k\in I_m} t_{k,i} u_k(t) |
---|
59 | \end{equation} |
---|
60 | , je to tedy součet úbytků vozidel z ramen ústících do křižovatky $N$ vynásobených |
---|
61 | koeficinety $t_{k,i}$, což jsou odbočovací poměry z ramene $k$ do ramene $i$. |
---|
62 | V podovném tvaru se předpokládá $s_i(t)$ |
---|
63 | \begin{equation} |
---|
64 | s_i(t) = t_{i,0} q_i(t) |
---|
65 | \end{equation} |
---|
66 | , kde $t_{i,0}$ je odbočovací koeficient ramene $i$ mimo sledovanou síť. |
---|
67 | Při délce cyklu $C$, saturovaném toku $S_i$ a délce zelených $g_{N,i}(t)$ ramene $i$ platí |
---|
68 | \begin{equation} \label{eq:tuc_u} |
---|
69 | u_i(t) = \frac{S_i \sum g_{N,i}(t)}{C} |
---|
70 | \end{equation}. |
---|
71 | Rovnice \ref{eq_tuc_1} tedy přechází do tvaru |
---|
72 | \begin{equation}\label{eq_tuc_2} |
---|
73 | x_i(t+1) = x_i(t) + T \left[ |
---|
74 | (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum g_{M,k}(t)}{C} |
---|
75 | - \frac{S_i \sum g_{N,i}(t)}{C} |
---|
76 | + d_i(t) \right] |
---|
77 | \end{equation}. Uvažujeme-li nominální hodnoty $d^n$ a $g^n$ vedoucí |
---|
78 | vždy na stav $x^n$, platí podle rovnice \ref{eq_tuc_2} |
---|
79 | \begin{equation}\label{eq_tuc_nom} |
---|
80 | 0 = T \left[ |
---|
81 | (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum g_{M,k}^n}{C} |
---|
82 | - \frac{S_i \sum g_{N,i}^n}{C} |
---|
83 | + d_i^n \right] |
---|
84 | \end{equation}. Označíme-li |
---|
85 | \begin{equation}\label{eq_delta_g} |
---|
86 | \Delta g(t) = g(t) - g^n |
---|
87 | \end{equation}, můžeme psát rovnici \ref{eq_tuc_2} jako |
---|
88 | \begin{equation}\label{eq_tuc_3} |
---|
89 | x_i(t+1) = x_i(t) + T \left[ |
---|
90 | (1-t_{i,0}) \sum_{k\in I_m} t_{k,i} \frac{S_k \sum \Delta g_{M,k}(t)}{C} |
---|
91 | - \frac{S_i \sum \Delta g_{N,i}(t)}{C} |
---|
92 | \right] |
---|
93 | \end{equation}, což dovoluje tuto rovnici zapsat pomocí matic v požadovaném tvaru |
---|
94 | \begin{equation}\label{eq_tuc_4} |
---|
95 | x(t+1) = A x(t) + B \Delta g(t) |
---|
96 | \end{equation}, kde $A$ je jednotková matice. |
---|
97 | |
---|
98 | \subsubsection{Kvadratické kritérium} |
---|
99 | Účelem lagoritmu je minimalizovat obsazenost ramen, tedy vektor $x(t)$ |
---|
100 | a penalizovat změnu délky trvání zelené oproti nominálním hodnotám. |
---|
101 | Kvadratické kritérium optimálního řízení \ref{eq_quadratic_criterion} jetedy v \cite{6_tuc_lq} |
---|
102 | definováno vztahem |
---|
103 | \begin{equation}\label{eq_tuc_crit} |
---|
104 | J = \sum_{t=0}^{\infty} x(t)^T Q x(t) + \Delta g(t)^T R \Delta g(t) |
---|
105 | \end{equation}. Diagonální matice $Q$ je zde zodpovědná za vyvažování |
---|
106 | počtu vozidel jednotlivých úseků. V \cite{6_tuc_lq} je každý diagonální |
---|
107 | prvek $Q_{i,i}$ matice $Q$ položen převrácené hodnotě maximálního |
---|
108 | povoleného počtu vozidel daného úseku $i$. $R = rI$ penalizuje změnu |
---|
109 | časů zelených. Parametr $r$ ovlivňuje míru reakce systému a ja volen metodu pokus-oprava. |
---|
110 | Minimalizací tohoto kritéria pomcí \ref{eq_riccati} získáme zpětnovazebnou matici $L$, |
---|
111 | která určuje $g(t)$. Z rovnic \ref{eq_lq_feedback} a \ref{eq_delta_g} dostaneme výsledný vztah |
---|
112 | \begin{equation}\label{eq_tuc_feedback} |
---|
113 | g(t) = g^n - L x(t) |
---|
114 | \end{equation}. Toto řešení předpokládá, že známe hodnotu $g^n$, při které systém |
---|
115 | zůstává ve stavu $x^n$. Tak tomu ale většinou není. Při absenci znalosti $g^n$ |
---|
116 | podle \cite{6_tuc_lq} odečteme $g(t) - g(t-1)$ a rovnice \ref{eq_tuc_feedback} nabývá tvaru |
---|
117 | \begin{equation}\label{eq_tuc_feedback_2} |
---|
118 | g(t) = g(t-1) - L( x(t) - x(t-1) ) |
---|
119 | \end{equation}. |
---|
120 | |
---|
121 | |
---|
122 | |
---|
123 | |
---|
124 | |
---|
125 | |
---|
126 | |
---|
127 | |
---|
128 | |
---|
129 | |
---|
130 | |
---|
131 | |
---|
132 | |
---|