34 | | Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci |
35 | | založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent |
36 | | představuje pouze signální skupinu, jsou například v tom, že není potřeba |
37 | | odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci |
38 | | \cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť. |
39 | | Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí. |
40 | | Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování |
41 | | tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů, |
42 | | které jsou pro simulaci po dlouhou dobu optimalizovány a |
43 | | jejichž nasazení značně zjednodušuje práci a urychluje vývoj. |
44 | | Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a |
45 | | lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je |
46 | | metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, |
47 | | proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. |
48 | | Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití |
49 | | zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení |
50 | | i do způsobu žešení popsaných v dalších kapitolách. |