| 34 | | Metode popsaná v článku \cite{3_i_traff_light_c} používá ohodnocovací funkci |
| 35 | | založenou na parametrech jednotlivých vozidel. Výhodou oproti pojetí, kdy agent |
| 36 | | představuje pouze signální skupinu, jsou například v tom, že není potřeba |
| 37 | | odhadovat délku fronty a úloha se celá zjednoduší. Například v publikaci |
| 38 | | \cite{tlc_using_sarsa} se musí používat k odhadu funkcí $V$ a $Q$ neuronová síť. |
| 39 | | Navíc tento systém umožňuje i výběr optimální cesty vozidla pro průjezd dopravní sítí. |
| 40 | | Nevýhodou tohoto pojetí je ovšem značná neuniverzálnost. Už pro počítačové testování |
| 41 | | tato metode znesnadnuje či úplně znemožňuje použít celou řadu dopravních simulátorů, |
| 42 | | které jsou pro simulaci po dlouhou dobu optimalizovány a |
| 43 | | jejichž nasazení značně zjednodušuje práci a urychluje vývoj. |
| 44 | | Navíc pokud je použit řadič, který obstarává logiku přepínání průjezdnosti a |
| 45 | | lze nastavovat pouze vnější parametry jako jsou délka cyklu a offset, je |
| 46 | | metoda, která potřebuje okamžitou změnu signalizace naprosto nevhodná, |
| 47 | | proto je toto řešení pro reálné nasazení v dnešní době obtížně použitelné. |
| 48 | | Zapojení některých myšlenek z článku \cite{3_i_traff_light_c} nebo použití |
| 49 | | zpětnovazevného učení k řešení dílčích problémů by však mohlo přinést zlepšení |
| 50 | | i do způsobu žešení popsaných v dalších kapitolách. |