Gry różniczkowe

Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach 50. XX wieku.

Sformułowania problemów teorii gier różniczkowych

W teorii wyróżnia się dwa rodzaje gier:

  • gra dwóch graczy,
  • gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

  • dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
  • zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

x ˙ = f ( t , x , u , v ) {\displaystyle {\dot {x}}=f(t,x,u,v)}

gdzie x {\displaystyle x} jest wektorem fazowym układu, u {\displaystyle u} i v {\displaystyle v} – wektorami sterowania odpowiednio graczy I i II, a t {\displaystyle t} czasem. Określona jest klasa strategii U {\displaystyle {\mathcal {U}}} gracza I, a dla każdej strategii U U {\displaystyle U\in {\mathcal {U}}} określony jest wiązką ruchów X ( U ) , {\displaystyle X(U),} która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach x ( t ) , t t 0 {\displaystyle x(t),t\geqslant t_{0}} układu zadany jest funkcjonał γ ( x ( ) ) {\displaystyle \gamma (x(\cdot ))} nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał γ {\displaystyle \gamma } zależy także od realizacji u ( t ) , v ( t ) , t t 0 {\displaystyle u(t),v(t),t\geqslant t_{0}} sterowania obu graczy[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu x ( ) X ( U ) , {\displaystyle x(\cdot )\in X(U),} gdy wybór strategii jest pozostawiony graczowi II, jakość strategii U U {\displaystyle U\in {\mathcal {U}}} jest oceniana za pomocą wielkości:

κ 1 ( U ) = sup { γ ( x ( ) ) : x ( ) X ( U ) } . {\displaystyle \kappa _{1}(U)=\sup\{\gamma (x(\cdot )):x(\cdot )\in X(U)\}.}

Zadanie gracza I polega na określeniu strategii U 0 U , {\displaystyle U_{0}\in {\mathcal {U}},} na której realizowane jest minimum funkcjonału κ 1 {\displaystyle \kappa _{1}} (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii U c U {\displaystyle U_{c}\in {\mathcal {U}}} spełniającej nierówność:

κ 1 ( U c ) c , {\displaystyle \kappa _{1}(U_{c})\leqslant c,}

gdzie c {\displaystyle c} jest daną liczbą[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia V V {\displaystyle V\in {\mathcal {V}}} jest oceniana przez wielkość:

κ 2 ( V ) = sup { γ ( x ( ) ) : x ( ) X ( V ) } . {\displaystyle \kappa _{2}(V)=\sup\{\gamma (x(\cdot )):x(\cdot )\in X(V)\}.}

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału κ 2 , {\displaystyle \kappa _{2},} a zadanie jakości – na znalezieniu strategii V c V , {\displaystyle V_{c}\in {\mathcal {V}},} dla której:

κ 2 ( V c ) c . {\displaystyle \kappa _{2}(V_{c})\geqslant c.}

Jeśli w zadaniach graczy I i II klasy strategii U {\displaystyle {\mathcal {U}}} i V {\displaystyle {\mathcal {V}}} mają taką własność, że dla każdej pary uporządkowanej ( U , V ) U × V {\displaystyle (U,V)\in {\mathcal {U}}\times {\mathcal {V}}} można określić choć jeden ruch

x ( ) X ( U ) X ( V ) , {\displaystyle x(\cdot )\in X(U)\cap X(V),}

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii U × V . {\displaystyle {\mathcal {U}}\times {\mathcal {V}}.}

Jeśli w grze różniczkowej spełniona jest równość

inf U U sup x ( ) X ( U ) γ ( x ( ) ) = sup V V inf x ( ) X ( V ) γ ( x ( ) ) = c 0 , {\displaystyle \inf _{U\in {\mathcal {U}}}\,\,\sup _{x(\cdot )\in X(U)}\gamma (x(\cdot ))=\sup _{V\in {\mathcal {V}}}\,\,\inf _{x(\cdot )\in X(V)}\gamma (x(\cdot ))=c_{0},}

to wielkość c 0 {\displaystyle c_{0}} nazywa się ceną gry różniczkowej[3].

Przykład

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[4]. W tej grze

x = ( x 1 , , x k + l ) = ( y 1 , , y k , z 1 , , z l ) , {\displaystyle x=(x_{1},\dots ,x_{k+l})=(y_{1},\dots ,y_{k},z_{1},\dots ,z_{l}),}

gdzie y = ( y 1 , , y k ) , z = ( z 1 , , z l ) {\displaystyle y=(y_{1},\dots ,y_{k}),z=(z_{1},\dots ,z_{l})} są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

y ˙ = g ( t , y , u ) , z ˙ = h ( t , z , v ) {\displaystyle {\dot {y}}=g(t,y,u),{\dot {z}}=h(t,z,v)} [3].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

u P , v Q , {\displaystyle u\in P,v\in Q,}

gdzie P , Q {\displaystyle P,Q} są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania, tzn.:

γ ( x ( ) ) = T ( x ( ) ) = inf { t t 0 : | | { y ( t ) } m { z ( t ) } m ε } , {\displaystyle \gamma (x(\cdot ))=T(x(\cdot ))=\inf\{t-t_{0}:||\{y(t)\}_{m}-\{z(t)\}_{m}\|\leqslant \varepsilon \},}

gdzie { y ( t ) } m {\displaystyle \{y(t)\}_{m}} i { z ( t ) } m {\displaystyle \{z(t)\}_{m}} są wektorami utworzonymi z pierwszych m {\displaystyle m} współrzędnych wektorów y {\displaystyle y} i z . {\displaystyle z.} Zatem zbliżenie punktów { y ( t ) } m {\displaystyle \{y(t)\}_{m}} i { z ( t ) } m {\displaystyle \{z(t)\}_{m}} na odległość mniejszą od ε {\displaystyle \varepsilon } jest interpretowane jako spotkanie obiektów.

Przypisy

  1. И.М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.).
  2. Математическая Энциклопедия, op. cit., s. 329.
  3. a b c Математическая Энциклопедия, op. cit., s. 330.
  4. Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67–70. ISBN 83-02-05275-2.

Linki zewnętrzne

  • Gra szofer – morderca i jej modyfikacje (jęz. rosyjski),
  • p
  • d
  • e
Teoria sterowania
Klasy układów
Wybrane typy regulacji
Metody klasyczne
Nowoczesna teoria sterowania
Inne zagadnienia
Dziedziny powiązane
Perspektywa historyczna