Twierdzenie o rzucie ortogonalnym

Ten artykuł dotyczy przestrzeni Hilberta. Zobacz też: twierdzenie o rzucie prostokątnym dotyczące pól powierzchni.

Twierdzenie o rzucie ortogonalnym – twierdzenie analizy funkcjonalnej mówiące, że dla dowolnej domkniętej podprzestrzeni liniowej przestrzeni Hilberta istnieje ortogonalna podprzestrzeń komplementarna do wybranej. Ma ono szereg zastosowań nie tylko w analizie funkcjonalnej (np. dowód twierdzenia Riesza), ale również m.in. w teorii równań różniczkowych cząstkowych.

Niech H {\displaystyle H} będzie przestrzenią Hilberta, zaś C H {\displaystyle C\subseteq H} będzie jej domkniętą podprzestrzenią liniową; wówczas

H = C C , {\displaystyle H=C\oplus C^{\perp },}

gdzie {\displaystyle \oplus } oznacza (wewnętrzną) sumę prostą, a C {\displaystyle C^{\perp }} to dopełnienie ortogonalne podprzestrzeni C . {\displaystyle C.}

Dowód

Ponieważ C {\displaystyle C} jest niepusta i wypukła jako podprzestrzeń liniowa H {\displaystyle H} oraz zupełna jako domknięta podprzestrzeń przestrzeni zupełnej[a], to spełnione są założenia twierdzenia o zbiorze wypukłym, które dla dowolnego elementu h H {\displaystyle h\in H} gwarantuje istnienie jedynego elementu a C , {\displaystyle a\in C,} który leży najbliżej h . {\displaystyle h.} Wówczas:

h = c + ( h c ) . {\displaystyle h=c+(h-c).}

Z kolei poniższy lemat zapewnia, że element ( h c ) C , {\displaystyle (h-c)\perp C,} tj. h c C , {\displaystyle h-c\in C^{\perp },} a co za tym idzie H = C + C {\displaystyle H=C+C^{\perp }} (przestrzeń H {\displaystyle H} jest generowana przez C , C {\displaystyle C,C^{\perp }} ); ponadto jeżeli x C C , {\displaystyle x\in C\cap C^{\perp },} to x x , {\displaystyle x\perp x,} co zachodzi tylko dla x = 0 {\displaystyle x=0} [b], a zatem C C = { 0 } ; {\displaystyle C\cap C^{\perp }=\{0\};} stąd też H = C C {\displaystyle H=C\oplus C^{\perp }} jest ortogonalną sumą prostą podprzestrzeni C {\displaystyle C} i jej dopełnienia ortogonalnego C . {\displaystyle C^{\perp }.}

Element c {\displaystyle c} nazywany też bywa elementem najlepiej aproksymującym h {\displaystyle h} ew. rzutem h {\displaystyle h} na C {\displaystyle C} i oznaczany bywa P C ( h ) {\displaystyle P_{C}(h)} ew. Π C ( h ) . {\displaystyle \Pi _{C}(h).}

Lemat
Niech X {\displaystyle X} będzie przestrzenią unitarną z normą {\displaystyle \|\cdot \|} indukowaną z iloczynu skalarnego , , {\displaystyle \langle \cdot ,\cdot \rangle ,} zaś Y {\displaystyle Y} będzie zupełną podprzestrzenią liniową w X . {\displaystyle X.} Wówczas a {\displaystyle a} jest rzutem x {\displaystyle x} na Y {\displaystyle Y} wtedy i tylko wtedy, gdy a Y {\displaystyle a\in Y} oraz ( x a ) Y {\displaystyle (x-a)\perp Y} [c].

Uwagi

  1. Niech ( x n ) {\displaystyle (x_{n})} będzie ciągiem w C , {\displaystyle C,} wtedy z definicji x n x H , {\displaystyle x_{n}\to x\in H,} skąd x c l C , {\displaystyle x\in \mathrm {cl} \;C,} z domkniętości c l C = C , {\displaystyle \mathrm {cl} \;C=C,} zatem C {\displaystyle C} jest zupełna.
  2. Z definicji C {\displaystyle C^{\bot }} jest zbiorem tych elementów x H , {\displaystyle x\in H,} które są ortogonalne do każdego elementu zbioru C ; {\displaystyle C;} jeżeli x C {\displaystyle x\in C} należy również do C , {\displaystyle C^{\perp },} to znaczy, że jest do siebie ortogonalny, tj. x x . {\displaystyle x\perp x.} Warunek ten można zapisać w postaci x , x = 0 , {\displaystyle \langle x,x\rangle =0,} gdzie , {\displaystyle \langle \cdot ,\cdot \rangle } oznacza iloczyn skalarny przestrzeni H , {\displaystyle H,} co z jego niezdegenerowania ma miejsce wyłącznie dla x = 0. {\displaystyle x=0.}
  3. Konieczność. Niech a {\displaystyle a} będzie rzutem x {\displaystyle x} na Y {\displaystyle Y} i niech b Y { 0 } = Y 0 . {\displaystyle b\in Y\smallsetminus \{0\}=Y_{0}.} Niech teraz λ = x a , b b {\displaystyle \lambda =\langle x-a,{\frac {b}{\|b\|}}\rangle } oraz c = a + λ b b Y . {\displaystyle c=a+\lambda {\frac {b}{\|b\|}}\in Y.} Skoro a {\displaystyle a} jest najlepszym przybliżeniem x {\displaystyle x} należącym do Y , {\displaystyle Y,} to
    x a 2 x c 2 = x c , x c = x a λ b b , x a λ b b = {\displaystyle \|x-a\|^{2}\leqslant \|x-c\|^{2}=\langle x-c,x-c\rangle =\langle x-a-\lambda {\frac {b}{\|b\|}},x-a-\lambda {\frac {b}{\|b\|}}\rangle =}
    = x a 2 2 ( λ ¯ x a , b b ) + | λ | 2 = x a 2 2 ( λ ¯ λ ) + | λ | 2 = {\displaystyle =\|x-a\|^{2}-2\Re \left({\overline {\lambda }}\cdot \langle x-a,{\frac {b}{\|b\|}}\rangle \right)+|\lambda |^{2}=\|x-a\|^{2}-2\Re \left({\overline {\lambda }}\cdot \lambda \rangle \right)+|\lambda |^{2}=}
    = x a 2 2 | λ | 2 + | λ | 2 = x a 2 λ 2 , {\displaystyle =\|x-a\|^{2}-2|\lambda |^{2}+|\lambda |^{2}=\|x-a\|^{2}-\|\lambda \|^{2},}
    gdzie z {\displaystyle \Re \;z} oznacza część rzeczywistą liczby zespolonej z , {\displaystyle z,} zaś z ¯ {\displaystyle {\overline {z}}} to jej sprzężenie zespolone.

    Otrzymana nierówność oznacza, iż λ = 0 , {\displaystyle \lambda =0,} a stąd także 0 = λ b = x a , b . {\displaystyle 0=\lambda \cdot \|b\|=\langle x-a,b\rangle .} Tzn. ( x a ) b . {\displaystyle (x-a)\perp b.}

    Dostateczność. Niech a Y {\displaystyle a\in Y} oraz ( x a ) Y . {\displaystyle (x-a)\perp Y.} Niech dalej b Y . {\displaystyle b\in Y.} Ponieważ Y {\displaystyle Y} jest podprzestrzenią liniową, to a b Y , {\displaystyle a-b\in Y,} skąd ( x a ) ( a b ) . {\displaystyle (x-a)\perp (a-b).} Wobec tego:
    x b 2 = ( x a ) + ( a b ) 2 = ( x a ) + ( a b ) , ( x a ) + ( a b ) = {\displaystyle \|x-b\|^{2}={\big \|}(x-a)+(a-b){\big \|}^{2}=\langle (x-a)+(a-b),(x-a)+(a-b)\rangle =}
    = x a 2 + a b 2 2 ( x a ) , ( a b ) = x a 2 + a b 2 x a 2 , {\displaystyle =\|x-a\|^{2}+\|a-b\|^{2}-2\cdot \Re \langle (x-a),(a-b)\rangle =\|x-a\|^{2}+\|a-b\|^{2}\geqslant \|x-a\|^{2},}
    co oznacza, że a {\displaystyle a} jest najbliżej położonym punktem przestrzeni Y {\displaystyle Y} punktu x . {\displaystyle x.}

Bibliografia