Obserwacja wpływowa

Obserwacja wpływowa – w statystyce odmiana obserwacji nietypowej. Jej wystąpienie i wartość mogą znacznie zniekształcić wyniki oszacowania modelu. W analizie regresji liniowej obserwacja wpływowa powoduje zmianę nachylenia prostej regresji, zaś jej usunięcie ze zbioru danych nieproporcjonalnie dużą zmianę wektora współczynników regresji w porównaniu z sytuacją, w której problematycznej obserwacji by nie było.

Diagnostyka

Wpływ ten można oszacować, obliczając pochodną cząstkową estymatora po wartości jednej obserwacji.

Na przykład dla nieobciążonego estymatora wariancji:

s 2 = n n 1 ( x 2 ¯ ( x ¯ ) 2 ) {\displaystyle s^{2}={\frac {n}{n-1}}\left({\overline {x^{2}}}-({\overline {x}})^{2}\right)}

najbardziej wpływowe są obserwacje najbardziej oddalone od średniej, gdyż:

| s 2 x i | = | n n 1 ( 2 x i n 2 x ¯ n ) | = {\displaystyle \left|{\frac {\partial s^{2}}{\partial x_{i}}}\right|=\left|{\frac {n}{n-1}}\left(2{\frac {x_{i}}{n}}-2{\overline {x}}{n}\right)\right|=} 2 | x i x ¯ | n 1 {\displaystyle 2{\frac {|x_{i}-{\overline {x}}|}{n-1}}}

Bardziej zaawansowaną koncepcją szacowania wpływu zaburzenia obserwacji na estymatory jest funkcja wpływu.


Bibliografia

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2006. ISBN 83-204-3242-1.

Zobacz też