Test Craméra-von Misesa

Test Craméra-von Misesa – jeden z testów statystycznych zgodności rozkładu z zadanym rozkładem wzorcowym lub drugą próbą. Zwykle stosuje się go do sprawdzenia zgodności z rozkładem normalnym. Wynaleziony przez Haralda Craméra i Richarda von Mises, którzy zaproponowali go w latach 1928–1930.

Statystyka Craméra-von Misesa

Wersja dla jednej próby i rozkładu wzorcowego

W 2 = n + ( F n ( x ) F ( x ) ) 2 d F ( x ) , {\displaystyle W^{2}=n\int \limits _{-\infty }^{+\infty }(F_{n}(x)-F(x))^{2}dF(x),}

gdzie:

F n ( x ) {\displaystyle F_{n}(x)} – dystrybuanta empiryczna,
F ( x ) {\displaystyle F(x)} – dystrybuanta rozkładu wzorcowego,
n {\displaystyle n} – liczność próby.

Zwykle do obliczeń używany jest prostszy wzór:

W 2 = 1 12 n + i = 1 n ( F ( X ( i ) ) 2 i 1 2 n ) 2 , {\displaystyle W^{2}={\frac {1}{12n}}+\sum \limits _{i=1}^{n}\left(F(X_{(i)})-{\frac {2i-1}{2n}}\right)^{2},}

gdzie:

X ( i ) {\displaystyle X_{(i)}} i {\displaystyle i} -ta zaobserwowana wartość w próbie uporządkowanej rosnąco,
F ( x ) {\displaystyle F(x)} – dystrybuanta rozkładu wzorcowego,
n {\displaystyle n} – liczność próby.

Wersja dla dwóch prób

Niech x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} i y 1 , y 2 , , y m {\displaystyle y_{1},y_{2},\dots ,y_{m}} będą obserwowanymi wartościami w pierwszej i drugiej próbie posortowane rosnąco. Niech r 1 , r 2 , , r n {\displaystyle r_{1},r_{2},\dots ,r_{n}} będą rangami obserwacji x i {\displaystyle x_{i}} w połączonej próbie (X i Y rangowane razem) i niech s 1 , s 2 , , s m {\displaystyle s_{1},s_{2},\dots ,s_{m}} będą rangami obserwacji y i {\displaystyle y_{i}} w połączonej próbie.

Wówczas

W 2 = U n m ( n + m ) 4 m n 1 6 ( m + n ) , {\displaystyle W^{2}={\frac {U}{nm(n+m)}}-{\frac {4mn-1}{6(m+n)}},}

gdzie:

U = n i = 1 n ( r i i ) 2 + m j = 1 m ( s j j ) 2 . {\displaystyle U=n\sum _{i=1}^{n}(r_{i}-i)^{2}+m\sum _{j=1}^{m}(s_{j}-j)^{2}.}

Właściwości

Test ma lepsze właściwości niż test Kołmogorowa-Smirnowa, lecz jest stosunkowo nieczuły na odstępstwa od rozkładu w punktach dalekich od średniej („ogony” rozkładu). W celu eliminacji tej wady powstała jego modyfikacja, zwana testem Andersona-Darlinga.

Zobacz też

Bibliografia

  • pomoc do programu SAS 9.1 autorstwa SAS Institute Inc.
  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 254. ISBN 83-204-2684-7.

Linki zewnętrzne

  • Anderson: On the Distribution of the Two-Sample Cramer-von Mises Criterion, „Annals Math. Stat.” 33, #3 (1962), s. 1148–1159.
  • Xiao, Gordon, Yakovlev: A C++ program for the Cramér-von-Mises two sample test, „Journal of Statistical Software”, 17 #8, styczeń 2007.