Wishartverdeling

De wishartverdeling is een multivariate kansverdeling. De verdeling is in meer dimensies een generalisatie van de chi-kwadraatverdeling en bij een niet-geheel aantal vrijheidsgraden van de gamma-verdeling. De verdeling is genoemd naar John Wishart, die de verdeling voor het eerst formuleerde in 1928.[1]

De wishartverdelingen vormen een familie van verdelingen van stochastische grootheden met als waarden symmetrische niet-negatief definiete matrices. Zij spelen een belangrijke rol bij de schattingen van covariantiematrices in de multivariate statistiek. In Bayesiaanse statistiek is de wishartverdeling de geconjugeerde a-prioriverdeling van de inverse covariantiematrix van een meerdimensionaal normaalverdeelde stochastische vector.

Definitie

Zij X {\displaystyle X} een n × p {\displaystyle n\times p} -matrix waarvan de rijen onderling onafhankelijk zijn en elke rij een steekproef is uit een p {\displaystyle p} -dimensionale multivariate normale verdeling met verwachtingswaarde 0 en covariantiematrix V {\displaystyle V} .

X ( i ) = ( X i 1 , , X i p ) N p ( 0 , V ) . {\displaystyle X_{(i)}{=}(X_{i1},\dots ,X_{ip})\sim N_{p}(0,V).}

De wishartverdeling is dan de kansverdeling van de stochastische p × p {\displaystyle p\times p} -matrix S = X T X {\displaystyle S=X^{T}X} , en men noteert;

S W p ( V , n ) . {\displaystyle S\sim W_{p}(V,n).}

Het positieve gehele getal n {\displaystyle n} heet het aantal vrijheidsgraden. Voor n p {\displaystyle n\geq p} is S {\displaystyle S} met kans 1 niet-inverterrbaar als V {\displaystyle V} niet-inverterrbaar is.

Voor p = 1 {\displaystyle p=1} en V = 1 {\displaystyle V=1} komt de wishartverdeling overeen met de chi-kwadraatverdeling met 1 vrijheidsgraad.

Kansdichtheid

Zij V {\displaystyle V} een positieve p × p {\displaystyle p\times p} -matrix en W {\displaystyle W} een positief-definiete symmetrische stochastische p × p {\displaystyle p\times p} -matrix die wishartverdeeld is met parameters n p {\displaystyle n\geq p} en V {\displaystyle V} :

W W p ( V , n ) {\displaystyle W\sim W_{p}(V,n)}

Dan wordt de kansdichtheid f W {\displaystyle f_{W}} van W {\displaystyle W} gegeven wordt door:

f W ( w ) = det ( w ) ( n p 1 ) / 2 exp ( 1 2 s p ( V 1 w ) ) 2 n p / 2 det ( V ) n / 2 Γ p ( n / 2 ) {\displaystyle f_{W}(w)={\frac {\det(w)^{(n-p-1)/2}\exp \left(-{\tfrac {1}{2}}{\rm {sp}}(V^{-1}w)\right)}{2^{np/2}\det(V)^{n/2}\Gamma _{p}(n/2)}}}

Daarin staat det {\displaystyle \det } voor de determinant van een matrix, stelt s p {\displaystyle sp} het spoor van een matrix voor, en is Γ p {\displaystyle \Gamma _{p}} de meerdimensionale gammafunctie, gedefinieerd door:

Γ p ( 1 2 n ) = π p ( p 1 ) / 4 j = 1 p Γ ( 1 2 ( n + 1 j ) ) {\displaystyle \Gamma _{p}({\tfrac {1}{2}}n)=\pi ^{p(p-1)/4}\prod _{j=1}^{p}\Gamma \left({\tfrac {1}{2}}(n+1-j)\right)}

Eigenschappen

De matrix V {\displaystyle V} in de wishartverdeling W p ( V , n ) {\displaystyle W_{p}(V,n)} is een schaalparameter, in de zin dat als de stochastische matrix W {\displaystyle W} wishartverdeeld is met parameters ( p , n , V ) {\displaystyle (p,n,V)} :

W W p ( V , n ) {\displaystyle W\sim W_{p}(V,n)} ,

de gestandaardiseerde matrix V 1 2 W V 1 2 {\displaystyle V^{-{\tfrac {1}{2}}}WV^{-{\tfrac {1}{2}}}} wishartverdeeld is met parameters ( p , n , I p ) {\displaystyle (p,n,I_{p})} :

V 1 2 W V 1 2 W p ( I p , n ) {\displaystyle V^{-{\tfrac {1}{2}}}WV^{-{\tfrac {1}{2}}}\sim W_{p}(I_{p},n)} ,

waarin I p {\displaystyle I_{p}} de p {\displaystyle p} -dimensionale eenheidsmatrix is.

De wishartverdeling is reproductief, wat inhoudt dat als W 1 , , W m {\displaystyle W_{1},\ldots ,W_{m}} onderling onafhankelijke wishartverdeelde matrices zijn, met

W i W p ( V , n i ) {\displaystyle W_{i}\sim W_{p}(V,n_{i})} ,

de som ook wishartverdeeld is met n = n 1 + + n m {\displaystyle n=n_{1}+\ldots +n_{m}} vrijheidsgraden:

W 1 + + W m W p ( V , n ) {\displaystyle W_{1}+\ldots +W_{m}\sim W_{p}(V,n)}


Bronnen, noten en/of referenties

Voetnoten

  1. Wishart, J. (1928). The generalised product moment distribution in samples from a normal multivariate population. Biometrika 20A (1–2): 32–52. DOI: 10.1093/biomet/20A.1-2.32.

Bronnen

  • Dit artikel of een eerdere versie ervan is een (gedeeltelijke) vertaling van het artikel Wishart distribution op de Engelstalige Wikipedia, dat onder de licentie Creative Commons Naamsvermelding/Gelijk delen valt. Zie de bewerkingsgeschiedenis aldaar.