Dirichlet-Verteilung

Beispiele einer Dirichlet-Verteilung mit K=3 für verschiedene Parametervektoren α. Im Uhrzeigersinn von oben links: α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4).

Die Dirichletverteilung (nach Peter Gustav Lejeune Dirichlet) ist eine Familie von stetigen, multivariaten Wahrscheinlichkeitsverteilungen.

Sie ist die multivariate Erweiterung der Beta-Verteilung und die konjugierte A-priori-Verteilung der Multinomialverteilung in der bayesschen Statistik. Ihre Dichtefunktion gibt die Wahrscheinlichkeiten von K verschiedenen, exklusiven Ereignissen an, wenn jedes Ereignis ( α i 1 ) {\displaystyle \left(\alpha _{i}-1\right)} -mal beobachtet wurde.

Veranschaulichung

Die Multinomialverteilung gibt die Wahrscheinlichkeiten p 1 {\displaystyle p_{1}} bis p K {\displaystyle p_{K}} für K unterschiedliche Ereignisse an, also z. B. wie wahrscheinlich es ist, in einem Wurf eine Eins, Zwei, Drei, Vier, Fünf oder Sechs zu würfeln. Im Gegensatz dazu gibt die Dirichlet-Verteilung an, wie wahrscheinlich eine solche Verteilung auftritt. Im Falle einer Würfelfabrik könnte die Dirichlet-Verteilung also angeben, wie wahrscheinlich die Verteilungen der Würfelergebnisse bei den fabrizierten Würfeln sind. Funktionieren die Maschinen der Würfelfabrik korrekt, wäre die Wahrscheinlichkeit für alles andere als die uniforme Verteilung (alle Augenzahlen sind gleich wahrscheinlich) sehr gering. Das entspräche einem Parametervektor α {\displaystyle \alpha } mit gleichen und sehr hohen Elementen wie etwa ( 1000 , 1000 , 1000 , 1000 , 1000 , 1000 ) {\displaystyle (1000,1000,1000,1000,1000,1000)} . Hingegen würde α = ( 1000 , 500 , 500 , 500 , 500 , 500 ) {\displaystyle \alpha =(1000,500,500,500,500,500)} bedeuten, dass die Maschinen Würfel fabrizieren, bei denen die Augenzahl Eins doppelt so häufig vorkommt wie jede andere Augenzahl. Und dies fast ausnahmslos, da die Werte wiederum sehr hoch sind und damit die Varianz niedrig. Wären die Werte in α {\displaystyle \alpha } aber z. B. alle 0 , 1 {\displaystyle 0{,}1} , dann würden Würfel hergestellt werden, die eine starke Tendenz zu einer Augenzahl haben. Welche die bevorzugte Augenzahl eines Würfels ist, wäre dabei zufällig, da alle Werte in α {\displaystyle \alpha } gleich sind. Je kleiner die Werte, desto ausgeprägter wäre die Unfairness der meisten Würfel, und desto seltener wären Würfel ohne eine bevorzugte Augenzahl.

Dichtefunktion

Die Dirichletverteilung der Ordnung K ≥ 2 mit den Parametern α 1 , . . . , α K > 0 {\displaystyle \alpha _{1},...,\alpha _{K}>0} und dem Parametervektor α = ( α 1 , , α K ) {\displaystyle \alpha =(\alpha _{1},\dots ,\alpha _{K})} hat folgende Dichtefunktion:

f ( x 1 , , x K ; α 1 , , α K ) = { 1 B ( α ) i = 1 K x i α i 1 für alle  x 1 > 0 , , x K > 0  mit  i = 1 K x i = 1 0 sonst . {\displaystyle f(x_{1},\dots ,x_{K};\alpha _{1},\dots ,\alpha _{K})={\begin{cases}{\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}&{\text{für alle }}x_{1}>0,\ldots ,x_{K}>0{\text{ mit }}\sum _{i=1}^{K}x_{i}=1\\0&{\text{sonst}}\end{cases}}\;.}

Die normierende Konstante B ( α ) {\displaystyle \mathrm {B} (\alpha )} ist die multivariate Betafunktion an der Stelle α {\displaystyle \alpha } , welche durch Werte der Gammafunktion an den Stellen α 1 , , α K {\displaystyle \alpha _{1},\dots ,\alpha _{K}} dargestellt werden kann:

B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) . {\displaystyle \mathrm {B} (\alpha )={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum _{i=1}^{K}\alpha _{i}{\bigr )}}}.}

Die Dichtefunktion ist keine Dichte bezüglich des K-dimensionalen Lebesgue-Maßes, sondern eine Dichtefunktion bezüglich des (K-1)-dimensionalen Lebesgue-Maßes im durch die Restriktion i = 1 K x i = 1 {\displaystyle \textstyle \sum _{i=1}^{K}x_{i}=1} definierten (K-1)-dimensionalen Teilraum. Durch die Ersetzung x K = 1 i = 1 K 1 x i {\displaystyle x_{K}=1-\textstyle \sum _{i=1}^{K-1}x_{i}} erhält man die (K-1)-dimensionale Dichtefunktion

f ( x 1 , , x K 1 ; α 1 , , α K ) = { 1 B ( α ) i = 1 K 1 x i α i 1 ( 1 i = 1 K 1 x i ) α K 1 für alle  x 1 > 0 , , x K 1 > 0  mit  i = 1 K 1 x i < 1 0 sonst . {\displaystyle f(x_{1},\dots ,x_{K-1};\alpha _{1},\dots ,\alpha _{K})={\begin{cases}{\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K-1}x_{i}^{\alpha _{i}-1}(1-\textstyle \sum _{i=1}^{K-1}x_{i})^{\alpha _{K}-1}&{\text{für alle }}x_{1}>0,\ldots ,x_{K-1}>0{\text{ mit }}\sum _{i=1}^{K-1}x_{i}<1\\0&{\text{sonst}}\end{cases}}\;.}

Bei einer Verwendung der Dirichlet-Verteilung als A-priori-Verteilung für eine Multinomialverteilung sind die Vektoren ( x 1 , , x K ) {\displaystyle (x_{1},\dots ,x_{K})} mit positiver Dichte alternative Werte für den Parametervektor einer Multinomialverteilung.

  • Eintrag in der Encyclopedia of Mathematics (Springer)
Diskrete univariate Verteilungen

Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | Dirac | diskret uniform | empirisch | hypergeometrisch | kategorial | negativ hypergeometrisch | Rademacher | verallgemeinert binomial | Zipf | Zipf-Mandelbrot | Zweipunkt

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta

Kontinuierliche univariate Verteilungen

Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | Trapez | U-quadratisch | stetig uniform | Wigner-Halbkreis

Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi | Chi-Quadrat | Coxian | Erlang | Exponential | Extremwert | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hartman-Watson | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Kolmogorow-Verteilung | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt

Multivariate Verteilungen

Diskrete multivariate Verteilungen:
Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch

Kontinuierliche multivariate Verteilungen:
Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart