Gauß-Test

Dieser Artikel behandelt den Hypothesentest von Gauß in der mathematischen Statistik. Für den Gauß-Test zur Reihenkonvergenz siehe Kriterium von Gauß.

Der Gauß-Test oder Z-Test ist in der mathematischen Statistik eine Gruppe von Hypothesentests mit standardnormalverteilter Testprüfgröße unter der Nullhypothese. Der Test ist benannt nach Carl Friedrich Gauß.

Mit dem Gauß-Test werden anhand von Stichproben-Mittelwerten Hypothesen über die Erwartungswerte derjenigen Grundgesamtheiten geprüft, aus denen die Stichproben stammen.

Der Gauß-Test folgt einer ähnlichen Methode wie der t-Test. Der wichtigste Unterschied liegt in den Voraussetzungen für die Anwendung dieser Tests: Während der t-Test mit den empirischen Standardabweichungen der Stichproben arbeitet, müssen für den Gauß-Test die Standardabweichungen der Grundgesamtheiten bekannt sein. Des Weiteren verwendet der Gauß-Test grundsätzlich die Standardnormalverteilung als Kennwerteverteilung, während der t-Test auf die t-Verteilung zurückgreift. Somit ist der Gauß-Test für kleine Stichproben nur bedingt geeignet.

Mathematische Grundlagen

Sind X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\dots ,X_{n}} unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ X {\displaystyle \mu _{X}} und Standardabweichung σ X {\displaystyle \sigma _{X}} , so ist ihr arithmetisches Mittel

X ¯ = 1 n i = 1 n X i {\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}

normalverteilt mit Erwartungswert μ X {\displaystyle \mu _{X}} und Standardabweichung σ X / n {\displaystyle \sigma _{X}/{\sqrt {n}}} .

Die Stichprobenfunktion

Z = X ¯ μ 0 σ X n {\displaystyle Z={\frac {{\bar {X}}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}}

ist dann unter der Nullhypothese μ X = μ 0 {\displaystyle \mu _{X}=\mu _{0}} standardnormalverteilt und wird als Teststatistik verwendet. Sie heißt auch Gauß-Statistik.

Die Teststatistik kann geschrieben werden als:

Z = X ¯ μ X σ X n + μ X μ 0 σ X n = X + μ X μ 0 σ X n {\displaystyle Z={\frac {{\bar {X}}-\mu _{X}}{\sigma _{X}}}{\sqrt {n}}+{\frac {\mu _{X}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}=X+{\frac {\mu _{X}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}} ,

also wie eine standardnormalverteilte Zufallsvariable X {\displaystyle X} plus eine Zahl, die auf standardisierte Weise die Distanz zwischen dem wirklichen und dem unterstellten Erwartungswert zeigt.

Liegen außerdem unabhängige normalverteilte Zufallsvariablen Y 1 , Y 2 , , Y m {\displaystyle Y_{1},Y_{2},\dots ,Y_{m}} mit Erwartungswert μ Y {\displaystyle \mu _{Y}} , Standardabweichung σ Y {\displaystyle \sigma _{Y}} und arithmetischem Mittel

Y ¯ = 1 m i = 1 m Y i {\displaystyle {\bar {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}}

vor, die zusätzlich unabhängig von der X {\displaystyle X} -Stichprobe sind, so ist X ¯ Y ¯ {\displaystyle {\bar {X}}-{\bar {Y}}} normalverteilt mit Erwartungswert μ X μ Y {\displaystyle \mu _{X}-\mu _{Y}} und Standardabweichung σ X 2 n + σ Y 2 m {\displaystyle {\sqrt {{\frac {\sigma _{X}^{2}}{n}}+{\frac {\sigma _{Y}^{2}}{m}}}}} .

Die Stichprobenfunktion

Z = ( X ¯ Y ¯ ) δ σ X 2 n + σ Y 2 m {\displaystyle Z={\frac {({\bar {X}}-{\bar {Y}})-\delta }{\sqrt {{\frac {\sigma _{X}^{2}}{n}}+{\frac {\sigma _{Y}^{2}}{m}}}}}}

ist dann unter der Nullhypothese μ X μ Y = δ {\displaystyle \mu _{X}-\mu _{Y}=\delta } standardnormalverteilt und wird als Teststatistik verwendet.

Einstichproben-Gauß-Test

Hauptartikel: Einstichproben Gauß-Test

Anwendung

Der Einstichproben-Gauß-Test prüft anhand des arithmetischen Mittels einer Stichprobe, ob der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Stichprobe x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} bestehe aus den Ausprägungen unabhängiger Zufallsvariablen und entstamme einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert μ {\displaystyle \mu } und bekannter Standardabweichung σ {\displaystyle \sigma } .

Es werden getestet bei einem

  • zweiseitigen Test: H 0 : μ = μ 0 {\displaystyle H_{0}\colon \mu =\mu _{0}} gegen H 1 : μ μ 0 {\displaystyle H_{1}\colon \mu \neq \mu _{0}}
  • rechtsseitigen Test: H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \leq \mu _{0}} gegen H 1 : μ > μ 0 {\displaystyle H_{1}\colon \mu >\mu _{0}}
  • linksseitigen Test: H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \geq \mu _{0}} gegen H 1 : μ < μ 0 {\displaystyle H_{1}\colon \mu <\mu _{0}}

Der Wert von μ 0 {\displaystyle \mu _{0}} wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße

Mit dem Stichprobenmittelwert x ¯ = 1 n i = 1 n x i {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}} berechnet man die Testprüfgröße z = n x ¯ μ 0 σ {\displaystyle z={\sqrt {n}}\cdot {\frac {{\bar {x}}-\mu _{0}}{\sigma }}} .

Zweistichproben-Gauß-Test für unabhängige Stichproben

Anwendung

Der Zweistichproben-Gauß-Test für unabhängige Stichproben prüft anhand der arithmetischen Mittel der Stichproben, ob die Erwartungswerte der zugehörigen Grundgesamtheiten verschieden sind.

Die unabhängigen Stichproben x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\dots ,x_{n}} und y 1 , y 2 , , y m {\displaystyle y_{1},y_{2},\dots ,y_{m}} sollen auch untereinander unabhängig sein und normalverteilten Grundgesamtheiten mit unbekannten Erwartungswerten μ X {\displaystyle \mu _{X}} bzw. μ Y {\displaystyle \mu _{Y}} und bekannten Standardabweichungen σ X {\displaystyle \sigma _{X}} bzw. σ Y {\displaystyle \sigma _{Y}} entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: H 0 : μ X μ Y = μ 0 {\displaystyle H_{0}\colon \mu _{X}-\mu _{Y}=\mu _{0}\!\,} gegen H 1 : μ X μ Y μ 0 {\displaystyle H_{1}\colon \mu _{X}-\mu _{Y}\neq \mu _{0}}
  • rechtsseitigen Test: H 0 : μ X μ Y μ 0 {\displaystyle H_{0}\colon \mu _{X}-\mu _{Y}\leq \mu _{0}} gegen H 1 : μ X μ Y > μ 0 {\displaystyle H_{1}\colon \mu _{X}-\mu _{Y}>\mu _{0}}
  • linksseitigen Test: H 0 : μ X μ Y μ 0 {\displaystyle H_{0}\colon \mu _{X}-\mu _{Y}\geq \mu _{0}} gegen H 1 : μ X μ Y < μ 0 {\displaystyle H_{1}\colon \mu _{X}-\mu _{Y}<\mu _{0}}

Der Wert von μ 0 {\displaystyle \mu _{0}} wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße

Mit den Stichprobenmittelwerten x ¯ = 1 n i = 1 n x i {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}} und y ¯ = 1 m i = 1 m y i {\displaystyle {\bar {y}}={\frac {1}{m}}\sum _{i=1}^{m}y_{i}} berechnet man die Testprüfgröße z = x ¯ y ¯ μ 0 σ X 2 n + σ Y 2 m {\displaystyle z={\frac {{\bar {x}}-{\bar {y}}-\mu _{0}}{\sqrt {{\frac {\sigma _{X}^{2}}{n}}+{\frac {\sigma _{Y}^{2}}{m}}}}}} .

Zweistichproben-Gauß-Test für abhängige (verbundene) Stichproben

Anwendung

Für den Zweistichproben-Gauß-Test für abhängige Stichproben müssen Paare ( x i , y i ) {\displaystyle (x_{i},y_{i})} von Messwerten vorliegen, wie man sie z. B. bei Vorher-Nachher-Messungen vorfindet. Mittels der Paardifferenzen wird geprüft, ob für diese Differenzen der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Differenzen d i = x i y i {\displaystyle d_{i}=x_{i}-y_{i}} sollen einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert μ {\displaystyle \mu } und bekannter Standardabweichung σ {\displaystyle \sigma } entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: H 0 : μ = μ 0 {\displaystyle H_{0}\colon \mu =\mu _{0}} gegen H 1 : μ μ 0 {\displaystyle H_{1}\colon \mu \neq \mu _{0}}
  • rechtsseitigen Test: H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \leq \mu _{0}} gegen H 1 : μ > μ 0 {\displaystyle H_{1}\colon \mu >\mu _{0}}
  • linksseitigen Test: H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \geq \mu _{0}} gegen H 1 : μ < μ 0 {\displaystyle H_{1}\colon \mu <\mu _{0}}

μ 0 {\displaystyle \mu _{0}} wird vom Anwender vorgegeben. In den meisten Anwendungsfällen wird auf „Ungleichheit“ ( H 1 {\displaystyle H_{1}} ) getestet; dann ist μ 0 = 0 {\displaystyle \mu _{0}=0} .

Berechnung der Testprüfgröße

Die Differenzen d i {\displaystyle d_{i}} bilden eine neue Stichprobe mit arithmetischem Mittel d ¯ = 1 n i = 1 n d i {\displaystyle {\bar {d}}={\frac {1}{n}}\sum _{i=1}^{n}d_{i}} . Also kann man den Einstichproben-Gauß-Test auf die Stichprobe der Differenzen anwenden und erhält als Testprüfgröße z = n d ¯ μ 0 σ {\displaystyle z={\sqrt {n}}\cdot {\frac {{\bar {d}}-\mu _{0}}{\sigma }}} .

Entscheidung über die Hypothesen

Bei allen drei Gauß-Tests werden für die Entscheidung über die Annahme bzw. Verwerfung der Hypothesen die allgemeinen Kriterien für Hypothesentests angewendet. Da Z {\displaystyle Z} unter der Nullhypothese eine standardnormalverteilte Zufallsvariable ist, erhält man die folgenden Regeln.[1]

zweiseitiger Test rechtsseitiger Test linksseitiger Test
Hypothesen H 0 : μ = μ 0 {\displaystyle H_{0}\colon \mu =\mu _{0}} H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \leq \mu _{0}} H 0 : μ μ 0 {\displaystyle H_{0}\colon \mu \geq \mu _{0}}
H 1 : μ μ 0 {\displaystyle H_{1}\colon \mu \neq \mu _{0}} H 1 : μ > μ 0 {\displaystyle H_{1}\colon \mu >\mu _{0}} H 1 : μ < μ 0 {\displaystyle H_{1}\colon \mu <\mu _{0}}
Stichprobenfunktion Z = X ¯ μ 0 σ X n {\displaystyle Z={\frac {{\bar {X}}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}} Z = X ¯ μ 0 σ X n {\displaystyle Z={\frac {{\bar {X}}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}} Z = X ¯ μ 0 σ X n {\displaystyle Z={\frac {{\bar {X}}-\mu _{0}}{\sigma _{X}}}{\sqrt {n}}}
Bedingung für Ablehnung von H 0 {\displaystyle H_{0}}
und Annahme von H 1 {\displaystyle H_{1}}
| Z | > Z 1 α 2 {\displaystyle |Z|>Z_{1-{\tfrac {\alpha }{2}}}} Z > Z 1 α {\displaystyle Z>Z_{1-\alpha }} Z < Z 1 α {\displaystyle Z<-Z_{1-\alpha }}

Gauß-Test für nicht-normalverteilte Zufallsvariablen

Für große Stichprobenumfänge (> 30 als Faustregel) kann aufgrund des Zentralen Grenzwertsatzes auf die Normalverteilungsannahme verzichtet werden. Wenn also die für den Gauß-Test geltenden Forderungen an die Erwartungswerte und Standardabweichungen der beteiligten Zufallsvariablen erfüllt sind, geht man davon aus, dass die für die Berechnung von z erforderlichen Summen approximativ normalverteilt sind und der Gauß-Test in guter Näherung korrekte Ergebnisse liefert.

Beispiel

Ein bestimmter Blutparameter B ist in der Bevölkerung in sehr guter Näherung normalverteilt mit σ = 2 {\displaystyle \sigma =2} . Von einer Gruppe chemisch verwandter Pharmaka ist bekannt, dass sie die Verteilung des Blutparameters verschieben können, d. h. sie verändern möglicherweise den Erwartungswert (unter Beibehaltung der Verteilungsform).

Für ein Pharmakon P aus dieser Gruppe soll geprüft werden, ob sich eine solche Veränderung tatsächlich einstellt. Zufällige unabhängige Stichproben des Umfangs n=22 ergeben die folgenden Messwerte für B:

ohne Gabe von P   xi 12 13 10 12 14 11 14 18 15 13 15 13 11 17 11 12 13 14 15 13 14 13
mit Gabe von P    yi 13 14 13 17 13 16 16 19 17 15 17 15 15 20 15 15 14 15 13 15 16 15

Mit diesen Messwerten sollen verschiedene Hypothesen geprüft werden. Das Signifikanzniveau α {\displaystyle \alpha } soll jeweils 0,05 betragen; die zugehörigen u-Werte sind dann (im Folgenden alle Werte gerundet):

  • u ( 1 α / 2 ) = u ( 0,975 ) = 1,960 {\displaystyle u(1-\alpha /2)=u(0{,}975)=1{,}960}
  • u ( 1 α ) = u ( 0 , 95 ) = 1,645 {\displaystyle u(1-\alpha )=u(0{,}95)=1{,}645}
  • u ( α ) = u ( 0 , 05 ) = 1,645 {\displaystyle u(\alpha )=u(0{,}05)=-1{,}645}

Für die Mittelwerte berechnet man x ¯ = 13 , 32 {\displaystyle {\bar {x}}=13{,}32} und y ¯ = 15 , 36 {\displaystyle {\bar {y}}=15{,}36} .

  • 1. Hypothese: Die Werte von B liegen nach Verabreichung von P im Mittel oberhalb von 15.
Verfahren: rechtsseitiger Einstichproben-Gauß-Test
H 0 : μ μ 0 = 15 {\displaystyle H_{0}:\mu \leq \mu _{0}=15} und H 1 : μ > 15 {\displaystyle H_{1}:\mu >15\!\,}
z = 22 15 , 36 15 2 = 0 , 84 < 1,645 {\displaystyle z={\sqrt {22}}\cdot {\frac {15{,}36-15}{2}}=0{,}84<1{,}645}
Entscheidung: H0 wird beibehalten. Es ließ sich nicht nachweisen, dass die Gabe von P zu einem durchschnittlichen B-Wert oberhalb 15 führt.
  • 2. Hypothese: Die Werte von B unterscheiden sich im Mittel in den beiden Grundgesamtheiten ohne bzw. mit Gabe von P.
Verfahren: zweiseitiger Zweistichproben-Gauß-Test für unabhängige Stichproben
H 0 : μ x μ y = μ 0 = 0 {\displaystyle H_{0}:\mu _{x}-\mu _{y}=\mu _{0}=0\!\,} und H 1 : μ x μ y {\displaystyle H_{1}:\mu _{x}\neq \mu _{y}}
| z | = 22 | 13 , 32 15 , 36 | 2 2 = 3 , 38 > 1,960 {\displaystyle |z|={\sqrt {22}}\cdot {\frac {|13{,}32-15{,}36|}{2\cdot {\sqrt {2}}}}=3{,}38>1{,}960}
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass sich bzgl. der Gabe bzw. Nicht-Gabe von P die B-Werte im Mittel unterscheiden.

Nun soll ein Versuch mit abhängigen Stichproben betrachtet werden. Bei umfangreichen Vorher-Nachher-Untersuchungen wurde für die Veränderung der B-Werte durch die Gabe der betroffenen Pharmaka ebenfalls eine Normalverteilung gefunden, mit σ = 1 , 6 {\displaystyle \sigma =1{,}6} . In der Tabelle der Messwerte seien nun die jeweils übereinander stehenden Messwerte in einem Vorher-Nachher-Versuch ermittelt worden.

  • 3. Hypothese: Die Werte von B liegen nach Gabe von P im Mittel um mehr als 1,25 oberhalb der Werte vor Gabe von P.
Verfahren: linksseitiger Zweistichproben-Gauß-Test für abhängige Stichproben
H 0 : μ μ 0 = 1 , 25 {\displaystyle H_{0}:\mu \geq \mu _{0}=-1{,}25} und H 1 : μ < 1 , 25 {\displaystyle H_{1}:\mu <-1{,}25\!\,}
d ¯ = x ¯ y ¯ = 2,045 {\displaystyle {\bar {d}}={\bar {x}}-{\bar {y}}=-2{,}045}
z = 22 2,045 + 1 , 25 1 , 6 = 2 , 33 < 1,645 {\displaystyle z={\sqrt {22}}\cdot {\frac {-2{,}045+1,25}{1{,}6}}=-2{,}33<-1{,}645}
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass bei Vorher-Nachher-Untersuchungen die B-Werte nach Gabe von P im Mittel um mehr als 1,25 oberhalb der B-Werte vor Gabe von P liegen.

Siehe auch

Literatur

  • Rönz/Strohe (Hrsg.): Lexikon Statistik. Gabler, 1994, ISBN 978-3-409-19952-0.
  • Irle: Wahrscheinlichkeitstheorie und Statistik. Kap. 20. Vieweg und Teubner, 2. Aufl. 2005, ISBN 978-3-519-12395-8.
  • Cramer/Kamps: Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Ein Skript für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. S. 271ff. Springer, 2. Aufl. 2008, ISBN 978-3-540-77760-1.

Einzelnachweise

  1. Patrick Planing: Z-Test/Gaußtest