Bonferroni-Korrektur

Die Bonferroni-Korrektur ist ein Verfahren der mathematischen Statistik zur Adjustierung der Signifikanzniveaus der Einzeltests bei multiplen Testen, um der Alphafehler-Kumulierung entgegenzuwirken und für die Durchschnittshypothese ein vorgegebenes Signifikanzniveau einzuhalten. Die Adjustierung vermindert die Signifikanzniveaus der Einzeltests und damit tendenziell die Anzahl der Ablehnungen richtiger Nullhypothesen (falsch-positiver Befunde in biometrischer Terminologie), so dass die verbleibenden Ablehnungen von Nullhypothesen mit einer höheren statistischen Signifikanz verbunden sind. Die Bonferroni-Methode (nach Carlo Emilio Bonferroni) umfasst neben der Bonferroni-Korrektur ein ähnliches Vorgehen zur Anpassung der Konfidenzniveaus bei der Konstruktion simultaner Konfidenzintervalle für einen mehrdimensionalen Parametervektor.

Adjustierte Signifikanzniveaus

Zu k 2 {\displaystyle k\geq 2} statistischen Tests mit den Nullhypothesen H 1 , , H k {\displaystyle H_{1},\dots ,H_{k}} kann die Durchschnittshypothese H 0 = j = 1 k H j {\displaystyle H_{0}=\cap _{j=1}^{k}H_{j}} gebildet werden. Die Hypothesen H 1 , , H k {\displaystyle H_{1},\dots ,H_{k}} heißen in diesem Zusammenhang Elementarhypothesen und H 0 {\displaystyle H_{0}} heißt Globalhypothese. Ein Test für die Nullhypothese H 0 {\displaystyle H_{0}} kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese H 0 {\displaystyle H_{0}} genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin, H 0 {\displaystyle H_{0}} genau dann abzulehnen, wenn mindestens eine der Hypothesen H 1 , , H k {\displaystyle H_{1},\dots ,H_{k}} abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau α global ( 0 , 1 ) {\displaystyle \alpha _{\text{global}}\in (0,1)} für den Test von H 0 {\displaystyle H_{0}} kann im Allgemeinen nicht eingehalten werden, wenn dieses als Signifikanzniveau für jeden der Einzeltests verwendet wird, da es dann zur so genannten Alphafehler-Kumulierung kommen kann.

Um das gewünschte globale Signifikanzniveau α global ( 0 , 1 ) {\displaystyle \alpha _{\text{global}}\in (0,1)} für den Test der Globalhypothese H 0 {\displaystyle H_{0}} einzuhalten, besteht die Bonferroni-Korrektur darin, für die einzelnen Tests das lokale Signifikanzniveau

α lokal = α global k {\displaystyle \alpha _{\text{lokal}}={\frac {\alpha _{\text{global}}}{k}}}

vorzugeben. Die so angepassten Signifikanzniveaus

α j = α lokal für  j = 1 , , k {\displaystyle \alpha _{j}=\alpha _{\text{lokal}}\quad {\text{für }}j=1,\dots ,k}

für die Einzeltests werden auch adjustierte Signifikanzniveaus genannt. Die Verwendung der adjustierten Signifikanzniveaus führt dazu, das für den Test der Globalhypothese das Signifikanzniveau α global {\displaystyle \alpha _{\text{global}}} gültig ist.

Adjustierte p-Werte

Bei einer klassischen Testdurchführung erfolgt die Ablehnung einer Nullhypothese, falls eine Teststatistik im Ablehnbereich (kritischen Bereich) liegt, der vom vorgegebenen Signifikanzniveau abhängt. Bei einer p {\displaystyle p} -Wert-basierten Testdurchführung, die typisch für die Anwendung statistischer Software ist, wird ein berechneter p {\displaystyle p} -Wert mit dem vorgegebenen Signifikanzniveau verglichen und die Nullhypothese wird abgelehnt, falls der p {\displaystyle p} -Wert kleiner als das vorgegebene Signifikanzniveau ist.

Bei einer p {\displaystyle p} -Wert-basierten Testdurchführung wird die Bonferroni-Korrektur durchgeführt, indem die p {\displaystyle p} -Werte der Einzeltests mit den adjustierten Signifikanzniveaus verglichen werden, dabei wird die j {\displaystyle j} -te Nullhypothese abgelehnt, falls p j < α lokal {\displaystyle p_{j}<\alpha _{\text{lokal}}} gilt.

Alternativ können adjustierte p {\displaystyle p} -Werte

p j = p j k , j = 1 , , k {\displaystyle p_{j}^{*}=p_{j}\cdot k,\quad j=1,\dots ,k}

für die Einzeltests gebildet werden, die um den Faktor k {\displaystyle k} größer sind als die ursprünglichen p {\displaystyle p} -Werte, und diese mit dem globalen Signifikanzniveau verglichen werden. Die j {\displaystyle j} -te Nullhypothese wird abgelehnt, falls p j < α global {\displaystyle p_{j}^{*}<\alpha _{\text{global}}} gilt.

Beide Vorgehensweisen führen zu denselben Testentscheidungen, da die beiden Regeln p j < α lokal {\displaystyle p_{j}<\alpha _{\text{lokal}}} und p j < α global {\displaystyle p_{j}^{*}<\alpha _{\text{global}}} äquivalent sind.

Beispiel

Gegeben seien die p-Werte p 1 = 0 , 01 , p 2 = 0 , 04 , p 3 = 0 , 1 {\displaystyle p_{1}=0{,}01,p_{2}=0{,}04,p_{3}=0{,}1} dreier Hypothesentests, die eine Hypothesenfamilie bilden. Unter Vernachlässigung der multiplen Testung und alleiniger Betrachtung lokaler Signifikanzniveaus α lokal = 0 , 05 {\displaystyle \alpha _{\text{lokal}}=0{,}05} erfolgt die Ablehnung der Nullhypothesen 1 und 2, da p 1 < α lokal {\displaystyle p_{1}<\alpha _{\text{lokal}}} und p 2 < α lokal {\displaystyle p_{2}<\alpha _{\text{lokal}}} , während die dritte Hypothese nicht abgelehnt wird, da p 3 > α lokal {\displaystyle p_{3}>\alpha _{\text{lokal}}} . Berücksichtigt man jedoch die Bonferroni-Korrektur (mit α global = 0 , 05 α lokal = α global / 3 0,016 6 {\displaystyle \alpha _{\text{global}}=0{,}05\implies \alpha _{\text{lokal}}=\alpha _{\text{global}}/3\approx 0{,}0166} ), so erfolgt nur noch die Ablehnung der Nullhypothese 1, da p 1 < α lokal {\displaystyle p_{1}<\alpha _{\text{lokal}}} und p 2 > α lokal , p 3 > α lokal {\displaystyle p_{2}>\alpha _{\text{lokal}},p_{3}>\alpha _{\text{lokal}}} .

Theoretischer Hintergrund

Die Globalhypothese H 0 {\displaystyle H_{0}} wird genau dann abgelehnt, wenn mindestens eine Elementarhypothesen abgelehnt wird. Das Ereignis { H 0  wird abgelehnt } {\displaystyle \{H_{0}{\text{ wird abgelehnt}}\}} kann als Vereinigung der Ereignisse { H j  wird abgelehnt } {\displaystyle \{H_{j}{\text{ wird abgelehnt}}\}} für j = 1 , , k {\displaystyle j=1,\dots ,k} dargestellt werden. Mit der ersten Bonferroni-Ungleichung, die auch Boolesche Ungleichung heißt, ergibt sich die Ungleichung

P ( H 0  wird abgelehnt ) = P ( j = 1 k { H j  wird abgelehnt } ) j = 1 k P ( H j  wird abgelehnt ) . {\displaystyle P(H_{0}{\text{ wird abgelehnt}})=P\left(\bigcup _{j=1}^{k}\{H_{j}{\text{ wird abgelehnt}}\}\right)\leq \sum _{j=1}^{k}P(H_{j}{\text{ wird abgelehnt}})\;.}

Betrachtet man den Fall, dass H 0 {\displaystyle H_{0}} richtig ist, und damit auch die Hypothesen H 1 , , H k {\displaystyle H_{1},\dots ,H_{k}} richtig sind, und beschränkt für diesen Fall die Wahrscheinlichkeiten P ( H j  wird abgelehnt ) {\displaystyle P(H_{j}{\text{ wird abgelehnt}})} , die dann Fehlerwahrscheinlichkeiten 1. Art sind, jeweils durch das lokale Signifikanzniveau α lokal = α global / k {\displaystyle \alpha _{\text{lokal}}=\alpha _{\text{global}}/k} nach oben, so ist P ( H 0  wird abgelehnt ) {\displaystyle P(H_{0}{\text{ wird abgelehnt}})} durch

j = 1 k P ( H j  wird abgelehnt ) j = 1 k α lokal = j = 1 k α global k = α global {\displaystyle \sum _{j=1}^{k}P(H_{j}{\text{ wird abgelehnt}})\leq \sum _{j=1}^{k}\alpha _{\text{lokal}}=\sum _{j=1}^{k}{\frac {\alpha _{\text{global}}}{k}}=\alpha _{\text{global}}}

nach oben beschränkt.

Die Bonferroni-Korrektur kann sehr konservativ sein. Deshalb wurden genauere Methoden entwickelt, die den α {\displaystyle \alpha } -Fehler weniger konservativ kontrollieren und das Signifikanzniveau der multiplen Testprozedur weiter ausschöpfen (siehe Alphafehler-Kumulierung). Im Vergleich zur allgemein anwendbaren Bonferroni-Methode ergibt sich, allerdings nur unter einschränkenden Voraussetzungen, mit der Šidák-Korrektur ein verbessertes Verfahren.

Literatur

  • H. Abdi: Encyclopedia of Measurement and Statistics. Hrsg.: N. J. Salkind. Sage, Thousand Oaks, CA 2007, Bonferroni and Sidak corrections for multiple comparisons (utdallas.edu [PDF]). 
  • Manitoba Centre for Health Policy (MCHP) 2003, Concept: Multiple Comparisons.
  • Perneger, Thomas V, What's wrong with Bonferroni adjustments, BMJ 1998;316:1236-1238 (18. April).
  • School of Psychology, University of New England, New South Wales, Australia, 2000.
  • Eric W. Weisstein: Bonferroni Correction. In: MathWorld (englisch).