Rozdział 20 Testy nieparametryczne

Poniżej przedstawione testy, razem z testem chi-kwadrat opisanym w rozdziale 18, są najpopularniejszymi testami zaliczanymi do grupy testów nazywanej testami nieparametrycznymi.

W odróżnieniu od testów parametrycznych (takich jak te przedstawione w rozdziałach 14-17 i 19), testy nieparametryczne mają luźniejsze założenia. W szczególności nie potrzebują założenia o rozkładzie normalnym w populacji. Jednocześnie jednak testy nieparametryczne mają zwykle słabszą moc w porównaniu z ich parametrycznymi odpowiednikami.

20.1 Test Manna-Whitneya

Test Manna-Whitneya (nazywany też testem Wilcoxona-Manna-Whitneya) to test będący odpowiednikiem parametrycznego testu 2 średnich (zob. 16).

Założenia: Niezależne próby losowe pochodzą z dwóch populacji.

Hipotezy: H0: W obu populacjach są takie same rozkłady, co oznacza taką samą średnią rangę w obu populacjach. HA: Różne średnie rangi w obu populacjach. Możliwa jest również hipoteza jednostronna: rangi są systematycznie niższe lub wyższe w jednej z populacji.

Statystyka testowa: Statystyka testowa U wyznaczona jest na podstawie rang. Uwzględnia również przypadek rang wiązanych (gdy więcej niż jedna obserwacja ma taką samą wartość). Konstrukcja statystyki testowej jest dość złożona, wyliczają ją dobre pakiety statystyczne.

Wielkość efektu: Zgrabną miarą wielkości efektu w teście Manna-Whitneya jest AUC (nazwa pochodzi od skrótu area under the ROC curve — pole pod krzywą ROC, czyli tzw. krzywą charakterystyki operacyjnej odbiornika12). Tę miarę można interpretować następująco: jeżeli wylosujemy jedną obserwację z grupy 1 i jedną obserwację z grupy 2, to prawdopodobieństwo, że obserwacja z grupy 1 będzie miała wyższą rangę13, to właśnie AUC. Aby obliczyć AUC, nie trzeba rysować krzywej ROC, szczególnie gdy mamy już statystykę U:

\[AUC = \frac{U}{n_1n_2}\]

20.2 Test Wilcoxona dla par obserwacji

Test Wilcoxona dla par obserwacji jest odpowiednikiem parametrycznego testu średniej różnicy dla prób zestawionych w pary (zob. 16.4).

Założenia: Losowa próba obserwacji zestawionych w pary. Różnice obserwacji mają symetryczny rozkład (w populacji) i można je uszeregować za pomocą rang.

Hipotezy: H0: Mediana różnic w populacji wynosi 0; HA: Mediana różnic w populacji nie wynosi 0. Możliwe są również jednostronne hipotezy alternatywne.

Statystyka testowa: Statystyka testowa wyprowadzona jest na podstawie rang obserwacji. Dla dużych prób statystykę testową można przekształcić w statystykę \(z\) mającą w przybliżeniu rozkład normalny.

20.3 Test Kruskala-Wallisa

Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem analizy wariancji (ANOVA, rozdział 19).

Założenia: Próby losowe zostały pobrane niezależnie z kilku (\(r\)) populacji.

Hipotezy: H0: We wszystkich \(r\) populacjach są takie same rozkłady prawdopodobieństwa. HA: Nie we wszystkich populacjach są takie same rozkłady prawdopodobieństwa.

Statystyka testowa: Opiera się na zmienności międzygrupowej rang w próbach. Wartość p (p-value) można odczytać z rozkładu chi-kwadrat o \(r-1\) stopniach swobody (prawostronny obszar krytyczny).

20.5 Szablony

Test Manna-Whitneya — arkusz Google

Test Manna-Whitneya — szablon w Excelu

Test Wilcoxona dla par obserwacji — arkusz Google

Test Wilcoxona dla par obserwacji — szablon w Excelu

Test Kruskala-Wallisa — arkusz Google

Test Kruskala-Wallisa — szablon w Excelu


  1. Jest to pojęcie z dziedziny przetwarzania sygnałów↩︎

  2. W przypadku rang wiązanych interpretacja komplikuje się odrobinę: AUC to prawdopodobieństwo, że obserwacja z grupy 1 będzie miała wyższą rangę dodać połowa prawdopodobieństwa, że rangi będą wiązane.↩︎