Rozdział 20 Testy nieparametryczne

Poniżej przedstawione testy, razem z testem chi-kwadrat opisanym w rozdziale 18, są najpopularniejszymi testami zaliczanymi do grupy testów nazywanej testami nieparametrycznymi.

W odróżnieniu od testów parametrycznych (takich jak te przedstawione w rozdziałach 14-17 i 19), testy nieparametryczne mają luźniejsze założenia. Jednocześnie jednak mają zwykle słabszą moc w porównaniu z ich parametrycznymi odpowiednikami.

20.1 Test Manna-Whitneya

Test Manna-Whitneya (nazywany też testem Wilcoxona-Manna-Whitneya) to test będący odpowiednikiem parametrycznego testu 2 średnich (16).

Założenia: Niezależne próby losowe z dwóch populacji.

Hipotezy: H₀: Takie same rozkłady w obu populacjach, co oznacza taką samą średnią rangę w obu populacjach. H_A: Różne średnie rangi w obu populacjach. Możliwa jest również hipoteza jednostronna: rangi są systematycznie niższe lub wyższe w jednej z populacji.

Statystyka testowa: Statystyka testowa U wyznaczona jest na podstawie rang. Uwzględnia również przypadek rang wiązanych (gdy więcej niż jedna obserwacja ma taką samą wartość). Konstrukcja statystyki testowej jest dość złożona, wyliczają ją dobre pakiety statystyczne.

Wielkość efektu: Zgrabną miarą wielkości efektu w teście Manna-Whitneya jest AUC (nazwa pochodzi od skrótu area under the ROC curve — pole pod krzywą ROC, czyli tzw. krzywą charakterystyki operacyjnej odbiornika¹). Tę miarę można interpretować następująco: jeżeli wylosujemy jedną obserwację z grupy 1 i jedną obserwację z grupy 2, to prawdopodobieństwo, że obserwacja z grupy 1 będzie miała wyższą rangę, to właście AUC. Aby obliczyć AUC nie trzeba rysować krzywej ROC, szczególnie gdy mamy już statystykę U:

\[AUC = \frac{U}{n_1n_2}\]

20.2 Test Wilcoxona dla par obserwacji

Test Wilcoxona dla par obserwacji jest odpowiednikiem parametrycznego testu średniej różnicy dla prób zestawionych w pary (16.4).

Założenia: Losowa próba obserwacji zestawionych w pary. Różnice obserwacji mają symetryczny rozkład (w populacji) i można je uszeregować za pomocą rang.

Hipotezy: H₀: Mediana różnic w populacji wynosi 0; H_A: Mediana różnic w populacji nie wynosi 0. Możliwe są również jednostronne hipotezy alternatywne.

Statystyka testowa: Statystyka testowa wyprowadzona jest na podstawie rang obserwacji. Dla dużych prób statystykę testową można przekształcić w statystykę \(z\) mającą w przybliżeniu rozkład normalny.

20.3 Test Kruskala-Wallisa

Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem analizy wariancji (Anovy 19).

Założenia: Próby losowe pobrane niezależnie z kilku (\(r\)) populacji.

Hipotezy: H₀: Takie same rozkłady prawdopodobieństwa we wszystkich \(r\) populacjach. H_A: Nie we wszystkich populacjach są takie same rozkłady prawdopodobieństwa.

Statystyka testowa: Opiera się na zmienności międzygrupowej rang w próbach. Wartość p (p-value) można odczytać z rozkładu chi-kwadrat o \(r-1\) stopniach swobody (prawostronny obszar krytyczny).