Rozdział 20 Testy nieparametryczne
Poniżej przedstawione testy, razem z testem chi-kwadrat opisanym w rozdziale 18, są najpopularniejszymi testami zaliczanymi do grupy testów nazywanej testami nieparametrycznymi.
W odróżnieniu od testów parametrycznych (takich jak te przedstawione w rozdziałach 14-17 i 19), testy nieparametryczne mają luźniejsze założenia. W szczególności nie potrzebują założenia o rozkładzie normalnym w populacji. Jednocześnie jednak testy nieparametryczne mają zwykle słabszą moc w porównaniu z ich parametrycznymi odpowiednikami.
20.1 Test Manna-Whitneya
Test Manna-Whitneya (nazywany też testem Wilcoxona-Manna-Whitneya) to test będący odpowiednikiem parametrycznego testu 2 średnich (zob. 16).
Założenia: Niezależne próby losowe pochodzą z dwóch populacji.
Hipotezy: H0: W obu populacjach są takie same rozkłady, co oznacza taką samą średnią rangę w obu populacjach. HA: Różne średnie rangi w obu populacjach. Możliwa jest również hipoteza jednostronna: rangi są systematycznie niższe lub wyższe w jednej z populacji.
Statystyka testowa: Statystyka testowa U wyznaczona jest na podstawie rang. Uwzględnia również przypadek rang wiązanych (gdy więcej niż jedna obserwacja ma taką samą wartość). Konstrukcja statystyki testowej jest dość złożona, wyliczają ją dobre pakiety statystyczne.
Wielkość efektu: Zgrabną miarą wielkości efektu w teście Manna-Whitneya jest AUC (nazwa pochodzi od skrótu area under the ROC curve — pole pod krzywą ROC, czyli tzw. krzywą charakterystyki operacyjnej odbiornika12). Tę miarę można interpretować następująco: jeżeli wylosujemy jedną obserwację z grupy 1 i jedną obserwację z grupy 2, to prawdopodobieństwo, że obserwacja z grupy 1 będzie miała wyższą rangę13, to właśnie AUC. Aby obliczyć AUC, nie trzeba rysować krzywej ROC, szczególnie gdy mamy już statystykę U:
\[AUC = \frac{U}{n_1n_2}\]
20.2 Test Wilcoxona dla par obserwacji
Test Wilcoxona dla par obserwacji jest odpowiednikiem parametrycznego testu średniej różnicy dla prób zestawionych w pary (zob. 16.4).
Założenia: Losowa próba obserwacji zestawionych w pary. Różnice obserwacji mają symetryczny rozkład (w populacji) i można je uszeregować za pomocą rang.
Hipotezy: H0: Mediana różnic w populacji wynosi 0; HA: Mediana różnic w populacji nie wynosi 0. Możliwe są również jednostronne hipotezy alternatywne.
Statystyka testowa: Statystyka testowa wyprowadzona jest na podstawie rang obserwacji. Dla dużych prób statystykę testową można przekształcić w statystykę \(z\) mającą w przybliżeniu rozkład normalny.
20.3 Test Kruskala-Wallisa
Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem analizy wariancji (ANOVA, rozdział 19).
Założenia: Próby losowe zostały pobrane niezależnie z kilku (\(r\)) populacji.
Hipotezy: H0: We wszystkich \(r\) populacjach są takie same rozkłady prawdopodobieństwa. HA: Nie we wszystkich populacjach są takie same rozkłady prawdopodobieństwa.
Statystyka testowa: Opiera się na zmienności międzygrupowej rang w próbach. Wartość p (p-value) można odczytać z rozkładu chi-kwadrat o \(r-1\) stopniach swobody (prawostronny obszar krytyczny).
20.4 Linki
Test Manna-Whitneya (Pogotowie statystyczne): https://pogotowiestatystyczne.pl/aploud/2023/04/2023-04-Test-Manna-Whitneya.pdf
Test Wilcoxona (Pogotowie statystyczne): https://pogotowiestatystyczne.pl/aploud/2023/04/2023-05-Test-Wilcoxona.pdf
Test Kruskala-Wallisa (Pogotowie statystyczne): https://pogotowiestatystyczne.pl/aploud/2023/04/2023-07-Test-Kruskala-Wallisa.pdf
20.5 Szablony
Test Manna-Whitneya — arkusz Google
Test Manna-Whitneya — szablon w Excelu
Test Wilcoxona dla par obserwacji — arkusz Google
Test Wilcoxona dla par obserwacji — szablon w Excelu
Test Kruskala-Wallisa — arkusz Google
Test Kruskala-Wallisa — szablon w Excelu