Rozdział 6 Miary kształtu rozkładu
6.1 Miary asymetrii
Współczynnik asymetrii jest jednym ze sposobów pomiaru asymetrii (skośności) rozkładu zmiennej.
g1=1nn∑i=1(xi−ˉxσx)3
Wzór (6.1) jest wzorem analogicznym do "populacyjnej" wersji wariancji i odchylenie standardowego.
Zmodyfikowany współczynnik asymetrii można zdefiniować w następujący sposób:
G1=√n(n−1)n−2g1
Współczynnik asymetrii mierzy, który koniec wykresu rozkładu ("ogon") jest bardziej rozciągnięty. Jeżeli rozciągnięty jest lewy ogon (wartości poniżej średniej), współczynnik asymetrii jest ujemny. Jeżeli prawy (wartości powyżej średniej), współczynnik jest dodatni.
W popularnych arkuszach kalkulacyjnych zmodyfikowany współczynnik asymetrii (G1) możemy obliczyć używając funkcji SKOŚNOŚĆ (ang. SKEW - Google Sheets, Excel, zaś g1 otrzymamy korzystając z funkcji SKOŚNOŚĆ.P (SKEW.P) - Google sheets, Excel.
Interpretacja współczynnika asymetrii zależy od dziedziny. Można na przykład przyjąć następujące zasady:
Jeśli skośność wynosi od -0,5 do 0,5, dane są dość symetryczne.
Jeśli skośność wynosi od -1 do – 0,5 lub od 0,5 do 1, dane są umiarkowanie asymetryczne.
Jeśli skośność jest mniejsza niż -1 lub większa niż 1, dane są silnie skośne.
6.2 Kurtoza
Kurtoza nadwyżkowa (współczynnik ekscesu) ma następujący wzór:
g2=1nn∑i=1(xi−ˉxσx)4−3
Powyższy wzór można traktować jako wzór "dla populacji". Wzór "dla próbki" jest zwykle następujący:
G2=n−1(n−2)(n−3)[(n+1)g2+6]
W niektórych pakietach statystycznych występuje także wzór:
b2=1nn∑i=1(xi−ˉxsx)4−3
W arkuszach kalkulacyjnych funkcja KURT oblicza współczynnik G2 według wzoru (6.4) - - Google Sheets, Excel. Współczynniki g2 and b2 mogą być wyznaczone za pomocą średniej, odchylenia standardowego i formuł tablicowych.
Kurtoza nadwyżkowa (współczynnik ekscesu) mierzy intensywność wartości w ogonach rozkładu w porównaniu z rozkładem normalnym.
Interpretacja kurtozy zależy od dziedziny. Można zaproponować na przykład taką skalę:
Pomiędzy -0,5 a 0,5 – rozkład jest w przybliżeniu mezokurtyczny (wartości skrajne występują z intensywnością podobną do intensywności wartości skrajnych w rozkładzie normalnym)
Pomiędzy -1 a -0,5 – rozkład jest umiarkowanie platykurtyczny (wartości skrajnych jest mniej, lub są mniejsze co do wartości, niż w rozkładzie normalnym)
Poniżej -1 – rozkład jest wysoce platykurtyczny
Od 0,5 do 1,0 – rozkład jest umiarkowanie leptokurtyczny
Pomiędzy 1,0 a 5,0 – wysoce leptokurtyczny
Powyżej 5,0 – skrajnie leptokurtyczny