Rozdział 6 Miary kształtu rozkładu
6.1 Miary asymetrii
Współczynnik asymetrii jest jednym ze sposobów pomiaru asymetrii (skośności) rozkładu zmiennej.
\[\begin{equation} g_{1} = \frac{1}{n}\sum_{i=1}^n\left(\frac{x_i-\bar{x}}{\sigma_x}\right)^3 \tag{6.1} \end{equation}\]
Wzór (6.1) jest wzorem analogicznym do "populacyjnej" wersji wariancji i odchylenie standardowego.
Zmodyfikowany współczynnik asymetrii można zdefiniować w następujący sposób:
\[\begin{equation} G_{1} = \frac{\sqrt{n(n-1)}}{n-2}g_{1} \tag{6.2} \end{equation}\]
Współczynnik asymetrii mierzy, który koniec wykresu rozkładu ("ogon") jest bardziej rozciągnięty. Jeżeli rozciągnięty jest lewy ogon (wartości poniżej średniej), współczynnik asymetrii jest ujemny. Jeżeli prawy (wartości powyżej średniej), współczynnik jest dodatni.
W popularnych arkuszach kalkulacyjnych zmodyfikowany współczynnik asymetrii (\(G_1\)) możemy obliczyć używając funkcji SKOŚNOŚĆ (ang. SKEW - Google Sheets, Excel, zaś \(g_1\) otrzymamy korzystając z funkcji SKOŚNOŚĆ.P (SKEW.P) - Google sheets, Excel.
Interpretacja współczynnika asymetrii zależy od dziedziny. Można na przykład przyjąć następujące zasady:
Jeśli skośność wynosi od -0,5 do 0,5, dane są dość symetryczne.
Jeśli skośność wynosi od -1 do – 0,5 lub od 0,5 do 1, dane są umiarkowanie asymetryczne.
Jeśli skośność jest mniejsza niż -1 lub większa niż 1, dane są silnie skośne.
6.2 Kurtoza
Kurtoza nadwyżkowa (współczynnik ekscesu) ma następujący wzór:
\[\begin{equation} g_{2} = \frac{1}{n}\sum_{i=1}^n\left(\frac{x_i-\bar{x}}{\sigma_x}\right)^4-3 \tag{6.3} \end{equation}\]
Powyższy wzór można traktować jako wzór "dla populacji". Wzór "dla próbki" jest zwykle następujący:
\[\begin{equation} G_{2} = \frac{n-1}{(n-2)(n-3)}\left[(n+1)g_{2}+6\right] \tag{6.4} \end{equation}\]
W niektórych pakietach statystycznych występuje także wzór:
\[\begin{equation} b_{2} = \frac{1}{n}\sum_{i=1}^n\left(\frac{x_i-\bar{x}}{s_x}\right)^4-3 \tag{6.5} \end{equation}\]
W arkuszach kalkulacyjnych funkcja KURT oblicza współczynnik \(G_2\) według wzoru (6.4) - - Google Sheets, Excel. Współczynniki \(g_2\) and \(b_2\) mogą być wyznaczone za pomocą średniej, odchylenia standardowego i formuł tablicowych.
Kurtoza nadwyżkowa (współczynnik ekscesu) mierzy intensywność wartości w ogonach rozkładu w porównaniu z rozkładem normalnym.
Interpretacja kurtozy zależy od dziedziny. Można zaproponować na przykład taką skalę:
Pomiędzy -0,5 a 0,5 – rozkład jest w przybliżeniu mezokurtyczny (wartości skrajne występują z intensywnością podobną do intensywności wartości skrajnych w rozkładzie normalnym)
Pomiędzy -1 a -0,5 – rozkład jest umiarkowanie platykurtyczny (wartości skrajnych jest mniej, lub są mniejsze co do wartości, niż w rozkładzie normalnym)
Poniżej -1 – rozkład jest wysoce platykurtyczny
Od 0,5 do 1,0 – rozkład jest umiarkowanie leptokurtyczny
Pomiędzy 1,0 a 5,0 – wysoce leptokurtyczny
Powyżej 5,0 – skrajnie leptokurtyczny