Statystyka 1. Skrypt
Statystyka
Statystyka jako nauka o danych
Działy statystyki
1
Dane statystyczne
1.1
Badania obserwacyjne i eksperymenty
1.2
Populacja i próba
1.3
Źródła danych statystycznych
1.4
Zmienne ilościowe i jakościowe
1.5
Skale pomiarowe
1.6
Liczby
1.6.1
Nazwy: krótka/długa skala
1.6.2
Symbol dziesiętny i separator tysięcy
1.6.3
Notacja inżynierska/naukowa
1.6.4
Procenty
1.7
Linki
Analiza rozkładu cechy
2
Rozkład empiryczny cech
2.1
Szeregi statystyczne
2.1.1
Szereg szczegółowy
2.1.2
Szereg rozdzielczy punktowy
2.1.3
Szereg rozdzielczy przedziałowy
2.2
Wizualizacja cech jakościowych
2.2.1
Wykresy słupkowe
2.2.2
Skumulowane wykresy słupkowe
2.2.3
Wykresy kołowe
2.2.4
Inne wykresy
2.3
Histogram – wizualizacja rozkładu cechy ilościowej
2.3.1
Co jest na osi Y?
2.3.2
Kształty histogramów
2.3.3
Liczba przedziałów klasowych
2.3.4
Jądrowy estymator gęstości
2.3.5
Wykres skrzypcowy
2.4
Dystrybuanta empiryczna
2.5
Zadania
2.6
Linki
3
Miary tendencji centralnej i miary pozycyjne
3.1
Średnia
3.1.1
Średnia arytmetyczna
3.1.2
Ważona średnia arytmetyczna
3.1.3
Średnia harmoniczna
3.1.4
Średnia geometryczna
3.2
Mediana
3.2.1
Wyznaczanie przybliżenia mediany z szeregu rozdzielczego przedziałowego
3.3
Dominanta
3.3.1
Wyznaczanie dominanty z szeregu rozdzielczego przedziałowego
3.4
Miary pozycyjne (kwantyle)
3.4.1
Kwartyle
3.4.2
Dwa znaczenia słowa kwartyl
3.4.3
Kwintyle
3.4.4
Decyle
3.4.5
Percentyle
3.4.6
Wyznaczanie kwantyli w praktyce
3.5
Linki
3.6
Zadania
4
Miary rozproszenia
4.1
Odchylenie standardowe
4.1.1
Wariancja
4.1.2
Współczynnik zmienności
4.1.3
Wykorzystanie odchylenia standardowego
4.1.4
Odchylenie standardowe nie jest średnim odchyleniem
4.2
Rozstęp międzykwartylowy
4.2.1
Odchylenie ćwiartkowe i pozycyjny współczynnik zmienności
4.2.2
Rozstęp decylowy
4.2.3
Rozstęp
4.3
Wykres pudełkowy
4.4
Linki
4.5
Zadania
5
Standaryzacja i rozkład normalny
5.1
Standaryzacja danych (z-score)
5.2
Rozkład normalny
5.3
Reguła empiryczna
5.4
Nierówność Czebyszewa
5.5
Generowanie danych z rozkładu normalnego (symulacja)
5.6
Linki
5.7
Zadania
6
Miary kształtu rozkładu
6.1
Miary asymetrii
6.2
Kurtoza
6.3
Wartości odstające
6.3.1
Identyfikacja wartości odstających za pomocą miar pozycyjnych
6.3.2
Identyfikacja wartości odstających za pomocą z-scores
7
Współczynnik Giniego
7.1
Definicja i pierwszy wzór
7.2
Interpretacja graficzna i drugi wzór
Analiza współzależności
8
Korelacja
8.1
Wykres rozrzutu
8.2
Współczynnik korelacji Pearsona
8.2.1
Współczynnik korelacji — wzór
8.2.2
Kowariancja
8.2.3
Współczynnik korelacji i kowariancja w arkuszach kalkulacyjnych
8.2.4
Test współczynnika korelacji
8.3
Współczynnik korelacji rang Spearmana
8.3.1
Zamiana wartości cechy na rangi
8.3.2
Uproszczony wzór dla współczynnika korelacji rang Spearmana
8.4
Tau Kendalla
8.5
Korelacja cząstkowa
8.6
Inne miary oparte na współczynniku Pearsona
8.7
Symulowanie danych skorelowanych
8.8
Linki
8.9
Zadania
9
Współzależność cech jakościowych
9.1
Tablice kontyngencji
9.2
Test niezależności chi-kwadrat
9.3
Współczynnik V-Cramera
9.4
Linki
10
Zmienne dychotomiczne a miary współzależności
10.1
Siła efektu d Cohena
10.2
AUC i D Somersa
10.3
Korelacja punktowo-dwuseryjna
10.4
Współczynnik Yule'a
10.5
Iloraz szans
11
Regresja liniowa
11.1
Model regresji prostej
11.1.1
Wyraz wolny i współczynnik nachylenia
11.1.2
Reszty, R-kwadrat
11.1.3
Wykorzystanie regresji
11.1.4
Regresja a korelacja
11.1.5
Przekształcanie zmiennych
11.2
Regresja wieloraka
11.2.1
Zmienne zero-jedynkowe
11.2.2
Zapis macierzowy
11.3
Linki
Analiza dynamiki
12
Metoda indeksowa
12.1
Szeregi czasowe
12.2
Szeregi okresów i momentów
12.2.1
Średnia chronologiczna
12.3
Przyrosty absolutne i względne
12.4
Indeksy
12.4.1
Indeks łańcuchowy
12.4.2
Indeks jednopodstawowy
12.5
Średnie tempo zmian
12.6
Indeksy agregatowe cen i ilości
12.6.1
Indeks Laspeyresa
12.6.2
Indeks Paaschego
12.6.3
Indeks Fishera
12.7
Zadania
13
Trend i wahania sezonowe
13.1
Komponenty szeregu czasowego
13.2
Średnia ruchoma
13.3
Model trendu liniowego
13.4
Wahania sezonowe addytywne i multiplikatywne
Dodatki
A
Wzory
B
Zielona kartka
B.1
Lista zbieranych cech
B.2
Zielona kartka - zebrane dane
Literatura
Published with bookdown
Statystyka 1 - skrypt
Literatura
options(OutDec = '.')
Oldfield, R. C. 1971.
“The Assessment and Analysis of Handedness: The Edinburgh Inventory.”
Neuropsychologia
9 (1): 97–113.
https://doi.org/10.1016/0028-3932(71)90067-4
.