Statystyka 2. Skrypt
1
Wprowadzenie
2
Trzy światy
2.1
Pytania
3
Populacja i próba
3.1
Populacja-próba: przykłady
3.2
Losowanie ze zwracaniem i bez zwracania
3.3
Pytania
Rachunek prawdopodobieństwa
4
Prawdopodobieństwo
4.1
Aksjomaty
4.2
Interpretacje prawdopodobieństwa:
4.3
Zdarzenia – podstawowe pojęcia
4.3.1
Zdarzenie elementarne
4.3.2
Zdarzenie złożone
4.3.3
Zbiór zdarzeń elementarnych (przestrzeń zdarzeń elementarnych)
4.3.4
Suma zdarzeń
4.3.5
Iloczyn zdarzeń
4.3.6
Zdarzenie przeciwne
4.3.7
Prawdopodobieństwo warunkowe:
4.3.8
Zdarzenia wzajemnie wykluczające się (rozłączne)
4.3.9
Zdarzenia niezależne
4.4
Prawdopodobieństwo – podstawowe reguły
4.4.1
Zasada dopełnień
4.4.2
Zasada dodawania
4.4.3
Zasada mnożenia
4.5
Zadania
5
Wzór Bayesa
5.1
Twierdzenie o prawdopodobieństwie całkowitym
5.2
Twierdzenie Bayesa
5.3
Przykłady
5.4
Szablony
5.5
Linki
5.6
Zadania
6
Kombinatoryka
6.1
Zadania
7
Zmienne losowe
7.1
Rozkład prawdopodobieństwa
7.2
Wartość oczekiwana
7.3
Wariancja i odchylenie standardowe
7.4
Dystrybuanta zmiennej losowej
7.5
Przekształcenia zmiennych losowych
7.5.1
Dodawanie stałej do zmiennej
7.5.2
Mnożenie zmiennych przez stałą
7.5.3
Dodawanie zmiennych losowych
7.6
Szablony
7.7
Zadania
8
Dyskretne rozkłady prawdopodobieństwa
8.1
Rozkład zero-jedynkowy
8.2
Rozkład dwumianowy
8.3
Rozkład Poissona
8.4
Szablony
8.5
Pytania
8.6
Zadania
9
Ciągłe rozkłady prawdopodobieństwa
9.1
Funkcja gęstości
9.2
Rozkład jednostajny
9.3
Rozkład Gaussa
9.3.1
Standaryzowany rozkład normalny
9.3.2
Suma i różnica zmiennych o rozkładzie normalnym
9.3.3
Przybliżanie rozkładu dwumianowego rozkładem normalnym
9.4
Szablony
9.5
Zadania
Wnioskowanie statystyczne
10
Rozkłady z próby
10.1
Statystyki i parametry
10.2
Rozkład średniej z próby
10.3
Centralne twierdzenie graniczne
10.4
Estymatory punktowe – obciążone i nieobciążone
10.5
Wnioskowanie statystyczne
10.6
Linki
10.7
Zadania
11
Przedział ufności dla średniej
11.1
Przedział ufności i poziom ufności
11.2
Estymacja przedziałowa średniej
11.3
Dodatkowe uwagi
11.4
Linki
11.5
Szablony
11.6
Zadania
12
Przedział ufności dla proporcji
12.1
Wzory
12.2
Linki
12.3
Szablony
12.4
Zadania
13
Liczebność próby
13.1
Określanie liczebności próby przy szacowaniu średniej
13.2
Określanie liczebności próby przy szacowaniu proporcji
13.3
Zaokrąglanie
13.4
Szablony
13.5
Linki
13.6
Zadania
14
Testowanie hipotez dla jednej średniej
14.1
Hipotezy i test statystyczny
14.2
Statystyka testowa i obszar odrzucenia
14.3
Błędy
14.4
Czy akceptujemy hipotezę zerową?
14.5
Elementy testu statystycznego
14.6
Rodzaje hipotez alternatywnych
14.7
Zapis hipotez zerowych z nierównościami nieostrymi
14.8
Test jednej średniej oparty na statystyce
\(z\)
14.9
Test jednej średniej
\(t\)
14.10
Testy
\(t\)
i
\(z\)
w praktyce
14.11
Linki
14.12
Szablony
14.13
Zadania
15
Testowanie hipotez dla jednej proporcji
15.1
Test jednej proporcji oparty na statystyce
\(z\)
15.2
Wartość
p
(
p-value
)
15.3
Moc
15.4
Linki
15.5
Szablony
15.6
Zadania
16
Testowanie hipotez dla dwóch średnich
16.1
Testowanie dwóch średnich – rozkład z próby
16.2
Test dwóch średnich oparty na statystyce
\(z\)
16.3
Test dwóch średnich
\(t\)
16.4
Próby zestawione w pary
16.5
Wzory
16.5.1
Przedziały ufności dla różnicy parametrów – wzory
16.5.2
Testy hipotez dotyczące różnicy parametrów – wzory
16.5.3
Przedziały ufności dla różnicy średnich – próby zestawione w pary
16.5.4
Testy hipotez dotyczące różnicy średnich – próby zestawione w pary
16.6
Przedziały ufności a testy
16.7
Wielkość efektu
16.8
Linki
16.9
Szablony
16.10
Pytania
16.11
Zadania
17
Testowanie hipotez dla dwóch proporcji
17.1
Test dwóch proporcji dla dużych prób
17.2
Wzory
17.3
Wielkość efektu
17.4
Szablony
17.5
Zadania
18
Test chi-kwadrat
18.1
Test chi-kwadrat – zastosowania
18.2
Wzór
18.3
Hipotezy
18.4
Liczebności oczekiwane
18.5
Warunki zastosowania testu
18.6
Liczba stopni swobody
18.7
Obszar odrzucenia
18.8
Testy chi-kwadrat i testy proporcji
18.9
Wielkość efektu w teście niezależności
18.10
Linki
18.11
Szablony
18.12
Zadania
19
Analiza wariancji (ANOVA)
19.1
Jednoczynnikowa analiza wariancji – test
19.2
Statystyka testowa F – wzór
19.2.1
Zmienność między grupami
19.2.2
Zmienność wewnątrz grup
19.2.3
Statystyka F
19.3
Tabela wyników ANOVA
19.4
Wielkość efektu
19.5
Procedura
post hoc
19.6
Test Levene'a i test Browna-Forsythe'a
19.7
Dwuczynnikowa analiza wariancji
19.8
Linki
19.9
Szablony
19.10
Zadania
20
Testy nieparametryczne
20.1
Test Manna-Whitneya
20.2
Test Wilcoxona dla par obserwacji
20.3
Test Kruskala-Wallisa
20.4
Linki
20.5
Szablony
21
Regresja liniowa
21.1
Model regresji liniowej – założenia
21.2
Model regresji liniowej – estymacja
21.2.1
Przedziały ufności dla współczynników modelu
21.2.2
Przedziały ufności dla wartości oczekiwanej zmiennej objaśnianej
21.3
Przedziały predykcji
21.4
Model regresji liniowej – test t i test F
21.4.1
Testy istotności współczynników
21.4.2
Test F
21.5
Testy diagnostyczne modelu regresji
21.5.1
Testowanie liniowości
21.5.2
Testowanie homoskedastyczności
21.5.3
Testowanie normalności składnika losowego
21.6
Linki
21.7
Szablony
22
Inne testy statystyczne
22.1
Sprawdzanie zgodności z rozkładem Gaussa
22.1.1
Test Kołmogorowa-Smirnowa
22.1.2
Test Shapira-Wilka-Roystona
22.1.3
Test Jarque'a-Bery
22.1.4
Test Andersona-Darlinga
22.2
Test i przedział ufności dla współczynnika korelacji Pearsona
22.3
Lektura dodatkowa
22.4
Szablony
22.5
Zadania
23
Wykorzystanie metod numerycznych: symulacje, bootstrapping
23.1
Przydatne funkcje w R służące do symulacji:
23.2
Symulacje w szacowaniu prawdopobieństwa i proporcji
23.3
Bootstraping
23.4
Testy permutacyjne
23.5
Zadania
Dodatki
A
Wzory
A.1
Podstawowe wzory rachunku prawdopodobieństwa
Suma zdarzeń („A lub B”) — zasada dodawania
Iloczyn („A i B” — część wspólna, przekrój, przecięcie) — zasada mnożenia
Zdarzenie przeciwne
Prawdopodobieństwa warunkowe (A | B - „A pod warunkiem B”)
Twierdzenie o prawdopodobieństwie całkowitym
Twierdzenie Bayesa
A.2
Kombinatoryka
A.2.1
Wariacje
\(n\)
elementów branych po
\(r\)
(kolejność ma znaczenie)
A.2.2
Kombinacje
\(n\)
elementów branych po
\(r\)
(kolejność nie ma znaczenia)
A.3
Zmienne losowe
A.3.1
Wzory ogólne dla zmiennej dyskretnej
A.3.2
Wzory ogólne dla zmiennej ciągłej
A.3.3
Rozkład dwumianowy
A.3.4
Rozkład Poissona
A.3.5
Rozkład hipergeometryczny
A.3.6
Rozkład jednostajny (ciągły)
A.3.7
Rozkład wykładniczy
A.3.8
Rozkład Gaussa (normalny)
A.3.9
Standardowy rozkład normalny
A.3.10
Rozkład normalny średniej z próby (przybliżenie dla dużych
\(n\)
)
A.4
Przekształcenia zmiennych losowych
A.4.1
Dodawanie stałej do zmiennej
A.4.2
Mnożenie zmiennych przez stałą
A.4.3
Dodawanie zmiennych losowych
A.4.4
Dodawanie
\(n\)
niezależnych zmiennych o jednakowych rozkładach (i.i.d.)
A.5
Wnioskowanie statystyczne
A.5.1
Przedziały ufności
A.5.2
Określanie wielkości próby
A.5.3
Testy hipotez dotyczące parametru populacji
A.5.4
Testy hipotez dotyczące różnicy parametrów
A.5.5
Przedziały ufności dla różnicy parametrów
A.5.6
Testy hipotez dotyczące różnicy parametrów — próby zestawione w pary
A.5.7
Przedziały ufności dla różnicy parametrów — próby zestawione w pary
A.5.8
Test chi-kwadrat
A.5.9
ANOVA (jednoczynnikowa)
A.6
Regresja liniowa
A.6.1
Model
A.6.2
Estymatory punktowe
A.6.3
Przedziały ufności dla współczynników
A.6.4
Przedziały ufności dla wartości oczekiwanej zmiennej objaśnianej
A.6.5
Przedziały predykcji
B
Korzystanie z rozkładu normalnego
C
Szablony
C.1
Wzór Bayesa
C.2
Rozkłady
C.2.1
Dyskretna zmienna losowa
C.2.2
Sparametryzowane rozkłady dyskretne
C.2.3
Rozkłady ciągłe
C.3
Przedziały ufności
C.3.1
Liczebność próby
C.4
Testy dla średnich i proporcji
C.4.1
Testy dla 1 średniej i proporcji
C.4.2
Testy i przedziały ufności dla 2 średnich
C.4.3
Testy i przedziały ufności dla 2 proporcji
C.5
Testy chi-kwadrat
C.6
ANOVA i test Levene'a
C.7
Najważniejsze testy nieparametryczne
C.7.1
Test Manna-Whitneya
C.7.2
Test Wilcoxona dla par obserwacji
C.7.3
Test Kruskalla-Wallisa
C.8
Inne testy
C.8.1
Regresja
C.8.2
Sprawdzanie normalności rozkładu
C.8.3
Współczynnik korelacji
D
Tablice
D.1
Rozkład normalny standardowy
z
– tablica
D.2
Rozkład
t
-Studenta – tablica
D.3
Rozkład chi-kwadrat – tablica
D.4
Rozkład F – tablice
E
Zielona kartka
E.1
Zielona kartka - zebrane dane
F
Jak korzystać z R
F.1
R – typowe problemy
F.2
Jak to zrobić w R
G
Jak korzystać z arkuszy kalkulacyjnych
G.1
Arkusze kalkulacyjne – typowe problemy
G.1.1
Ustawienia regionalne
G.1.2
Formuły tablicowe
G.1.3
Różnice między Excelem a Google sheets
G.2
Jak to zrobić w arkuszach kalkulacyjnych
H
Schemat zajęć
H.1
Grafik zadań – 12 spotkań
Literatura
Published with bookdown
Statystyka 2. Skrypt
G
Jak korzystać z arkuszy kalkulacyjnych
G.1
Arkusze kalkulacyjne – typowe problemy
G.1.1
Ustawienia regionalne
G.1.2
Formuły tablicowe
G.1.3
Różnice między Excelem a Google sheets
G.2
Jak to zrobić w arkuszach kalkulacyjnych