Rozdział 14 Testowanie hipotez dla jednej średniej

Omówienie testów statystycznych wymaga wprowadzenia określonych terminów i przedstawienia szeregu zagadnień. Dlatego w tym i kolejnych rozdziałach, obok wprowadzenia konkretnych testów statystycznych, będą przedstawione poszczególne terminy i omówione konkretne zagadnienia: hipotezy (14.1), statystyka testowa i obszar odrzucenia (14.2), błędy pierwszego i drugiego rodzaju (14.3), sformułowania dotyczące nieodrzucenia hipotezy zerowej (14.4), struktura testu statystycznego (14.5), rodzaje hipotez alternatywnych (14.6), zapis hipotez zerowych z nierównościami nieostrymi (14.7), wartość p, czyli p-value (15.2), moc testu (15.3), relacja pomiędzy przedziałami ufności a testami (16.6), wielkość efektu (16.7).

14.1 Hipotezy i test statystyczny

Hipoteza statystyczna to hipoteza dotycząca wartości liczbowej parametru populacji/procesu.

Niekiedy hipoteza może dotyczyć również rozkładu cech w populacji/procesie.

Hipoteza zerowa (\(H_0\)) to hipoteza, którą będziemy przyjmować, dopóki na podstawie danych nie będziemy mogli z wystarczającą pewnością stwierdzić, że jest inaczej.

Hipoteza zerowa może odzwierciedlać

„status quo”,
pewną konkretną wartość parametru populacji, którą chcemy sprawdzić,
założenie o braku efektu (np. „korelacja wynosi zero”).

Hipoteza alternatywna (\(H_A\)) to hipoteza, którą przyjmiemy tylko wtedy, jeżeli dane dostarczą wystarczających przesłanek, że może być prawdziwa.

Hipoteza alternatywna może odzwierciedlać na przykład sytuację, w której stwierdzamy, że w danych występuje jakiś efekt lub jakaś zależność (np. „korelacja jest różna od zera”, „korelacja jest większa od zera”).

Wynikiem testu statystycznego jest:

odrzucenie hipotezy zerowej na rzecz hipotezy alternatywnej,
lub stwierdzenie braku podstaw do odrzucenia hipotezy zerowej.

14.2 Statystyka testowa i obszar odrzucenia

Statystyka testowa to statystyka obliczona na podstawie próbki, która umożliwia podjęcie decyzji o odrzuceniu lub nieodrzuceniu hipotezy zerowej. Statystyka testowa często bierze swój symbol od swojego rozkładu, np. \(z\) (rozkład normalny standardowy), \(t\) (rozkład t-Studenta) i \(\chi^2\) (rozkład chi-kwadrat). Statystyka testowa bywa nazywana sprawdzianem testu.

Obszar odrzucenia w teście statystycznym to zbiór wartości statystyki testowej, które sprawią, że badacz odrzuci hipotezę zerową na rzecz hipotezy alternatywnej. Obszar odrzucenia bywa nazywany też obszarem krytycznym lub zbiorem krytycznym.

14.3 Błędy

Wynik testu statystycznego nie zawsze jest zgodny z rzeczywistością. Podejmując decyzję o odrzuceniu lub pozostawieniu hipotezy zerowej na podstawie próbki, możemy popełnić (zwykle nie dowiadując się o tym) dwa rodzaje błędów:

Błąd pierwszego rodzaju polega na odrzuceniu hipotezy zerowej, mimo że w rzeczywistości jest ona prawdziwa⁸.

Błąd drugiego rodzaju występuje, gdy nie odrzucimy hipotezy zerowej, choć w rzeczywistości jest ona fałszywa.

Bardzo często prawdopodobieństwo popełnienia błędu I rodzaju oznacza się grecką literą alfa (\(\alpha\)), a prawdopodobieństwo popełnienia błędu II rodzaju literą beta (\(\beta\)).

14.4 Czy akceptujemy hipotezę zerową?

Uwaga! W statystyce zwykle używamy dość ostrożnego języka, kiedy mówimy o hipotezach. Proszę pamiętać, żeby nie mówić o „akceptowaniu \(H_0\)” na podstawie wyników testu. Ze względu na fakt, że zwykle nie mamy wystarczających informacji, żeby stwierdzić, jakie jest prawdopodobieństwo błędu II rodzaju (\(\beta\)), mówimy ostrożnie, że w przypadku testu, w którym statystyka testowa nie trafiła do obszaru odrzucenia, stwierdzamy brak podstaw (albo: przesłanek) do odrzucenia hipotezy zerowej.

14.5 Elementy testu statystycznego

Hipoteza zerowa (\(H_0\)) – stwierdzenie wskazujące na konkretną wartość parametru określającego jedną lub większą liczbę populacji. Hipoteza zerowa zwykle opisuje „status quo”, czyli pokazuje, co będziemy zakładać, dopóki nie wykażemy na podstawie danych, że jest inaczej. W hipotezie zerowej znajdzie się zawsze znak równości, czyli \[H_0: \text{parametr}=\text{wartość}\].
Hipoteza alternatywna (\(H_A\)) – hipoteza, którą przyjmiemy, tylko wtedy, jeżeli uzyskane dane dostarczą wystarczających przesłanek do odrzucenia hipotezy zerowej. Hipoteza alternatywna zawiera nierówność, czyli może wyglądać tak: \(H_A: \text{parametr}\ne\text{wartość}\), tak: \(H_A: \text{parametr}>\text{wartość}\) lub tak: \(H_A: \text{parametr}<\text{wartość}\).
Poziom istotności (\(\alpha\)) – dopuszczalne prawdopodobieństwo odrzucenia hipotezy zerowej w sytuacji, gdy jest ona prawdziwa (czyli prawdopodobieństwo warunkowe popełnienia błędu I rodzaju). Bardzo często przyjmuje się standardowo \(\alpha=0{,}05\).

\[ \alpha = P (\text{odrzucimy }H_0\:|\:H_0 \text{ jest prawdziwa}) \]

Statystyka testowa – statystyka obliczana na podstawie próbki. Pozwala ona zdecydować, czy są wystarczające przesłanki do odrzucenia hipotezy zerowej.
Obszar odrzucenia – inaczej nazywany zbiorem (obszarem) krytycznym to zbiór wartości statystyki testowej, które umożliwiają odrzuczenie hipotezy zerowej na rzecz hipotezy alternatywnej. Zbiór krytyczny wyznacza się na podstawie rozkładu statystyki testowej, przyjętego poziomu istotności \(\alpha\) i formy hipotezy alternatywnej. Granicę obszaru odrzucenia często nazywa się wartością krytyczną.
Założenia i warunki – testy zakładają najczęściej, że pobrane próby pochodzą z badanej populacji i zostały pobrane w sposób zupełnie losowy. Niektóre testy mają dodatkowe założenia, dotyczące na przykład rozkładu badanej cechy w populacji. W przypadku wielu testów należy również pamiętać o warunku odpowiedniej liczebności próbki.
Przeprowadzenie badania – pobranie próbki i uzyskanie odpowiednich statystyk z próbki.
Wniosek – w zależności od otrzymanego wyniku statystyki testowej test statystyczny kończy się:

odrzuceniem hipotezy zerowej na rzecz hipotezy alternatywnej – jeżeli statystyka testowa znajdzie się w obszarze odrzucenia lub
stwierdzeniem braku przesłanek do odrzucenia hipotezy zerowej.

Jeżeli odrzucamy hipotezę zerową, mówimy lub piszemy „Na poziomie istotności równym \(\alpha\) (tutaj właściwa liczba) odrzucamy hipotezę zerową na rzecz alternatywnej”.

Gdy nie odrzucamy hipotezy zerowej, mówimy, że „próbka nie dostarcza wystarczających przesłanek do odrzucenia hipotezy zerowej na poziomie istotności \(\alpha\)”.

14.6 Rodzaje hipotez alternatywnych

W zależności od kontekstu hipoteza alternatywna w wielu testach (np. w testach dla jednej i dwóch średnich, w testach dla jednej lub dwóch proporcji) może przyjąć trzy różne formy:

dwustronną (\(H_A: \text{parametr } \ne \text{wartość}\)),
lewostronną (\(H_A: \text{parametr } < \text{wartość}\))
i prawostronną (\(H_A: \text{parametr } > \text{wartość}\))

Forma hipotezy zależy od tego, co i dlaczego badamy. Najlepiej omówić to na przykładach konkretnych rozwiązywanych zadań. Ważne jest, że decyzji o formie hipotezy alternatywnej nie można podejmować na podstawie wyników z próby. Najlepiej, żeby hipotezy były ustalone przed pozyskaniem danych, albo tak, jak gdybyśmy jeszcze konkretnych danych jeszcze nie widzieli.

Testy, w których hipoteza alternatywna jest lewo- lub prawostronna, nazywamy jednostronnymi. Hipoteza dwustronna może też być nazwana obustronną.

Od tego, czy hipoteza jest obustronna czy prawo- lub lewostronna, zależy obszar odrzucenia. Jak zobaczymy, jeżeli hipoteza alternatywna jest prawo-/lewostronna, obszar krytyczny jest również prawo-/lewostronny. Jeżeli hipoteza alternatywna jest dwustronna, obszar krytyczny jest również obustronny.

W przypadku niektórych testów, np. testu chi-kwadrat lub analizy wariancji (ANOVA) nie używa się w stosunku do hipotezy alternatywnej określeń obustronna czy dwustronna, dlatego że – jak można się przekonać, zapoznając się z tymi testami – mają one raczej charakter „wielostronny”.

14.7 Zapis hipotez zerowych z nierównościami nieostrymi

Uwaga! W przypadku testów jednostronnych hipotezę zerową niekiedy zapisuje się z wykorzystaniem nierówności nieostrej, to znaczy, jeżeli hipoteza alternatywna jest następująca

\[H_A: \text{parametr } > \text{wartość},\]

to hipotezę zerową możemy zapisać

\[H_0: \text{parametr } \leqslant \text{wartość}\]

i odwrotnie, jeżeli \(H_A: \text{parametr } < \text{wartość}\), to \(H_0: \text{parametr } \geqslant \text{wartość}\). Taki zapis, z nierównością nieostrą, ma swoją logikę, nazwijmy go „zapisem decyzyjnym”.

Sposób zapisu ze znakiem równości: \[H_0: \text{parametr } = \text{wartość}\] nazwijmy „zapisem punktowym”.

W tym skrypcie stosujemy zapis punktowy. Hipotezę zerową ze znakiem równości (punktową) wykorzystujemy np. definiując poziom istotności, wyznaczając i definiując p-value oraz obszar odrzucenia⁹.

Hipoteza zerowa zapisana na sposób „decyzyjny” zwraca uwagę, że jeżeli nie przyjmiemy jednostronnej hipotezy alternatywnej, pozostajemy niejako z pozostałą częścią osi liczbowej, którą możemy opisać za pomocą nierówności nieostrej.

14.8 Test jednej średniej oparty na statystyce \(z\)

W teście jednej średniej hipoteza zerowa brzmi, że średnia w populacji, z której pobieramy próbę wynosi \(\mu_0\) (czyli przyjmuje pewną określoną w hipotezie wartość):

\[ H_0: \mu = \mu_0 \]

Hipotezę alternatywną musimy wybrać spośród trzech opcji.

W teście dwustronnym:

\[H_A: \mu \ne \mu_0\]

W teście lewostronnym:

\[H_A: \mu < \mu_0 \]

W teście prawostronnym:

\[H_A: \mu > \mu_0 \]

Statystyka testowa \(z\):

\[z = \frac{\bar{x}-\mu_0}{\sigma / \sqrt{n}}\:\:\text{ lub }\:\: z\approx\frac{\bar{x}-\mu_0}{s / \sqrt{n}}, \]

gdzie \(\bar{x}\) to średnia z próby, \(\mu_0\) to zakładana w hipotezie zerowej wartość średniej w populacji (\(\mu\)), \(\sigma\) to odchylenie standardowe w populacji (w tych przypadkach, kiedy jest znane), \(s\) to odchylenie standardowe z próbki, a \(n\) to liczebność próbki.

Obszar odrzucenia zależy od hipotezy alternatywnej. Jeżeli test jest obustronny, obszar odrzucenia to \(|z|>z_{\alpha/2}\). Jeżeli test jest lewostronny, obszar odrzucenia to \(z<-z_{\alpha}\), zaś dla testu prawostronnego obszar odrzucenia to \(z>z_{\alpha}\). Wartości krytyczne \(z_{\alpha}\) i \(z_{\alpha/2}\) dobierane są tak, żeby \(\mathbb{P}(z>z_{\alpha})=\alpha\) i \(\mathbb{P}(|z|>z_{\alpha/2})=\alpha\).
Należy pamiętać, że założeniem testu jest to, że pobrana próbka pochodzi z badanej populacji (procesu). Warunkiem stosowania testu jest również to, żeby próba była wystarczająco duża (w praktyce \(n\geqslant 30\)).

Uwaga! Test można stosować również dla małych prób, jeżeli znamy wartość \(\sigma\) (co zdarza się rzadko, ale czasem się zdarza) i dodatkowo rozkład cechy w populacji jest normalny (zbliżony do normalnego).

14.9 Test jednej średniej \(t\)

W tym teście hipotezy zerowa i alternatywna mogą być sformułowane tak samo, jak w teście \(z\).
Statystyka testowa \(t\):

\[t = \frac{\bar{x}-\mu_0}{s / \sqrt{n}}, \]

gdzie \(\bar{x}\) to średnia z próby, \(\mu_0\) to zakładana w hipotezie zerowej wartość średniej w populacji (\(\mu\)), \(s\) to odchylenie standardowe z próby, a \(n\) to liczebność próby.

Obszar odrzucenia zależy od hipotezy alternatywnej. Jeżeli test jest obustronny, obszar odrzucenia to \(|t|>t_{\alpha/2}\). Jeżeli test jest lewostronny, obszar odrzucenia to \(t<-t_{\alpha}\), zaś dla testu prawostronnego obszar odrzucenia to \(t>t_{\alpha}\). Wartości krytyczne \(t_{\alpha}\) i \(t_{\alpha/2}\) dobierane są tak, żeby \(\mathbb{P}(t>t_{\alpha})=\alpha\) i \(\mathbb{P}(|t|>t_{\alpha/2})=\alpha\). Aby wyznaczyć wartości krytyczne \(t_\alpha\) lub \(t_\alpha/2\) należy znać liczbę stopni swobody. W tym teście liczba stopni swobody (\(\nu\), d. f., degrees of freedom) to \(n-1\).
Test \(t\) stosujemy, jeżeli próbka jest losowa i możemy założyć, że rozkład cechy w populacji jest normalny (zbliżony do normalny).

14.10 Testy \(t\) i \(z\) w praktyce

W ramach kursu statystyki prowadzonego na podstawie tego skryptu przy rozwiązywaniu zadań stosujemy test \(t\) dla małych prób, jeżeli założenie o normalności rozkładu cechy może być przyjęte, zaś test \(z\) stosujemy dla dużych prób.

W praktyce korzystania z narzędzi statystycznych dla dużych prób również stosuje się test \(t\), ponieważ dla dużej liczby stopni swobody (dla dużej liczebności \(n\)) test \(t\) zwraca wyniki podobne do zwracanych przez test \(z\). W związku z tym w niektórych pakietach statystycznych test \(z\) nie jest standardowo dostępny.

14.11 Linki

Dlaczego zwykle przyjmuje się poziom istotności \(\alpha = 0{,}05\):

https://www.linkedin.com/feed/update/urn:li:activity:7143521946205429761/

https://www.openintro.org/book/stat/why05/

14.12 Szablony

Arkusze kalkulacyjne

Testowanie 1 populacji (średnia i proporcja) — arkusz Google

Testowanie 1 populacji (średnia i proporcja) — szablon w Excelu

Kod w R

# Test dla jednej średniej
# Wielkość próby:
n <- 38
# Średnia w próbie:
xbar <- 184.21
# Odchylenie standardowe w populacji lub w próbie:
s <- 6.1034
# Poziom istotności:
alpha <- 0.05

# Wartość null w hipotezie zerowej:
mu0 <- 179
# Hipoteza alternatywna (znak): "<"; ">"; "<>"; "≠"
alt <- ">"

# Obliczenia:
# stopnie swobody:
df <- n-1

# Wartość krytyczna (test t):
crit_t <- if (alt == "<") {qt(alpha, df)} else if (alt == ">") {qt(1-alpha, df)} else {qt(1-alpha/2, df)}

# Statystyka testowa t/z:
test_tz <- (xbar-mu0)/(s/sqrt(n))

# Wartość p (test t):
p.value = if(alt == ">"){1-pt(test_tz, df)} else if (alt == ">") {pt(test_tz, df)} else {2*(1-pt(abs(test_tz),df))}

# Wartość krytyczna (test z):
crit_z <- if (alt == "<") {qnorm(alpha)} else if (alt == ">") {qnorm(1-alpha)} else {qnorm(1-alpha/2)}

# Wartość p (test z):
p.value.z = if(alt == ">"){1-pnorm(test_tz)} else if (alt == ">") {pnorm(test_tz)} else {2*(1-pnorm(abs(test_tz)))}

print(c('Średnia' = xbar, 
        'Odchylenie st.' = s,
        'Liczebność' = n,
        'Hipoteza zerowa' = paste0('mu = ', mu0),
        'Hipoteza alt.' = paste0('mu ', alt, ' ', mu0),
        'Statystyka testowa t/z' = test_tz,
        'Wartość krytyczna t' = crit_t,
        'Wartość p (test t)' = p.value,
        'Wartość krytyczna z' = crit_z,
        'Wartość p (test z)' = p.value.z
))

##                Średnia         Odchylenie st.             Liczebność        Hipoteza zerowa 
##               "184.21"               "6.1034"                   "38"             "mu = 179" 
##          Hipoteza alt. Statystyka testowa t/z    Wartość krytyczna t     Wartość p (test t) 
##             "mu > 179"     "5.26208293008297"     "1.68709361959626"  "3.1304551380007e-06" 
##    Wartość krytyczna z     Wartość p (test z) 
##     "1.64485362695147" "7.12162456784071e-08"

# Na podstawie danych (test t):

# Wektor z danymi
data <- c(176.5267, 195.5237, 184.9741, 179.5349, 188.2120, 190.7425, 178.7593, 196.2744, 186.6965, 187.8559, 183.1323, 176.2569, 191.4752, 186.5975, 180.2120, 184.3434, 178.1691, 184.8852, 187.7973, 178.5013, 172.7343, 176.8545, 184.2068, 181.2395, 186.1983, 173.6317, 181.9529, 185.9135, 188.6081, 183.0285, 183.3375, 188.5512, 184.6348, 186.9657, 183.9622, 200.9014, 183.5353, 177.2538)

# Zapisanie wyników testu do obiektu
# Należy wybrać wartość parametru alternative: "two-sided" (domyślnie), "less" lub "greater" oraz wartość zerową (ang. null value), która domyślnie wynosi 0
test_result <- t.test(data, alternative = "greater", mu = 179)

# Wyświetlanie wyników testu. Można wyświetlać tylko poszczególne składowe wyniku (np. test_result$statistic)
print(test_result)

## 
##  One Sample t-test
## 
## data:  data
## t = 5.2621, df = 37, p-value = 3.13e-06
## alternative hypothesis: true mean is greater than 179
## 95 percent confidence interval:
##  182.5396      Inf
## sample estimates:
## mean of x 
##    184.21

Kod w Pythonie

# Test dla jednej średniej
from scipy.stats import t, norm
from math import sqrt

# Wielkość próby:
n = 38

# Średnia w próbie:
xbar = 184.21

# Odchylenie standardowe w populacji lub w próbie:
s = 6.1034

# Poziom istotności:
alpha = 0.05

# Wartość null w hipotezie zerowej
mu0 = 179

# Hipoteza alternatywna (znak): "<"; ">"; "<>"; "≠"
alt = ">"

# Obliczenia:
# stopnie swobody:
df = n - 1

# Wartość krytyczna (test t):
if alt == "<":
    crit_t = t.ppf(alpha, df)
elif alt == ">":
    crit_t = t.ppf(1 - alpha, df)
else:
    crit_t = t.ppf(1 - alpha / 2, df)

# Statystyka testowa t/z:
test_tz = (xbar - mu0) / (s / sqrt(n))

# Wartość p (test t):
if alt == ">":
    p_value_t = 1 - t.cdf(test_tz, df)
elif alt == "<":
    p_value_t = t.cdf(test_tz, df)
else:
    p_value_t = 2 * (1 - t.cdf(abs(test_tz), df))

# Wartość krytyczna (test z):
if alt == "<":
    crit_z = norm.ppf(alpha)
elif alt == ">":
    crit_z = norm.ppf(1 - alpha)
else:
    crit_z = norm.ppf(1 - alpha / 2)

# Wartość p (test z):
if alt == ">":
    p_value_z = 1 - norm.cdf(test_tz)
elif alt == "<":
    p_value_z = norm.cdf(test_tz)
else:
    p_value_z = 2 * (1 - norm.cdf(abs(test_tz)))

results = {
    'Średnia': xbar,
    'Odchylenie st.': s,
    'Liczebność': n,
    'Hipoteza zerowa': f'mu = {mu0}',
    'Hipoteza alt.': f'mu {alt} {mu0}',
    'Statystyka testowa t/z': test_tz,
    'Wartość krytyczna t': crit_t,
    'Wartość p (test t)': p_value_t,
    'Wartość krytyczna z': crit_z,
    'Wartość p (test z)': p_value_z
}

for key, value in results.items():
    print(f"{key}: {value}")

## Średnia: 184.21
## Odchylenie st.: 6.1034
## Liczebność: 38
## Hipoteza zerowa: mu = 179
## Hipoteza alt.: mu > 179
## Statystyka testowa t/z: 5.262082930082973
## Wartość krytyczna t: 1.6870936167109876
## Wartość p (test t): 3.1304551380006984e-06
## Wartość krytyczna z: 1.6448536269514722
## Wartość p (test z): 7.121624567840712e-08

# Na podstawie danych (test t):

import scipy.stats as stats

data = [176.5267, 195.5237, 184.9741, 179.5349, 188.2120, 190.7425, 178.7593, 196.2744, 186.6965, 187.8559, 183.1323, 176.2569, 191.4752, 186.5975, 180.2120, 184.3434, 178.1691, 184.8852, 187.7973, 178.5013, 172.7343, 176.8545, 184.2068, 181.2395, 186.1983, 173.6317, 181.9529, 185.9135, 188.6081, 183.0285, 183.3375, 188.5512, 184.6348, 186.9657, 183.9622, 200.9014, 183.5353, 177.2538]

test_result = stats.ttest_1samp(data, popmean=179, alternative='greater')

print(test_result)

## TtestResult(statistic=5.262096550537936, pvalue=3.1303226590428976e-06, df=37)

14.13 Zadania

Zadanie 14.1 Pewien test średniej opiera się na statystyce \(z\). Hipoteza zerowa to \(H_0: \mu = 4000\). Podaj obszar krytyczny (zbiór wartości statystyki testowej \(z\) powodujący odrzucenie hipotezy zerowej), jeżeli:

Poziom istotności wynosi \(\alpha =0{,}05\), a hipoteza alternatywna to \(H_A: \mu < 4000\)
Poziom istotności wynosi \(\alpha =0{,}10\), a hipoteza alternatywna to \(H_A: \mu < 4000\)
Poziom istotności wynosi \(\alpha =0{,}10\), a hipoteza alternatywna to \(H_A: \mu > 4000\)
Poziom istotności wynosi \(\alpha =0{,}05\), a hipoteza alternatywna to \(H_A: \mu \ne 4000\)

Zadanie 14.2 Obszar krytyczny zdefiniowany jest podanym wzorem. Przedstaw obszar krytyczny na szkicu funkcji gęstości rozkładu normalnego standardowego. Określ, czy obszar krytyczny jest lewostronny, prawostronny czy dwustronny. Dla każdego z punktów określ również prawdopodobieństwo popełnienia błędu pierwszego rodzaju.

\(Z \in (-\infty; -1{,}645)\)
\(Z < -1{,}96\)
\(Z \in (2{,}326; \infty)\)
\(Z > 1{,}282\)
\(Z < -1{,}645 \text{ lub } Z > 1{,}645\)
\(|Z|>2{,}576\)

Zadanie 14.3 Z pewnej populacji pracowników, w której odchylenie standardowe wynagrodzeń wynosi 4500 PLN pobrano próbę 64 osób i otrzymano średnią płacę w wysokości 21 000 PLN.

Przeprowadź test hipotezy zerowej, która mówi, że μ=20 tys. PLN względem hipotezy alternatywnej, że μ>20 000 PLN. Zastosuj poziom istotności α=0,05. Zinterpretuj wyniki testu.
Przetestuj hipotezę zerową, że μ=20 tys. PLN względem hipotezy alternatywnej, że μ≠20 tys. PLN. Użyj poziomu istotności α=0,05. Zinterpretuj wyniki testu.
Porównaj wyniki otrzymane w dwóch powyższych testach. Wyjaśnij, dlaczego się różnią.

Zadanie 14.4 Przetestowano pewien termometr do szybkiego pomiaru temperatury, wykonując 50 pomiarów, i porównano wyniki z dokładnym termometrem. Zapisano różnice pomiędzy wskazaniami obu urządzeń (z odpowiednim znakiem: plus, jeśli szybki termometr wskazał wyższą temperaturę, lub minus, jeśli niższą). Średnia różnica wyniosła 0,12 K, a odchylenie standardowe 0,08 K. Czy te dane pozwalają stwierdzić, że w populacji średnie wskazania obu termometrów różnią się od siebie?

Zadanie 14.5 (Aczel and Sounderpandian 2018) Maszyna napełnia 2-litrowe butelki colą. Rzecznik praw konsumentów chce przetestować hipotezę zerową, że przeciętna objętość płynu nalewanego do każdej z butelek to przynajmniej 2000 cm³. Wylosowano 40 butelek napełnionych przez maszynę i dokładnie zmierzono objętość płynu. Uzyskano średnią z próby 1999,6 cm³. Na podstawie przeszłych doświadczeń należy założyć odchylenie standardowe w populacji na poziomie 1,3 cm³.

Przetestuj hipotezę zerową na poziomie istotności 5%.
Przyjmij, że populacja ma rozkład normalny z tym samym odchyleniem σ równym 1,3 cm³. Przyjmij, że próba miała tylko 20 obserwacji i średnia wyniosła tyle samo (1999,6 cm³). Przeprowadź jeszcze raz test z α równym 0,05.
Jeżeli między wynikami powyższych dwóch testów jest różnica, wyjaśnij ją.

Zadanie 14.6 Producent samochodów chce sprawdzić, czy nowy silnik ma lepsze parametry spalania paliwa niż dotychczasowy. Dotychczasowe silniki w warunkach kontrolowanych uzyskiwały spalanie na poziomie 6,12 litra na 100 km. Przeprowadzono 120 prób nowego silnika w analogicznych warunkach i uzyskano średnią 5,71 i odchylenie standardowe 0,56 litra na 100 km. Zbuduj przedział ufności dla średniego spalania nowego silnika. Przetestuj odpowiednią hipotezę. Przyjmij \(\alpha\)=0,05.

Zadanie 14.7 Przeciętny dzienny utarg w pewnym sklepie osiedlowym wynosi 7218 złotych. Ostatnio syn właściciela postanowił wykorzystać wiedzę marketingową zdobytą na studiach i zmienił układ towarów na półkach oraz postawił przed sklepem duży billboard zachęcający do zakupów. Po 18 dniach funkcjonowania sklepu na nowych zasadach, okazało się, że dzienna sprzedaż w tym okresie wyniosła średnio 8713 złotych z odchyleniem standardowym równym 1023 złote. Czy można stwierdzić, że uzyskany wzrost sprzedaży był statystycznie istotny? Jakie założenia należy poczynić, aby przeprowadzić odpowiedni test?

Zadanie 14.8 Zweryfikuj hipotezę mówiącą, że średni wzrost podawany przez studentów statystyki płci męskiej jest wyższy niż średnia w populacji osób w ich wieku. Według danych znalezionych w Internecie należy oczekiwać, że średni wzrost 20-letnich mężczyzn to 180, a odchylenie standardowe wynosi 5 cm. W próbie losowej studentów statystyki płci męskiej (n=25) otrzymano średnią 185 cm i odchylenie standardowe wynoszące 6 cm. Przyjmij poziom istotności \(\alpha\) = 0,05.

Zadanie 14.9 (Aczel and Sounderpandian 2018) Firma Ognivex zmieniła proces produkcji baterii litowo-jonowych. Baterie wyprodukowane w starym procesie mają średnią żywotność 102,5h. Aby ustalić, czy nowy proces wpływa na przeciętną żywotność baterii, producent zebrał próbę losową 25 baterii wyprodukowanych w nowym procesie i używał ich aż do wyczerpania. Średnie życie baterii w próbie wyniosło 107 godzin, a odchylenie standardowe 10 godzin. Czy te wyniki są istotne na poziomie α wynoszącym 0,05? Czy są istotne, jeżeli przyjmiemy poziom istotności α = 0,01?

Literatura

Aczel, A. D., and J. Sounderpandian. 2018. Statystyka w Zarządzaniu. PWN. https://ksiegarnia.pwn.pl/Statystyka-w-zarzadzaniu,731934758,p.html.

Innymi słowy, błąd I rodzaju polega na przyjęciu fałszywej hipotezy alternatywnej↩︎
Na przykład, jeżeli mówimy, że poziom istotności to dopuszczalne prawdopodobieństwo odrzucenia hipotezy zerowej w sytuacji, gdy jest ona prawdziwa, mamy na myśli punktową hipotezę zerową.↩︎