Rozdział 13 Liczebność próby

13.1 Wzory dla szacowania średniej i proporcji

Kiedy planujemy badanie, możemy się zastanawiać, jak duża powinna być próba losowa, abyśmy uzyskali wystarczającą dokładność.

Na przykład wiemy, że szacowanie przedziału ufności dla średniej będziemy przeprowadzać na poziomie istotności \(1-\alpha=0{,}95\) i chcemy się mylić o co najwyżej ±\(e\) (wielkość \(e\) nazwijmy maksymalnym błędem szacunku). Innymi słowy, chcemy, żeby przedział ufności miał szerokość nie większą niż \(2e\).

Odwracając wzór na przedział ufności dla średniej (11.1), uzyskujemy wzór na liczebność próby w takiej sytuacji:

\[\begin{equation} n=\left(\frac{z_{\alpha/2}\cdot\sigma}{{e}}\right)^2 \tag{13.1} \end{equation}\]

Jak widać, wymagane jest założenie dotyczące wielkości odchylenia standardowego w populacji \(\sigma\). Przybliżenie takiej wartości można uzyskać korzystając z poprzednich badań w podobnych populacjach lub na podstawie intuicji. Na wszelki wypadek można wartość \(\sigma\) odpowiednio zawyżyć.

Analogicznie uzyskujemy wzór dla wielkości próby potrzebnej do oszacowania proporcji z zadaną dokładnością ±\(e\) (tutaj maksymalny błąd szacunku podajemy w punktach procentowych, a wstawiając do wzoru zamieniamy na odpowiedni ułamek). Przekształcając wzór (12.1) uzyskujemy:

\[\begin{equation} n=\frac{({z}_{\alpha/2})^2 \cdot p \cdot q}{{e}^2} \tag{13.2} \end{equation}\]

Tutaj również potrzebne jest założenie dotyczące proporcji \(p\) w populacji. Formuła (13.2) osiąga maksymalną wartość dla \(p=0{,}5\), stąd jeżeli nie mamy żadnych informacji pozwalających założyć \(p\), najbezpieczniej przyjąć \(p=0{,}5\).

13.2 Zaokrąglanie

Wzory (13.2) i (13.1) zwrócą najprawdopodobniej wartość ułamkową, natomiast wielkość próby \(n\) musi być oczywiście liczbą naturalną. W związku z tym powinniśmy wziąć najmniejszą liczbę naturalną większą niż wynik obliczeń. Innymi słowy zaokrąglamy w górę, czyli stosujemy funkcję sufit.

13.4 Zadania

Zadanie 13.1 Firma zajmująca się analizą wynagrodzeń chciałaby oszacować średnie zarobki menedżerów wysokiego szczebla z dokładnością plus/minus 2000 dolarów, z 95% ufnością. Na podstawie poprzednich analiz można założyć, że wariancja wynagrodzeń menedżerów wynosi około 40 000 000 USD2. Jaka jest minimalna potrzebna liczebność próbki?

Zadanie 13.2 Jaka musi być próba, żeby określić proporcję wadliwych komponentów powstających w pewnym procesie produkcyjnym, jeżeli chcemy poznać tę proporcję z dokładnością do ±0.05 z ufnością 90%? Nie mamy żadnej informacji/przypuszczeń odnośnie zakładanego udziału wadliwych komponentów w populacji.

Zadanie 13.3 Pewna firma wierzy, że jej udział w rynku to 14% (14% konsumentów używa produktu tej firmy). Wyznacz minimalną wielkość próbki, taką żeby oszacować rzeczywisty udział w rynku z dokładnością ± 5 punktów procentowych, z 90-procentową ufnością.

Zadanie 13.4 Znajdź minimalną wymaganą wielkość próby, aby oszacować przeciętną liczbę markowych koszul sprzedawanych dziennie. Dokładność powinna wynosić ±10 sztuk, poziom ufności 0,9. Dodatkową informacją jest to, że odchylenie standardowe liczby koszul sprzedawanych dziennie nie przekracza 50 sztuk.

Zadanie 13.5 W ramach eksperymentu losujemy punkty z Ziemi i na tej podstawie szacujemy udział lądów w jej powierzchni, wyznaczając 90-procentowe przedziały ufności. Wiemy, że prawdziwa wartość to 0,29 (29% powierzchni Ziemi stanowią lądy). Jakiej wielkości musi być próba, żeby oszacowanie miało dokładność ± 2 punkty procentowe.

Zadanie 13.6 (Agresti, Franklin, and Klingenberg 2016) Jak dużej próby potrzebujemy, żeby oszacować średni roczny dochód rdzennych Amerykanów w hrabstwie Onondaga w stanie New York z dokładnością do 1000 USD z ufnością 0,99? Nie mamy informacji o odchyleniu standardowym, ale zgadujemy, że niemal wszystkie wartości dochodu należą do przedziału (0 USD; 120 000 USD) i rozkład dochodów ma w przybliżeniu kształt krzywej dzwonowej.

Literatura

Agresti, Alan, Christine Franklin, and Bernhard Klingenberg. 2016. Statistics: The Art and Science of Learning from Data. 4th edition. Pearson.