Rozdział 3 Populacja i próba

We wnioskowaniu statystycznym na podstawie dostępnej próby losowej pobranej z pewnej populacji wnioskujemy o tej populacji. Populacja to niejako zbiór wszystkich jednostek, o których chcemy się czegoś dowiedzieć. Pod pojęciem populacji dość często rozumiemy również proces, który generuje dane (a dokładniej zbiór danych, które mógłby wygenerować proces, gdyby był wielokrotnie powtarzany) — w takiej sytuacji populacja może być nieskończona i siłą rzeczy nie jest w żaden sposób bezpośrednio dostępna. Próba to część populacji, w jakiś — zwykle losowy lub mogący być uznany za losowy — sposób z niej pobrana.

W zdobyciu potrzebnych intuicji mogą pomóc poniższe przykłady.

3.1 Populacja-próba: przykłady

  • Losujemy 1000 amerykańskich wyborców (próba) i pytamy o preferencje w nadchodzących wyborach. Na tej podstawie szacujemy poparcie dla kandydata Republikanów w populacji USA.

Dlaczego nie badamy całej populacji?

  • Losujemy 20 punktów na globusie (próba) i na ich podstawie szacujemy udział (statystyk powiedziałby „frakcję” lub, jakkolwiek by to nie brzmiało, „proporcję”) lądu w powierzchni Ziemi (populacja).

Proszę zobaczyć, że próba ma swoją liczebność, populacja zaś może być nieskończona.

  • Losujemy 20 butelek wina (próba) z nowego rocznika (populacja) i sprawdzamy, jak bardzo smakuje wybranym degustatorom.

Zauważmy, że gdyby całą populację przesłać do degustatorów, uzyskalibyśmy bardzo precyzyjną informację, która na niewiele by się nam już przydała.

Czasami zamiast o populacji wygodniej myśleć -- i mówić(?) -- o procesie, który generuje dane:

  • Rzucamy 100 razy kostką (próba). Szóstka wypadła 40 razy. Na tej podstawie próbujemy stwierdzić, czy kostka (proces generujący wyniki) jest uczciwa (nieobciążona, wyważona).

  • Bierzemy 6 skrzynek KLT wyprodukowanych przez wtryskarkę i przeprowadzamy testy wytrzymałościowe ustalając maksymalną siłę ścisku (tak jak w zakładzie produkcyjnym firmy Schoeller Allibert w Zabrzu). Co tu jest populacją?

Inne przykłady, w których pojawia się próba i populacja:

3.2 Losowanie ze zwracaniem i bez zwracania

Losując (na przykład obserwacje do próby) możemy mieć do czynienia z losowaniem ze zwracaniem (obserwacja wraca do puli) i bez zwracania (obserwacja nie wraca do puli).

Najłatwiej wytłumaczyć to na przykładach: Jeżeli rzucamy trzy razy typową kostką do gry, losujemy liczby od 1-6 ze zwracaniem. Jeżeli zaś mamy karty ponumerowane liczbami od 1 do 6 i wybieramy losowo trzy z nich (jednocześnie), to mamy do czynienia z losowaniem bez zwracania. W tym drugim przypadku nie otrzymamy dwa razy szóstki.

Uwaga! Nie zawsze można określić jednoznacznie, czy mamy do czynienia z losowaniem ze zwracaniem, czy też bez zwracania. Ponadto w dalszej części czasem domyślnie będziemy zakładać, że przy dużej populacji matematyka dla losowania ze zwracaniem i bez jest bardzo podobna, i nie będziemy się tym już przejmować...

3.3 Pytania

Pytanie 3.1 Który z przykładów opisanych w części 3.1 to losowanie ze zwracaniem, a który bez zwracania?