Rozdział 3 Populacja i próba
We wnioskowaniu statystycznym na podstawie dostępnej próby losowej pobranej z pewnej populacji wnioskujemy o tej populacji. Populacja to niejako zbiór wszystkich jednostek, o których chcemy się czegoś dowiedzieć. Pod pojęciem populacji dość często rozumiemy również proces, który generuje dane (a dokładniej zbiór danych, które mógłby wygenerować proces, gdyby był wielokrotnie powtarzany) – w takiej sytuacji populacja może być nieskończona i siłą rzeczy nie jest w żaden sposób bezpośrednio dostępna. Próba to część populacji, w jakiś – zwykle losowy lub mogący być uznany za losowy – sposób z niej pobrana.
W zdobyciu potrzebnych intuicji mogą pomóc poniższe przykłady.
3.1 Populacja-próba: przykłady
- Losujemy 1000 amerykańskich wyborców (próba) i pytamy o preferencje w nadchodzących wyborach. Na tej podstawie szacujemy poparcie dla kandydata Republikanów w populacji USA.
Dlaczego nie badamy całej populacji?
- Losujemy 20 punktów na globusie (próba) i na ich podstawie szacujemy udział (statystyk powiedziałby „frakcję” lub, jakkolwiek by to nie brzmiało, „proporcję”) lądu w powierzchni Ziemi (populacja).
Proszę zobaczyć, że próba ma swoją liczebność, populacja zaś może być nieskończona.
- Losujemy 20 butelek wina (próba) z nowego rocznika (populacja) i sprawdzamy, jak bardzo smakuje wybranym degustatorom.
Zauważmy, że gdyby całą populację przesłać do degustatorów, uzyskalibyśmy bardzo precyzyjną informację, która na niewiele by się nam już przydała.
Czasami zamiast o populacji wygodniej myśleć – i mówić(?) – o procesie, który generuje dane:
Rzucamy 100 razy kostką (próba). Szóstka wypadła 40 razy. Na tej podstawie próbujemy stwierdzić, czy kostka (proces generujący wyniki) jest uczciwa (nieobciążona, wyważona).
Bierzemy 6 skrzynek KLT wyprodukowanych przez wtryskarkę i przeprowadzamy testy wytrzymałościowe, ustalając maksymalną siłę ścisku (tak jak w zakładzie produkcyjnym firmy Schoeller Allibert w Zabrzu). Co tu jest populacją?
Inne przykłady, w których pojawia się próba i populacja:
Przykłady znalezione przez studentów (pytanie 3.2)
3.2 Losowanie ze zwracaniem i bez zwracania
Gdy losujemy obiekty z jakiejś zbiorowości (na przykład losujemy z populacji obserwacje do próby), możemy mieć do czynienia z losowaniem ze zwracaniem (wtedy gdy obiekt po wylosowaniu wraca do puli i może być wylosowany ponownie) i losowaniem bez zwracania (gdy wylosowane obiekty nie wracają do puli).
Najłatwiej wytłumaczyć to na przykładach: Jeżeli rzucamy trzy razy typową kostką do gry, losujemy liczby całkowite od 1 do 6 ze zwracaniem. Jeżeli zaś mamy karty ponumerowane liczbami od 1 do 6 i wybieramy losowo trzy z nich (jednocześnie), to mamy do czynienia z losowaniem bez zwracania. W tym drugim przypadku nie otrzymamy dwa razy szóstki.
Uwaga! Nie zawsze można określić jednoznacznie, czy mamy do czynienia z losowaniem ze zwracaniem, czy też bez zwracania. Ponadto w dalszej części czasem domyślnie będziemy zakładać, że przy dużej populacji (dużej w stosunku do pobieranej próby) wzory matematyczne dla losowania ze zwracaniem i bez zwracania są bardzo podobne, i nie będziemy się tym już przejmować...
3.3 Pytania
Pytanie 3.1 Który z przykładów opisanych w części 3.1 to losowanie ze zwracaniem, a który bez zwracania?
Pytanie 3.2 Znajdź w mediach lub wymyśl inne przykłady, kiedy wnioskowanie o populacji przeprowadzone jest na podstawie próby.
Pytanie 3.3 Na ulicy pewnego miasta zatrzymywano losowe osoby i zadawano pytanie: „Czy jest Pani/Pan szczęśliwa/szczęśliwy”. Co można uznać za populację w tym przykładzie?