Wyraz statystyka ma wiele znaczeĹ: statystyki zgonĂłw albo statystyki alkoholizmu czyli dane dotyczÄ ce zgonĂłw lub alkoholizmu. Statystyka to teĹź dziedzina wiedzy, upraszczajÄ c zbiĂłr metod, ktĂłre sĹuĹźÄ do tworzenia statystyk w pierwszym znaczeniu tego sĹowa. Wreszcie statystyka to pojedyncza metoda ze zbioru metod opracowanych w dziedzinie, np. Ĺrednia to statystyka. TrochÄ to niefortunne, ale Ĺwiat nie jest doskonaĹy jak wiemyâŚ
Statystyka (obiegowo): dziaĹ matematyki, a w zwiÄ zku z tym wiedza absolutnie pewna i obiektywna. Nieprawda choÄby z tego powodu, Ĺźe nie jest dziaĹem matematyki. Korzysta z metod matematycznych jak wiele innych dziedzin.
Statystyka od strony czysto praktycznej to: dane + procedury (zbierania, przechowania, analizowania, prezentowania danych) + programy; JeĹźeli statystyka kojarzy siÄ komuĹ ze matematykÄ , wzorami i liczeniem, to jak widaÄ jest to zaledwie podpunkt proceduryâanalizowanie.
Celem badania statystycznego jest uzyskanie informacji o interesujÄ cym zjawisku na podstawie danych. Zjawisko ma charakter masowy czyli dotyczy duĹźej liczby obiektĂłw. Nie interesuje nas jeden zgon (obiekt) tylko zgony wielu ludzi.
Populacja (zbiorowoĹÄ statystyczna) to zbiĂłr obiektĂłw bÄdÄ cy przedmiotem badania statystycznego. Na przykĹad zgony w Polsce w roku 2022.
KaĹźdy obiekt w populacji to obserwacja (zwana takĹźe jednostkÄ statystycznÄ albo pomiarem) na jednej lub wiÄcej zmiennych. JeĹźeli interesujÄ cym zjawiskiem sÄ zgony, obserwacjÄ jest osoba zmarĹa a zmiennymi wiek, pĹeÄ, przyczyna zgonu oraz dzieĹ tygodnia (w ktĂłrym nastÄ piĹ zgon) zmarĹej osoby.
PrĂłba to czÄĹÄ populacji. Na przykĹad czÄĹÄ zgonĂłw w Polsce w roku 2022.
Parametr: wielkoĹÄ numeryczna obliczona na podstawie populacji.
Statystyka: wielkoĹÄ numeryczna obliczona na podstawie prĂłby.
Populacja powinna byÄ zdefiniowana w taki sposĂłb, aby nie byĹo wÄ tpliwoĹci co tak naprawdÄ jest badane. Zgony to w oczywisty sposĂłb za maĹo. Zgony mieszkaĹcĂłw Kwidzyna w roku 2022.
ZwrĂłÄmy uwagÄ, Ĺźe Zgony w mieĹcie Kwidzyn w roku 2022 to nie to samo (ktoĹ moĹźe byÄ mieszkaĹcem a umrzeÄ w Polsce i/lub ktoĹ moĹźe nie byÄ mieszkaĹcem i umrzeÄ w Kwidzynie.)
Generalizacja: ocena caĹoĹci na podstawie czÄĹci. Badamy zjawisko wypalenia zawodowego pielÄgniarek i pielÄgniarzy w Polsce (populacja). Wobec zaporowych kosztĂłw mierzenia wszystkich decydujemy siÄ na przeprowadzenie ankiety wĹrĂłd studentĂłw pielÄgniarstwa PSW (prĂłba). Czy moĹźemy twierdziÄ na podstawie prĂłby, Ĺźe wyniki badania dla caĹej Polski sÄ identyczne? Raczej nieâŚ
PrĂłba, ktĂłra pozwala na generalizacjÄ nazywa siÄ prĂłbÄ reprezentatywnÄ . Najlepszym sposobem na uzyskanie prĂłby reprezentatywnej jest losowanie.
W oczywisty sposĂłb badanie na podstawie prĂłby jest taĹsze niĹź badanie caĹoĹci, co nie oznacza Ĺźe jest tanie. KontynuujÄ c przykĹad: musielibyĹmy mieÄ listÄ wszystkich pielÄgniarek i pielÄgniarzy w Polsce. Z tej listy wylosowaÄ prĂłbÄ a nastÄpnie skontaktowaÄ siÄ z wybranymi osobami (jak?). Dlatego teĹź badania w oparciu o prĂłbÄ nielosowÄ sÄ caĹkiem popularne (bo sÄ tanie); naleĹźy jednakĹźe mieÄ ĹwiadomoĹÄ ich ograniczeĹ, w tym a zwĹaszcza uogĂłlnienia uzyskanych wynikĂłw.
MÄ droĹÄ statystyczna nt liczebnoĹci prĂłby i wnioskowania z prĂłby niereprezentatywnej: badano czy nowy preparat podnosi noĹnoĹÄ kur, w 33,3% przypadkĂłw podniĂłsĹ w 33,3% przypadkĂłw nie podniĂłsĹ, a na 33,3 nie wiadomo, bo kura uciekĹa.
Potocznie kojarzy siÄ z linijkÄ i wagÄ ale w statystyce uĹźywany jest w szerszym znaczeniu. Ustalenie pĹci albo przyczyny zgonu to teĹź pomiar.
Pomiar to przyporzÄ dkowanie wariantom zmiennej liczb lub symboli z pewnej skali pomiarowej. PrzykĹadowo jeĹźeli jednostkÄ statystycznÄ jest zgon a zmiennymi wiek, pĹeÄ, przyczyna zgonu oraz dzieĹ tygodnia to pomiar bÄdzie polegaĹ na ustaleniu (przyporzÄ dkowaniu) wieku w latach, pĹci (âKâ/âMâ), przyczyny (identyfikatora z katalogu ICD10 zapewne) oraz numeru dnia tygodnia (lub nazwy dnia tygodnia). Wiek oraz numer dnia sÄ liczbami, pĹeÄ i przyczyna symbolem.
Wyróşnia siÄ nastÄpujÄ ce typy skal pomiarowych:
nominalna (nominal scale), klasyfikuje: pĹeÄ zmarĹego;
porzÄ dkowa (ordinal scale), klasyfikuje i porzÄ dkuje: dzieĹ tygodnia w ktĂłrym nastÄ piĹ zgon (po poniedziaĹku jest wtorek);
liczbowa, mierzy w potocznym tego sĹowa znaczeniu: wiek zmarĹego w latach
MĂłwimy zmienna mierzalna albo zmienna iloĹciowa dla zmiennych mierzonych za pomocÄ skali liczbowej. MĂłwimy zmienna niemierzalna albo zmienna jakoĹciowa dla zmiennych mierzonych za pomocÄ skali nominalnej/porzÄ dkowej.
Zmienne mierzalne dzielÄ siÄ na skokowe oraz ciÄ gĹe. Skokowe sÄ to cechy, ktĂłre przyjmujÄ skoĹczonÄ liczbÄ wartoĹci, zwykle sÄ to liczby caĹkowite; CiÄ gĹe sÄ to cechy, ktĂłre przyjmujÄ dowolne wartoĹci liczbowe z pewnego przedziaĹu liczbowego, np. ciĹnienie krwi.
Rodzaje danych
Przekrojowe (zmarli w Kwidzynie)
Czasowe: kaĹźda obserwacja ma przypisany czas (liczba zmarĹych w Polsce w latach 2000â20222)
Przestrzenne : kaĹźda obserwacja ma przypisane miejsce na kuli ziemskiej (wspĂłĹrzÄdne geograficzne)
Rodzaje analizy statystycznej zaleĹźÄ od rodzaju danych (jakie mamy dane takie moĹźemy stosowaÄ metody):
jedna zmienna/dane przekrojowe: analiza struktury
jedna zmienna/dane czasowe: analiza dynamiki zjawiska
co najmniej dwie zmienne: analiza wspĂłĹzaleĹźnoĹci (nadwaga powoduje cukrzycÄ)
Sposoby analizy danych zaleĹźÄ od sposobu pomiaru (populacja/prĂłba/generalizacja):
Opis statystyczny â (proste) przedstawienie badanych zbiorowoĹci/zmiennych tabel, wykresĂłw lub parametrĂłw (np. Ĺrednia, mediana) ; Opis statystyczny moĹźe dotyczyÄ: â struktury zbiorowoĹci; â wspĂłĹzaleĹźnoĹci; â zmian zjawiska w czasie.
Wnioskowanie statystyczne: wnioskowanie na temat caĹoĹci na podstawie prĂłby; wykorzystuje metody analizy matematycznej
Opisujemy populacjÄ lub prĂłbÄ. Wnioskujemy na podstawie prĂłby o caĹoĹciâŚ
SposĂłb pomiaru/organizacja badania ma zasadnicze znaczenie dla interpretacji wynikĂłw. SÄ dwa fundamentalne rodzaje pomiaru (sposobu zebrania danych) eksperyment oraz obserwacja.
MĂłwimy w zwiÄ zku z tym dane eksperymentalne albo dane obserwacyjne.
PrzykĹad: chcemy ustaliÄ czy spoĹźywanie kawy w czasie sesji egzaminacyjnej skutkuje uzyskaniem lepszej oceny. W celu oceny prawdziwoĹci takiej tezy przeprowadzono badanie wĹrĂłd studentĂłw pytajÄ c ich o to ile kawy pili w czasie sesji i zestawiajÄ c te dane z wynikami egzaminĂłw. Ĺrednie wyniki w grupie studentĂłw pijÄ cych duĹźo kawy byĹy wyĹźsze w grupie pijÄ cej maĹo kawy. Czy moĹźna powiedzieÄ, Ĺźe udowodniono iĹź picie duĹźej iloĹci kawy poprawia wynik egzaminu?
Raczej nie: moĹźna sobie wyobraziÄ, Ĺźe studenci ktĂłrzy poĹwiÄcili wiÄcej czasu na naukÄ pili w tym czasie kawÄ (na przykĹad Ĺźeby nie zasnÄ Ä). PrawdziwÄ przyczynÄ jest czas poĹwiÄcony na przygotowanie a nie to ile ktoĹ wypiĹ lub nie wypiĹ kawy. Inaczej mĂłwiÄ c gdyby ktoĹ piĹ duĹźo kawy, bo uwierzyĹ, Ĺźe to poprawi mu wyniki i siÄ nie uczyĹ, to pewnie by siÄ rozczarowaĹ.
Rodzaje badaĹ: eksperymentalne vs obserwacyjne.
Eksperyment kontrolowany (zrandomizowany lub nie): sĹuĹźy do weryfikacja zwiÄ zku przyczyna-skutek. Skutek moĹźe byÄ rezultatem dziaĹania wielu czynnikĂłw (zmiennych). Eksperymentator manipuluje wielkoĹciÄ przyczyn (zmiennych niezaleĹźnych) oraz mierzy wielkoĹÄ skutku (zmiennej zaleĹźnej); Wszystkie pozostaĹe czynniki (zmienne ukryte) sÄ kontrolowane (w tym sensie, Ĺźe ich wpĹyw na skutek jest ustalony.
Pomiarowi/manipulacji podlega zbiĂłr jednostek podzielonych losowo na dwie grupy: grupa eksperymentalna (experimental group) oraz grupa kontrolna (control group)
W medycynie uĹźywa siÄ terminu badania kliniczne czyli badania ktĂłre dotyczÄ ludzi. Badania kliniczne takĹźe dzielÄ siÄ na eksperymentalne oraz obserwacyjne. Eksperyment nazywa siÄ RCT (randomized clinical trial/randomizowane kontrolowane badania kliniczne.) Manipulacja okreĹlana jest jako ekspozycja (exposure) albo leczenie (treatment) Zmienne ukryte okreĹla siÄ mianem confunding factors (czynniki zakĹĂłcajÄ ce)
Rysunek przedstawia zaleĹźnoĹÄ pomiÄdzy wynikiem (outcome), przyczynÄ oraz czynnikami zakĹĂłcajÄ cymi na przykĹadzie zaleĹźnoĹci dotyczÄ cej domniemanego wpĹywu fluoryzowania wody na zwiÄkszenie ryzyka zgonĂłw z powodu nowotworĂłw. W badaniu ktĂłrego autor uwaĹźaĹ Ĺźe udowodniĹ zwiÄ zek fluoryzowanieânowotĂłr porĂłwnaĹ on wspĂłĹczynniki zgonĂłw z miast fluoryzujÄ cych oraz nie fluoryzujÄ cych wodÄ. OkazaĹo siÄ, Ĺźe przeciÄtnie wspĂłĹczynnik ten byĹ wyĹźszy w grupie miast fluoryzujÄ cych wodÄ. Czy to Ĺwiadczy, Ĺźe fluoryzowanie wody powoduje raka? NieâŚ
W innym badaniu tych samych miast okazaĹo siÄ, Ĺźe w grupie miast fluoryzujÄ cych wodÄ przeciÄtnie mieszkajÄ starsi ludzie. A poniewaĹź wspĂłĹczynniki zgonĂłw rosnÄ wraz ze wzrostem wieku, to nie moĹźna wykluczyÄ, Ĺźe prawdziwÄ przyczynÄ obserwowanego zwiÄkszenia wartoĹci wspĂłĹczynnikĂłw zgonĂłw jest wiek a nie fluoryzacja wody.
Efekt przyczynowy to iloĹciowe okreĹlenie wpĹywu ekspozycji na wynik poprzez porĂłwnanie wielkoĹci wyniku dla róşnych wielkoĹci ekspozycji
SÄ dwa typy efektu przyczynowego: indywidualny efekt interwencji (individual treatment effect) oraz Ĺredni efekt interwencji (average treatment effect)
Individual Treatment Effect (ITE)
Indywidualny efekt interwencji (ITE) okreĹla iloĹciowo wpĹyw interwencji dla konkretnej osoby, poprzez porĂłwnanie wynikĂłw dla róşnych wartoĹci interwencji.
MogÄ piÄ kawÄ lub nie piÄ kawy a wynikiem bÄdzie ocena. OczywiĹcie nie mogÄ zrobiÄ tych dwĂłch rzeczy na razâŚ
Average Treatment Effect (ATE)
Ĺredni efekt interwencji okreĹla iloĹciowo wpĹyw interwencji dla grupy osĂłb
W grupie studentĂłw jedni pili kawÄ inni nieâŚ
JeĹźeli grupa (populacja) zostaĹa uprzednio podzielona (losowo) na grupÄ eksperymentalnÄ oraz grupÄ kontrolnÄ moĹźemy policzyÄ ATE oddzielnie dla obu grup. Wtedy efekt przyczynowy moĹźna zdefiniowaÄ jako:
ATT - ATC (albo ATT/ATC)
gdzie: ATT oznacza ATE w grupie eksperymentalnej a ATC oznacza ATE w grupie kontrolnej.
PrzykĹad (kontynuuacja): moĹźna przypuszczaÄ, Ĺźe oprĂłcz kawy na wynik egzaminu ma wpĹyw np. wrodzone predyspozycje w dziedzinie intelektualnej oraz czas poĹwiÄcony na naukÄ. Aby kontrolowaÄ ten czynnik moĹźna podzieliÄ losowo grupÄ studentĂłw; dziÄki czemu Ĺrednia wielkoĹÄ predyspozycji oraz czasu w obu grupach bÄdzie podobna. NastÄpnie zalecamy studentom w grupie eksperymentalnej picie 1l kawy dziennie a studentom w grupie kontrolnej podajemy 1l brÄ zowej wody o smaku i zapachu kawy :-). Ĺrednie wyniki w grupie studentĂłw pijÄ cych 1l kawy okazaĹy siÄ wyĹźsze niĹź w grupie pijÄ cej kolorowÄ wodÄ. Czy moĹźna powiedzieÄ Ĺźe udowodniono iĹź picie duĹźej iloĹci kawy poprawia wynik egzaminu? Raczej takâŚ
Badania obserwacyjne moĹźna z kolei podzieliÄ na analityczne i opisowe.
W badaniach analitycznych porĂłwnuje siÄ grupÄ kontrolnÄ z grupÄ poddanÄ ekspozycji/leczeniu; w badaniach przekrojowych nie ma grupy kontrolnej.
Badania analityczne dzielimy dalej na:
kohortowe,
kliniczno-kontrolne,
przekrojowe.
Badanie kohortowe (cohort study): wieloletnie badania na duĹźej grupie jednostek. Pomiar zaczynamy od ekspozycji koĹczymy na wyniku/chorobie/zgonie (takie badanie nazywamy prospektywnym. Problem: koszty (np. choroby rzadkie wymagajÄ ogromnych kohort).
Badanie kliniczno-kontrolne (case-control study): restrospektywna ocena ekspozycji dla jednostek, u ktĂłrych stwierdzono wynik (chorobÄ). GrupÄ kontrolnÄ tworzÄ dopasowane jednostki u ktĂłrych wyniku nie stwierdzono (dopasowane w sensie, Ĺźe sÄ podobne podobne.) W praktyce badanie kliniczno-kontrolne to badanie chorych, ktĂłrzy zgĹosili siÄ do przychodni; grupÄ kontrolnÄ sÄ podobni chorzy (wiek, pĹeÄ) z innej przychodni :-)
Problem1: bĹÄ d pamiÄci (recall bias) pacjenci â zwĹaszcza zdrowi â sĹabo pamiÄtajÄ fakty ktĂłre miaĹy miejsce lata temu. Problem2: trudnoĹci z dopasowaniem grupy kontrolnej (Ĺatwiej powiedzieÄ niĹź zrobiÄ.)
Badania prospektywne: od przyczyny do skutku (cohort); badanie retrospektywne: od skutku do przyczyny (case-control)
Badanie przekrojowe (cross-sectional study): badanie zwiÄ zku miÄdzy wynikiem a ekspozycjÄ bez podziaĹu na grupÄ eksperymentalnÄ i kontrolnÄ .
Problem: nie da siÄ okreĹliÄ zwiÄ zku przyczyna-skutek w taki sposĂłb jaki siÄ stosuje w badaniach analitycznych, ale moĹźna do tego celu zastosowaÄ model regresji liniowej.
PrzykĹad: badamy grupÄ pacjentĂłw przychodni onkologicznej. Stwierdzamy Ĺźe 90% z nich paliĹo papierosy. Czy z tego wynika Ĺźe palenie powoduje raka? Niekoniecznie. MoĹźemy dopasowaÄ pacjentĂłw o podobnym profilu demograficzno-spoĹecznym z innej przychodni (ktĂłrzy nie chorujÄ na raka) i stwierdziÄ Ĺźe 20% z nich paliĹo. To juĹź jest konkretny argument â ale takie badanie nie jest juĹź przekrojowe tylko kliniczno-kontrolne.
PrzykĹad (kontynuuacja): moĹźna oprĂłcz pytania studentĂłw o iloĹÄ kawy i wynik pytaÄ ich jeszcze o czas poĹwiÄcony na naukÄ oraz o ĹredniÄ ze studiĂłw (wrodzone predyspozycje w dziedzinie intelektualnej). Za pomocÄ metody regresji moĹźemy ustaliÄ czy i jak bardzo kawa, czas i predyspozycje wpĹywajÄ na ocenÄ. Teoretycznie zamiast eksperymentu moĹźna uĹźywaÄ regresji, ale jest to w wiÄkszoĹci przypadkĂłw trudneâalbo zmienne nie da siÄ zmierzyÄ (czy Ĺrednia ze studiĂłw jest dobrÄ miarÄ predyspozycji?) albo jakÄ Ĺ waĹźnÄ zmiennÄ pominiemy. WiÄcej na temat regresji w rozdziale 3.
Badanie ekologiczne: badanie (przekrojowe) zaleĹźnoĹci pomiÄdzy danymi zagregowanymi a nie indywidualnymi. PrzykĹadowo zaleĹźnoĹÄ pomiÄdzy przeciÄtnÄ wielkoĹciÄ dochodu narodowego, a przeciÄtnÄ oczekiwanÄ dĹugoĹciÄ Ĺźycia np. na poziomie kraju.
Problem: bĹÄ d ekologizmu (ecological fallacy.) ZaleĹźnoĹci na poziomie indywidualnym oraz zagregowanym mogÄ byÄ róşne. MoĹźna oczekiwaÄ Ĺźe im wiÄkszy dochĂłd tym osoba dĹuĹźej Ĺźyje (poziom indywidualny.) JeĹźeli w kraju wystÄpujÄ duĹźe róşnice w dochodach (na przykĹad USA) to przeciÄtnie dochĂłd jest wysoki, ale jest duĹźo osĂłb o niskich dochodach, o ograniczonym dostÄpie do sĹuĹźby zdrowia, i krĂłtszej oczekiwanej dĹugoĹci Ĺźycia. PrzeciÄtna oczekiwana dĹugoĹÄ Ĺźycia na poziomie caĹego kraju jest niĹźsza (bo jest sumÄ wysokiej dla bogatych + niskiej dla biednych); w rezultacie zaleĹźnoĹÄ na poziomie zagregowanym moĹźe siÄ znaczÄ co róşniÄ od tej na poziomie indywidualnym.
Jest ustalony szablon artykuĹu naukowego, ktĂłry powinien byÄ podzielony na nastÄpujÄ ce czÄĹci:
Ĺťeby siÄ zorientowaÄ jakie dane (jakie zmienne i jak mierzone) oraz jakie metody statystyczne zostaĹy wykorzystane w pracy wystarczy zapoznaÄ siÄ z treĹciÄ punktu materiaĹ i metoda. W szczegĂłlnoĹci powinien tam byÄ okreĹlony rodzaj badania: eksperyment, badanie kohortowe, kliniczno-kontrolne, przekrojowe lub inneâŚ
PrzykĹad 1: Czy konsumpcja soli kuchennej szkodzi? (eksperyment)
Neal B. i inni zastosowali eksperyment kontrolowany do zbadania wpĹywu substytucji chlorku sodu chlorkiem potasu na choroby sercowo-naczyniowe (Effect of Salt Substitution on Cardioviscular Events and Death, New England Journal of Medicine, https://doi.org/10.1056/NEJMoa2105675). W badaniu przeprowadzonym w Chinach, uczestniczyli mieszkaĹcy 600 wsi, podzieleni losowo na dwie grupy. Uczestnik badania musiaĹ mieÄ minimum 60 lat oraz nadciĹnienie krwi. W badaniu uczestniczyĹo prawie 21 tysiÄcy osĂłb. Przez piÄÄ lat trwania eksperymentu grupa kontrolna uĹźywaĹa soli zawierajÄ cej 75% chlorku potasu oraz 25% chlorku sodu; grupa badana zaĹ uĹźywaĹa soli tradycyjnej czyli zawierajÄ cej wyĹÄ cznie chlorek sodu. Obserwowano w okresie piÄcioletnim w obu grupach liczbÄ udarĂłw, incydentĂłw sercowo-naczyniowych oraz zgonĂłw. WpĹyw substytucji oceniono porĂłwnujÄ c wspĂłĹczynniki ryzyka w obu grupach.
PrzykĹad 2: Konflikt praca-dom w zawodzie pielÄgniarki (przekrojowe)
Simon i inni badali konflikt Praca-Dom w zawodzie PielÄgniarki/PielÄgniarza (Work-Home Conflict in the European Nursing Profession Michael Simon 1, Angelika KĂźmmerling, Hans-Martin Hasselhorn; Next-Study Group Int J Occup Environ Health 2004 Oct-Dec;10(4):384-91. doi: 10.1179/oeh.2004.10.4.384. https://pubmed.ncbi.nlm.nih.gov/15702752/)
Konflikt Praca-Dom (WHC) to sytuacja kiedy nie moĹźna zajÄ Ä siÄ zadaniami lub obowiÄ zkami w jednej dziedzinie ze wzglÄdu na obowiÄ zki w drugiej domenie. Teoria zapoĹźyczona z obszaru Nauk o ZarzÄ dzaniu zapewne. Ten konflikt jest mierzony odpowiedniÄ skalÄ pomiarowÄ skĹadajÄ cÄ siÄ z piÄciu pytaĹ. Czynnikami ktĂłre WHC majÄ powodowaÄ sÄ : czas pracy, grafik (w sensie rodzaj etatu/zmianowoĹÄ), nacisk-na-nadgodziny (wystÄpuje lub nie), intensywnoĹÄ pracy, obciÄ Ĺźenie emocjonalne oraz jakoĹÄ zarzÄ dzania. (ostatnie trzy mierzone odpowiednimi skalami pomiarowymi, czytaj: seriÄ pytaĹ w ankiecie). Badano 27,603 osoby. Podstawowym narzÄdziem badawczym jak siÄ Ĺatwo domyĹleÄ byĹa ankieta, a przyczyny WHC ustalono za pomocÄ metody regresji wielorakiej.
Teraz porĂłwajmy koszty badania #1, w ktĂłrym jedynie starano siÄ ustaliÄ Ĺźe sĂłl szkodzi (lub nie) z badaniem #2, w ktĂłrym starano siÄ ustaliÄ przyczyny stanĂłw psychicznych badanych-:)
Populacja naraĹźona (population at risk): grupa osĂłb podatnych na zdarzenie (chorobÄ); rak szyjki macicy dotyczy kobiet a nie wszystkich.
WspĂłĹczynnik chorobowoĹci (prevalence rate): liczba chorych w okreĹlonym czasie (dzieĹ, tydzieĹ, rok) podzielona przez wielkoĹÄ populacji naraĹźonej. PoniewaĹź sÄ to zwykle bardzo maĹe liczby, mnoĹźy siÄ wynik przez \(10^n\) dla uĹatwienia interpretacji. Czyli jeĹźeli chorych w populacji naraĹźonej o wielkoĹci 1mln jest 20 osĂłb, to wspĂłĹczynnik wynosi 20/1mln = 0,000002 co trudno skomentowaÄ po polsku. JeĹźeli pomnoĹźymy owe 0,000002 przez 100 tys (\(n=5\)), to wspĂłĹczynnik bÄdzie rĂłwny 2, co interpretujemy jako dwa przypadki na 100 tys. (albo 0,2 na 10 tys, jeĹźeli \(n=4\), co juĹź jednak brzmi trochÄ gorzej.)
WspĂłĹczynnik zapadalnoĹci (incidence rate): liczba nowych chorych w okreĹlonym czasie (dzieĹ, tydzieĹ, rok) podzielona przez wielkoĹÄ populacji naraĹźonej. TeĹź zwykle pomnoĹźona przez \(10^n\)
WspĂłĹczynnik ĹmiertelnoĹci (case fatality rate): liczba zgonĂłw z powodu X w okreĹlonym czasie (dzieĹ, tydzieĹ, rok) podzielona przez liczbÄ chorych na X w tym samym czasie. ĹmiertelnoĹÄ jest miarÄ ciÄĹźkoĹci choroby X.
WspĂłĹczynnik zgonĂłw (death rate): liczba zgonĂłw w okreĹlonym czasie przez ĹredniÄ liczbÄ ludnoĹci w tym czasie (pomnoĹźone przez \(10^n\)).
JeĹźeli wspĂłĹczynnik zgonĂłw nie uwzglÄdnia wieku, nazywany jest surowym (crude); grupy róşniÄ ce siÄ strukturÄ wieku nie powinny byÄ porĂłwnywane za pomocÄ wspĂłĹczynnikĂłw surowych tylko standaryzowanych (age-standardized albo age-adjusted). PrzykĹadowo jeĹźeli porĂłwnamy wspĂłĹczynnik zgonĂłw USA i Nigerii to okaĹźe siÄ Ĺźe w USA jest wyĹźszy a to z tego powodu Ĺźe spoĹeczeĹstwo amerykaĹskie jest znacznie starsze (a umierajÄ zwykle ludzie starzy)
WspĂłĹczynnik zgonĂłw standaryzowany wedĹug wieku to waĹźona Ĺrednia wspĂłĹczynnikĂłw w poszczegĂłlnych grupach wiekowych, gdzie wagami sÄ udziaĹy tychĹźe grup wiekowych w pewnej standardowej populacji
Nie da siÄ praktykowaÄ statystyki bez korzystania z programĂłw komputerowych i mamy w tym zakresie trzy moĹźliwoĹci:
Arkusz kalkulacyjny. Przydatny na etapie zbierania danych i ich wstÄpnej analizy, później juĹź niekoniecznie. Policzenie niektĂłrych rzeczy jest niemoĹźliwe (brak stosownych procedur) lub czasochĹonne (w porĂłwnaniu do 2â3)
Oprogramowanie specjalistyczne komercyjne takie jak programy STATA czy SPSS. Wady: cena i czas niezbÄdny na ich poznanie.
Oprogramowanie specjalistyczne darmowe: Jamovi oraz R Same zalety:-)
W wiÄkszoĹci podrÄcznikĂłw opisuje siÄ procedury oraz program, w ktĂłrym te procedury moĹźna zastosowaÄ jednoczeĹnie. My zdecydowaliĹmy siÄ oddzielnie przestawiÄ teoriÄ statystyki (rozdziaĹy 1â4) a oddzielnie opis posĹugiwania siÄ konkretnym programem (rozdziaĹ 5.)
Statystyka opisowa (opis statystyczny) to zbiĂłr metod statystycznych sĹuĹźÄ cych do â surprise, surprise â opisu (w sensie przedstawienia sumarycznego) zbioru danych; w zaleĹźnoĹci od typu danych (przekrojowe, czasowe, przestrzenne) oraz sposobu pomiaru (dane nominalne, porzÄ dkowe liczbowe) naleĹźy uĹźywaÄ róşnych metod.
W przypadku danych przekrojowych opis statystyczny nazywany jest analizÄ struktury i sprowadza siÄ do opisania danych z wykorzystaniem:
tablic (statystycznych)
wykresĂłw
parametrĂłw (takich jak Ĺrednia czy mediana)
RozkĹad cechy (zmiennej) to przyporzÄ dkowanie wartoĹciom cechy zmiennej odpowiedniej liczby wystÄ pieĹ (liczebnoĹci albo czÄstoĹci (czyli popularnych procentĂłw).)
Analiza struktury (dla jednej zmiennej) obejmuje:
okreĹlenie tendencji centralnej (tzw. miary poĹoĹźenia / wartoĹÄ przeciÄtna, mediana, dominanta);
zróşnicowanie wartoĹci (rozproszenie);
asymetriÄ (rozĹoĹźenie wartoĹci wokóŠĹredniej);
Tablica statystyczna to (w podstawowej formie) dwukolumnowa tabela zawierajÄ ca wartoĹci cechy oraz odpowiadajÄ ce tym wartoĹciom liczebnoĹci.
PrzykĹad 1: Tablica dla cechy niemierzalnej (nominalnej albo porzÄ dkowej)
Absolwenci studiĂłw pielÄgniarskich w oĹmiu najwiÄkszych krajach UE w roku 2018
Jednostka badania: absolwent studiĂłw pielÄgniarskich w roku 2018,
Badana cecha: kraj w ktĂłrym ukoĹczyĹ studia (nominalna)
Tablica: Absolwenci studiĂłw pielÄgniarskich w oĹmiu najwiÄkszych krajach UE w roku 2018
kraj | liczba |
---|---|
Belgium | 7203 |
Germany | 35742 |
Spain | 9936 |
France | 25757 |
Italy | 11207 |
Netherlands | 9920 |
Poland | 9070 |
Romania | 18664 |
ĹšrĂłdĹo: Eurostat, tablica Health graduates (HLTH_RS_GRD)
PrzykĹad 2: Tablica dla cechy mierzalnej (liczbowej; skokowej lub ciÄ gĹej)
JeĹźeli liczba wariantĂłw cechy jest maĹa tablica zawiera wyliczenie wariantĂłw cechy i odpowiadajÄ cych im liczebnoĹci. JeĹźeli liczba wariantĂłw cechy jest duĹźa tablica zawiera klasy wartoĹci (przedziaĹy wartoĹci) oraz odpowiadajÄ ce im liczebnoĹci.
Co do zasady klasy wartoĹci powinny byÄ jednakowej rozpiÄtoĹci.
Na zasadzie wyjÄ tku dopuszcza siÄ aby pierwszy i ostatni przedziaĹ byĹy otwarte, tj. nie miaĹy dolnej (pierwszy) lub gĂłrnej (ostatni) granicy
Tablica: Gospodarstwa domowe we wsi X wg liczby samochodĂłw w roku 2022
liczba samochodĂłw | liczba gospodarstw | % |
---|---|---|
0 | 230 | 39.3162393 |
1 | 280 | 47.8632479 |
2 | 70 | 11.9658120 |
3 i wiÄcej | 5 | 0.8547009 |
razem | 585 | 100.0000000 |
ĹšrĂłdĹo: obliczenia wĹasne
Tablica dla cechy mierzalnej (liczbowej ciÄ gĹejâwymaga pogrupowania w klasy):
PrzykĹad: DzietnoĹÄ kobiet na Ĺwiecie
WspĂłĹczynnik dzietnoĹci (fertility ratio albo FR) â przeciÄtna liczba urodzonych dzieci przypadajÄ cych na jednÄ kobietÄ w wieku rozrodczym (15â49 lat). Przyjmuje siÄ, iĹź FR miÄdzy 2,10â2,15 zapewnia zastÄpowalnoĹÄ pokoleĹ.
Dane dotyczÄ ce dzietnoĹci dla wszystkich krajĂłw Ĺwiata moĹźna znaleĹşÄ na stronie https://ourworldindata.org/grapher/fertility-rate-complete-gapminder) Zbudujmy tablicÄ przedstawiajÄ cÄ rozkĹad wspĂłĹczynnikĂłw dzietnoĹci w roku 2018
KrajĂłw jest 201. WartoĹÄ minimalna to 1.22 a wartoĹÄ maksymalna to 7.13. Decydujemy siÄ na rozpiÄtoĹÄ przedziaĹu rĂłwnÄ 0,5; dolny koniec pierwszego przedziaĹu przyjmujemy jako 1,0.
Zwykle przyjmuje siÄ za koĹce przedziaĹĂłw okrÄ gĹe liczby bo dziwnie by wyglÄ daĹo gdyby koniec przedziaĹu np. byĹ rĂłwny 1,05 zamiast 1,0.
Liczba przedziaĹĂłw jest dobierana metodÄ prĂłb i bĹÄdĂłw, tak aby:
nie byĹo przedziaĹĂłw z zerowÄ liczebnoĹciÄ
przedziaĹĂłw nie byĹo za duĹźo ani za maĹo (typowo 8â15)
wiÄkszoĹÄ populacji nie znajdowaĹa siÄ w jednej czy dwĂłch przedziaĹach
Tablica: Kraje Ĺwiata wedĹug wspĂłĹczynnika dzietnoĹci (2018)
Wsp. dzietnoĹci | liczba krajĂłw |
---|---|
(1,1.5] | 24 |
(1.5,2] | 61 |
(2,2.5] | 40 |
(2.5,3] | 17 |
(3,3.5] | 8 |
(3.5,4] | 15 |
(4,4.5] | 11 |
(4.5,5] | 12 |
(5,5.5] | 6 |
(5.5,6] | 5 |
(6,6.5] | 1 |
(7,7.5] | 1 |
ĹšrĂłdĹo: https://ourworldindata.org/grapher/fertility-rate-complete-gapminder
KaĹźda tablica statystyczna musi mieÄ:
CzÄĹÄ liczbowÄ (kolumny i wiersze);
CzÄĹÄ opisowÄ :
PominiÄcie czegokolwiek z powyĹźszego jest ciÄĹźkim bĹÄdem. JeĹźeli nie ma danych (a czÄsto nie maâz róşnych powodĂłw â naleĹźy to zaznaczyÄ a nie pozostawiaÄ pustÄ rubrykÄ)
Wykresy statystyczne sÄ graficznÄ formÄ prezentacji materiaĹu statystycznego, sÄ mniej precyzyjne i szczegĂłĹowe niĹź tablice, natomiast bardziej sugestywne.
Celem jest pokazanie rozkĹadu wartoĹci cechy w populacji: jakie wartoĹci wystÄpujÄ czÄsto a jakie rzadko, jak bardzo wartoĹci róşniÄ siÄ miÄdzy sobÄ . Jak róşniÄ siÄ rozkĹady dla róşnych, ale logicznie powiÄ zanych populacji (np rozkĹad czegoĹ-tam w kraju A i B albo w roku X, Y i Z).
Do powyĹźszego celu celu stosuje siÄ:
wykres sĹupkowy (skala nominalna/porzÄ dkowa)
wykres koĹowy (skala nominalna/porzÄ dkowa)
histogram (albo wykres sĹupkowy dla skal nominalnych)
Uwaga: wykres koĹowy jest zdecydowanie gorszy od wykresu sĹupkowego i nie jest zalecany. KaĹźdy wykres koĹowy moĹźna wykreĹliÄ jako sĹupkowy i w takiej postaci bÄdzie on bardziej zrozumiaĹy i Ĺatwiejszy w interpretacji.
Wykres sĹupkowy (bar chart)
Ekwiwalentny wykres koĹowy wyglÄ da byÄ moĹźe efektowniej (z uwagi na paletÄ kolorĂłw)
Ale jest mniej efektywny. Wymaga legendy w szczegĂłlnoĹci, ktĂłra utrudnia interpretacjÄ treĹci (nieustannie trzeba porĂłwnywaÄ koĹo z legendÄ Ĺźeby ustaliÄ ktĂłry kolor to ktĂłry kraj.)
JeĹźeli zwiÄkszymy liczbÄ krajĂłw wykres koĹowy staje siÄ zupeĹnie nieczytelny (brakuje rozróşnialnych kolorĂłw a wycinki koĹa sÄ zbyt wÄ skie Ĺźeby cokolwiek wyróşniaĹy):
Wykres sĹupkowy dalej jest natomiast OK:
Histogram to coĹ w rodzaju wykresu sĹupkowego tylko na jednej osi zamiast wariantĂłw cechy sÄ przedziaĹy wartoĹci. Histogram przedstawiajÄ cy rozkĹad wspĂłĹczynnikĂłw dzietnoĹci dla wszystkich krajĂłw Ĺwiata w roku 2018
Podobnie jak tablice, rysunki powinny byÄ opatrzone tytuĹem oraz zawieraÄ ĹşrĂłdĹo wskazujÄ ce na pochodzenie danych (zobacz przedstawione przykĹady.)
Nie kaĹźdy wie Ĺźe Florence Nightingale, ktĂłra w czasie wojny krymskiej zorganizowaĹa opiekÄ nad rannymi ĹźoĹnierzami, byĹa takĹźe statystykiem.
Aby przekonaÄ swoich przeĹoĹźonych do zwiÄkszenia nakĹadĂłw na szpitale polowe prowadziĹa nie tylko starannÄ ewidencjÄ szpitalnÄ , ale zgromadzone dane potrafiĹa analizowaÄ, uĹźywajÄ c takĹźe wykresĂłw wĹasnego projektu.
W szczegĂłlnoĹci sĹynny jest diagram Nightingale zwane takĹźe rĂłĹźÄ Nightingale, ktĂłre wprawdzie (podobno) nie okazaĹy siÄ szczegĂłlnie uĹźyteczny, no ale nie kaĹźdy nowy pomysĹ jest od razu genialny:
Jest to coĹ w rodzaju wykresu sĹupkowego tyle Ĺźe zamiast sĹupkĂłw sÄ wycinki koĹa. WycinkĂłw jest dwanaĹcie tyle ile miesiÄcy. DĹugoĹÄ promienia a co za tym idzie wielkoĹÄ pola wycinka zaleĹźy od wielkoĹci zjawiska, ktĂłry reprezentuje (przyczyna Ĺmierci: rany/choroby/inne)
WpisujÄ c Florence+Nightingale moĹźna znaleĹşÄ duĹźo informacji na temat, w tym: http://www.matematyka.wroc.pl/ciekawieomatematyce/pielegniarka-statystyczna
W 1859 roku Nightingale zostaĹa wybrana jako pierwsza kobieta na czĹonka Royal Statistical Society (KrĂłlewskie Stowarzyszenie Statystyczne) oraz zostaĹa honorowym czĹonkiem American Statistical Association (AmerykaĹskiego Stowarzyszenia Statystycznego).
WiÄc szanowi czytelnicy wnioski sÄ oczywiste :-)
Analiza parametryczna z oczywistych wzglÄdĂłw dotyczy tylko zmiennych mierzonych na skali liczbowej.
Miary przeciÄtne (poĹoĹźenia) charakteryzujÄ Ĺredni lub typowy poziom wartoĹci cechy. SÄ to wiÄc takie wartoĹci, wokóŠktĂłrych skupiajÄ siÄ wszystkie pozostaĹe wartoĹci analizowanej cechy.
Na rysunku po lewej mamy dwa rozkĹady róşniÄ ce siÄ poziomem przeciÄtnym (czerwony ma przeciÄtnie mniejsze wartoĹci niĹź turkusowy). SÄ to rozkĹady jednomodalne, tj. wartoĹci skupiajÄ siÄ wokóŠjednej wartoĹci. Dla takich rozkĹadĂłw ma sens obliczanie Ĺredniej arytmetycznej.
Na rysunku po prawej mamy rozkĹady nietypowe: wielomodalne (turkusowy) lub niesymetryczne (fioletowy.) W rozkĹadzie niesymetrycznym wartoĹci skupiajÄ siÄ nie centralnie, ale po prawej/lewej od Ĺrodka przedziaĹu zmiennoĹci/wartoĹci Ĺredniej).
W Ĺwiecie rzeczywistym zdecydowana wiÄkszoĹÄ rozkĹadĂłw jest jednomodalna. Rzadkie przypadki rozkĹadĂłw wielomodalnych zwykle wynikajÄ z ĹÄ cznego analizowania dwĂłch róşniÄ cych siÄ wartoĹciÄ ĹredniÄ zbiorĂłw danych. Oczywistym zaleceniem w takiej sytuacji jest analiza kaĹźdego zbioru oddzielnie.
Rodzaje miar poĹoĹźenia
Ĺrednia arytmetyczna (Mean, Arithmetic mean) to ĹÄ czna suma wartoĹci podzielona przez liczbÄ sumowanych jednostek. JeĹźeli wartoĹÄ jednostki \(i\) w \(N\)-elementowym zbiorze oznaczymy jako \(x_i\) (gdzie: \(i=1,\ldots,N\)) to ĹredniÄ moĹźna zapisaÄ jako \(\bar x = (x_1 + \cdots + x_N)/N\)
Uwaga: we wzorach statystycznych zmienne zwykle oznacza siÄ maĹymi literami a ĹredniÄ dla zmiennej przez umieszczenie nad niÄ kreski poziomej czyli \(\bar x\) to Ĺrednia wartoĹÄ zmiennej \(x\).
Mediana (Median, kwartyl drugi) dzieli uporzÄ dkowanÄ zbiorowoĹÄ na dwie rĂłwne czÄĹci; poĹowa jednostek ma wartoĹci cechy mniejsze lub rĂłwne medianie, a poĹowa wartoĹci cechy rĂłwne lub wiÄksze od mediany. StÄ d teĹź mediana bywa nazywana wartoĹciÄ ĹrodkowÄ .
WĹasnoĹci mediany: odporna na wartoĹci nietypowe (w przeciwieĹstwie do Ĺredniej)
Kwartyle: coĹ jak mediana tylko bardziej szczegĂłĹowo. Kwartyli jest trzy i dzielÄ one zbiorowoĹÄ na 4 rĂłwne czÄĹci, kaĹźda zawierajÄ ca 25% caĹoĹci.
Pierwszy kwartyl dzieli uporzÄ dkowanÄ zbiorowoĹÄ w proporcji 25%â75%. Trzeci dzieli uporzÄ dkowanÄ zbiorowoĹÄ w proporcji 75%â25%. Drugi kwartyl to mediana.
Kwantyle (D, wartoĹci dziesiÄtne), podobnie jak kwartyle, tyle Ĺźe dzielÄ na 10 czÄĹci.
Centyle (P, wartoĹci setne), podobnie jak kwantyle tyle Ĺźe dzielÄ na 100 czÄĹci. PrzykĹadowo wartoĹÄ 99 centyla i mniejszÄ ma 99% jednostek w populacji.
PrzykĹad: wspĂłĹczynnik dzietnoĹci na Ĺwiecie w roku 2018
Ĺrednia wartoĹÄ wspĂłĹczynnika 2.68; mediana â 2.2. Interpretacja Ĺredniej: wartoĹÄ wspĂłĹczynnika dzietnoĹci wyniosĹa 2.68 dziecka. Uwaga: Ĺrednia dzietnoĹÄ na Ĺwiecie nie wynosi 2.68 (bo kraje róşniÄ siÄ liczbÄ ludnoĹci). Interpretacja mediany: dzietnoĹÄ kobiet w poĹowie krajĂłw na Ĺwiecie wynosiĹa 2.2 i mniej. Uwaga: dzietnoĹÄ poĹowy kobiet na Ĺwiecie wyniosĹa 2.2 i mniej jest niepoprawnÄ interpretacjÄ (róşne wielkoĹci krajĂłw.)
Generalna uwaga: interpretacja Ĺredniej-Ĺrednich czÄsto jest nieoczywista i naleĹźy uwaĹźaÄ. (a wspĂłĹczynnik dzietnoĹci jest ĹredniÄ : Ĺrednia liczba dzieci urodzonych przez kobietÄ w wieku rozrodczym. JeĹźeli liczymy ĹredniÄ dla 202 krajĂłw, to mamy ĹredniÄ -Ĺrednich). Inny przykĹad: odsetek ludnoĹci w wieku poprodukcyjnym wg powiatĂłw (Ĺrednia z czegoĹ takiego nie da nam odsetka ludnoĹci w wieku poprodukcyjnym w Polsce, bo powiaty róşniÄ siÄ liczbÄ ludnoĹci.)
KontynuujÄ c przykĹad:
Pierwszy kwartyl: 1.75; trzeci kwartyl 3.56 co oznacza Ĺźe 25% krajĂłw miaĹo wartoĹÄ wspĂłĹczynnika dzietnoĹci nie wiÄkszÄ niĹź 1.75 dziecka a 75% krajĂłw miaĹo wartoĹÄ wspĂłĹczynnika dzietnoĹci nie wiÄkszÄ niĹź 3.56 dziecka.
Miary zmiennoĹci okreĹlajÄ zmiennoĹÄ (dyspersjÄ albo rozproszenie) w zbiorowoĹci
Rodzaje miar zmiennoĹci:
Wariancja (variance) jest to Ĺrednia arytmetyczna kwadratĂłw odchyleĹ poszczegĂłlnych wartoĹci cechy od Ĺredniej arytmetycznej zbiorowoĹci. Co moĹźna zapisaÄ
\[s^2 = \frac{1}{N} \left( (x_1 - \bar x)^2 + (x_2 - \bar x)^2 + \cdots + (x_N - \bar x)^N \right)\]
Przy czym czÄsto zamiast dzielenie przez \(N\) dzielimy przez \(N-1\).
Odchylenie standardowe (standard deviation, sd) jest pierwiastkiem kwadratowym z wariancji. Parametr ten okreĹla przeciÄtnÄ róşnicÄ wartoĹci cechy od Ĺredniej arytmetycznej.
RozstÄp Äwiartkowy (interquartile range, IQR) ma banalnie prostÄ definicjÄ:
\[ R_Q = Q_3 - Q_1 \] gdzie: \(Q_1\), \(Q_3\) oznaczajÄ odpowiednio pierwszy oraz trzeci kwartyl.
PrzykĹad: wspĂłĹczynnik dzietnoĹci na Ĺwiecie w roku 2018 (cd)
Ĺrednie odchylenie od Ĺredniej wartoĹci wspĂłĹczynnika wynosi 1.2595749 dziecka. WartoĹÄ rozstÄpu Äwiartkowego wynosi 1.81 dziecka.
Uwaga: odchylenie standardowe/Äwiartkowe sÄ miarami mianowanymi. Zawsze naleĹźy podaÄ jednostkÄ miary.
Asymetria (skewness), to odwrotnoĹÄ symetrii. Szereg jest symetryczny jeĹźeli jednostki sÄ rozĹoĹźone ,,rĂłwnomiernieââ wokóŠwartoĹci Ĺredniej. W szeregu symetrycznym wartoĹci Ĺredniej i mediany sÄ sobie rĂłwne.
SkoĹnoĹÄ moĹźe byÄ dodatnia (Positive Skew) lub ujemna (Negative Skew). Czym siÄ róşni jedna od drugiej widaÄ na rysunku.
Miary asymetrii:
klasyczny wspĂłĹczynnik asymetrii (\(g\))
wspĂłĹczynniki asymetrii Pearsona (\(W_s\))
WspĂłĹczynnik asymetrii (skoĹnoĹci) oparty na odlegĹoĹciach miÄdzy kwartylami lub decylami:
Polega na obliczeniu
Ĺredniej i mediany
odchylenia standardowego i rozstÄpu Äwiartkowego
wspĂłĹczynnika skoĹnoĹci \(g\)
Oraz
CzÄsto strukturÄ jednego rozkĹadu naleĹźy porĂłwnaÄ z innym. Albo trzeba porĂłwnaÄ strukturÄ wielu rozkĹadĂłw. PokaĹźemy jak to zrobiÄ na przykĹadzie.
PrzykĹad: masa ciaĹa uczestnikĂłw Pucharu Ĺwiata w Rugby
W turniejach o puchar Ĺwiata w Rugby w latach 2015, 2019 i 2023 uczestniczyĹo ĹÄ cznie 1879 zawodnikĂłw. W grze w rugby druĹźyna jest podzielona na dwie formacje: ataku i mĹyna. NaleĹźy scharakteryzowaÄ rozkĹad masy ciaĹa zawodnikĂłw obu formacji.
Zawodnicy ataku
PrzeciÄtnie zawodnik ataku waĹźyĹ 92.7 kg; mediana 92.0 kg (poĹowa zawodnikĂłw ataku waĹźyĹa 92.0 kg i mniej); pierwszy/trzeci kwartyl 85.5/99 kg (1/4 zawodnikĂłw ataku waĹźyĹa 85.5 kg i mniej; 1/4 zawodnikĂłw ataku waĹźyĹa 99 kg i wiÄcej;
Odchylenie standardowe 10.1 kg (przeciÄtnie odchylenie od Ĺredniej arytmetycznej wynosi 10.1 kg); rozstÄp Äwiartkowy wynosi 13.5 kg (rozstÄp 50% Ĺrodkowych wartoĹci wynosi 13.5 kg)
Histogram przy przyjÄciu dĹugoĹci przedziaĹu rĂłwnej 4kg (linia zielona oznacza poziom Ĺredniej):
Zawodnicy mĹyna
Ĺrednio zawodnik mĹyna waĹźyĹ 112.3 kg; mediana 112.0 kg (poĹowa zawodnikĂłw mĹyna waĹźyĹo 112 kg i mniej); pierwszy/trzeci kwartyl 106/118 kg (1/4 zawodnikĂłw mĹyna waĹźyĹo 106 kg i mniej; 1/4 zawodnikĂłw mĹyna waĹźyĹo 118 kg i wiÄcej;
Odchylenie standardowe 9.2 kg (przeciÄtnie odchylenie od Ĺredniej arytmetycznej wynosi 9.2 kg); rozstÄp Äwiartkowy wynosi 12 kg (rozstÄp 50% Ĺrodkowych wartoĹci wynosi 12 kg)
Histogram przy przyjÄciu dĹugoĹci przedziaĹu rĂłwnej 4kg (linia zielona oznacza poziom Ĺredniej):
PorĂłwnanie atak vs mĹyn
Miara | Atak | MĹyn |
---|---|---|
Ĺrednia | 92.7087379 | 112.327957 |
mediana | 92 | 112 |
odchyl.st | 10.0723816 | 9.2406513 |
iqr | 13.5 | 12 |
Ĺrednio zawodnik mĹyna waĹźyĹ prawie 20 kg wiÄcej od zawodnika ataku (w przypadku mediany jest to dokĹadnie 20 kg wiÄcej). ZmiennoĹÄ mierzona wielkoĹciÄ odchylenia standardowego oraz IQR jest w obu grupach podobna.
Do porĂłwnania wielu rozkĹadĂłw szczegĂłlnie uĹźyteczny jest wykres zwany pudeĹkowym (box-plot)
Konstrukcja pudeĹka na wykresie: gĂłrny/dolny bok rĂłwny kwartylom, a linia pozioma w Ĺrodku pudeĹka rĂłwna medianie; linie pionowe (zwane wÄ sami) majÄ dĹugoĹÄ rĂłwnÄ \(Q_1 - 1,5 \textrm{IQR}\) oraz \(Q_3 + \textrm{IQR}\) (dla przypomnienia: \(Q_1\), \(Q_3\) to kwartyle, zaĹ \(\textrm{IQR}\) to odstÄp miÄdzy kwartlowy); Linia pozioma w poĹowie pudeĹka okreĹla przeciÄtny poziom zjawiska; wysokoĹÄ pudeĹka/wÄ sĂłw okreĹla zmiennoĹÄ (im wiÄksze wÄ sy/wysokoĹÄ tym wiÄksza zmiennoĹÄ). Obserwacje nietypowe (czyli takie ktĂłrych wartoĹÄ jest albo mniejsza od \(Q_1 - 1,5\textrm{IQR}\) albo wiÄksza od \(Q_3 + 1,5\textrm{IQR}\)) sÄ zaznaczane indywidualnie jako kropki nad/pod wÄ sami.
ZwrĂłÄ uwagÄ na sztuczkÄ: wartoĹci nietypowe nie sÄ definiowane jako (na przykĹad) gĂłrne/dolne 1% wszystkich wartoĹci (bo wtedy kaĹźdy rozkĹad miaĹby wartoĹci nietypowe); ale jako wartoĹci mniejsze/wiÄksze od \(Q_* \pm 1,5 \times \mathrm{IQR}\). Wszystkie wartoĹci rozkĹadĂłw o umiarkowanej zmiennoĹci mieszczÄ siÄ wewnÄ trz czegoĹ takiego.
Wykres pudeĹkowy dla zawodnikĂłw rugby w podziale na formacie ataku i mĹyna.
Z wykresu od razu widaÄ, ktĂłry rozkĹad ma wyĹźszÄ ĹredniÄ a ktĂłry wiÄksze rozproszenie.
PudeĹek moĹźe byÄ wiÄcej oczywiĹcie. PrzykĹadowo masa ciaĹa zawodnikĂłw na poszczegĂłlnych turniejach:
Od razu widaÄ, Ĺźe przeciÄtnie najciÄĹźszy zawodnicy byli na turnieju w roku 2019; najwiÄksze zróşnicowanie masy ciaĹa wystÄpowaĹo na turnieju w roku 2023.
Chcemy siÄ dowiedzieÄ czegoĹ na temat populacji (caĹoĹci) na podstawie prĂłby (czÄĹci tej caĹoĹci).
PrzykĹadowo chcemy oceniÄ ile wynosi Ĺrednia waga gĹĂłwki kapusty na 100 h polu. MoĹźna ĹciÄ Ä wszystkie i zwaĹźyÄ, ale moĹźna teĹź ĹciÄ Ä trochÄ (pobraÄ prĂłbÄ siÄ mĂłwi uczenie) zwaĹźyÄ i poznaÄ ĹredniÄ na caĹym polu z dobrÄ dokĹadnoĹciÄ .
W turnieju o Puchar Ĺwiata w rugby w 2015 roku uczestniczyĹo 623 rugbystĂłw. Znamy szczegĂłĹowe dane odnoĹnie wzrostu i wagi kaĹźdego uczestnika turnieju. Obliczamy (prawdziwÄ ) ĹredniÄ , odchylenie standardowe i wspĂłĹczynnik zmiennoĹci masy ciaĹa:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 65.0 93.0 103.0 102.8 113.0 145.0
Czyli Ĺrednio rugbysta na turnieju RWCâ2015 waĹźyĹ 102.80 kg
(Mean
na wydruku powyĹźej) a odchylenie standardowe
(s) wyniosĹo 12.92 kg.
Wykres (rozkĹad jest dwumodalny; bo w rugby sÄ dwie grupy zawodnikĂłw, wcale nie wszyscy > 110 kg):
Szacujemy ĹredniÄ na podstawie 2 zawodnikĂłw pobranych losowo
Powtarzamy eksperyment 1000 razy (dwĂłch bo dla jednego nie obliczmy wariancji)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 77.0 96.5 103.5 103.1 109.6 130.0
Ĺrednia (Ĺrednich z prĂłby) ma wartoĹÄ 103.10 a odchylenie standardowe 9.21. WartoĹÄ \(s/\sqrt{2}\) (odchylenie standardowe podzielone przez pierwiastek kwadratowy z liczebnoĹci prĂłby) jest rĂłwna 9.14. ZauwaĹźmy Ĺźe ta wartoĹÄ jest zbliĹźona do odchylenia standardowego uzyskanego w eksperymencie (9.21 vs 9.14)
szacujemy ĹredniÄ na podstawie 10 zawodnikĂłw pobranych losowo
Powtarzamy eksperyment 1000 razy
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 89.4 99.9 102.7 102.8 105.4 116.6
Ĺrednia wyszĹa 102.77 a odchylenie standardowe 4.14. WartoĹÄ \(s/\sqrt{10}\) jest rĂłwna 4.09.
szacujemy ĹredniÄ na podstawie 40 zawodnikĂłw pobranych losowo
Uwaga: 40 zawodnikĂłw to okoĹo 6.4% caĹego zbioru. Powtarzamy eksperyment 1000 razy
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 96.53 101.38 102.75 102.77 104.11 108.95
Ĺrednia jest rĂłwna 102.77 a odchylenie standardowe 1.97. WartoĹÄ \(s/\sqrt{40}\) jest rĂłwna 2.04.
Wykres
Podsumujmy eksperyment wykresem rozkĹadu wartoĹci Ĺrednich.
Wnioski z eksperymentu
WartoĹÄ ĹredniÄ wyznaczamy na podstawie jakiejĹ konkretnej metody. Wydaje siÄ na podstawie powyĹźszych eksperymentĂłw, Ĺźe z dobrym skutkiem moĹźemy jako metodÄ wykorzystaÄ ĹredniÄ -z-prĂłby.
W ogĂłlnoĹci metodÄ takÄ , formalnie funkcjÄ elementĂłw z prĂłby, nazywa siÄ w statystyce estymatorem. Warto to pojÄcie zapamiÄtaÄ. Wnioskujemy o wartoĹci parametru w populacji posĹugujÄ c siÄ estymatorem.
KontynuujÄ c wnioski z eksperymentu naleĹźy zauwaĹźyÄ, Ĺźe wszystkie Ĺrednie-ze-Ĺrednich (bez wzglÄdu na liczebnoĹÄ prĂłby) sÄ zbliĹźone do wartoĹci prawdziwej (to siÄ nazywa nieobciÄ ĹźonoĹÄ); MĂłwiÄ c innymi sĹowy jeĹźeli bÄdziemy oceniaÄ wartoĹÄ prawdziwej Ĺredniej na podstawie prĂłby, a naszÄ ocenÄ powtĂłrzymy wielokrotnie, to Ĺrednia bÄdzie zbliĹźona do wartoĹci prawdziwej (a nie np. niĹźsza czy wyĹźsza) Ta cecha jest niezaleĹźna od wielkoĹci prĂłby.
JeĹźeli roĹnie liczebnoĹÄ prĂłby to zmiennoĹÄ wartoĹci Ĺredniej-w-prĂłbie maleje, co za tym idzie prawdopodobieĹstwo, Ĺźe wartoĹÄ oceniona na podstawie Ĺredniej z prĂłby bÄdzie zbliĹźona do wartoĹci szacowanego parametru roĹnie (to siÄ nazywa zgodnoĹÄ). Co wiÄcej dobrym przybliĹźeniem zmiennoĹci Ĺredniej-w-prĂłbie jest prosta formuĹa \(s/\sqrt{n}\) gdzie \(n\) jest liczebnoĹciÄ prĂłby.
JeĹźeli mamy dwa estymatory do oszacowania parametru, oba sÄ nieobciÄ Ĺźone oraz zgodne, to ktĂłry wybraÄ? Ten ktĂłra ma mniejszÄ wariancjÄ. Taki estymator nazywa siÄ efektywny.
Estymator zatem powinien byÄ nieobciÄ Ĺźony, zgodny oraz efektywny (czyli mieÄ maĹÄ wariancjÄ). MoĹźna matematycznie udowodniÄ, Ĺźe jakiĹ estymator ma tak maĹÄ wariancjÄ, Ĺźe niemoĹźliwe jest wynalezienie czegoĹ jeszcze bardziej efektywnego. Takim estymatorem Ĺredniej w populacji jest Ĺrednia z prĂłbyâŚ
KonkretnÄ wartoĹÄ estymatora dla konkretnych wartoĹci prĂłby nazywamy ocenÄ (parametru)
W wyborach samorzÄ dowychych w Polsce w roku 2018 o mandat radnego sejmikĂłw wojewĂłdzkich ubiegaĹo siÄ 7076kandydatĂłw. Znamy szczegĂłĹowe dane odnoĹnie wieku kaĹźdego kandydata bo to zostaĹo publicznie podane przez PaĹstwowÄ KomisjÄ WyborczÄ . Obliczamy (prawdziwÄ ) ĹredniÄ , odchylenie standardowe i wspĂłĹczynnik zmiennoĹci wieku kandydatĂłw:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 34.00 46.00 46.24 58.00 91.00
Czyli Ĺrednio kandydat miaĹ 46.24 lat a odchylenie standardowe wieku wyniosĹo 14.61 lat.
Wykres (rozkĹad znowu jest dwumodalny z jakiĹ powodĂłw):
Szacujemy ĹredniÄ na podstawie 2 kandydatĂłw pobranych losowo
Powtarzamy eksperyment 1000 razy
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 19.50 39.00 47.00 46.84 54.00 74.50
Ĺrednia Ĺrednich z prĂłby ma wartoĹÄ 46.84 lat. Odchylenie standardowe wyniosĹo 10.23. WartoĹÄ \(s/\sqrt{2}\) jest rĂłwna 10.33.
Szacujemy ĹredniÄ na podstawie 10 kandydatĂłw pobranych losowo
Powtarzamy eksperyment 1000 razy.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 31.70 43.00 46.00 46.11 49.20 63.30
Ĺrednia Ĺrednich z prĂłby ma wartoĹÄ 46.11 lat. Odchylenie standardowe wyniosĹo 4.63. WartoĹÄ \(s/\sqrt{10}\) jest rĂłwna 4.62.
Szacujemy ĹredniÄ na podstawie 40 kandydatĂłw pobranych losowo
Uwaga: 40 kandydatĂłw to ok 0.6% caĹoĹci. Powtarzamy eksperyment 1000 razy.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 38.67 44.50 46.38 46.22 47.80 53.23
Ĺrednia Ĺrednich z prĂłby ma wartoĹÄ 46.22 lat. Odchylenie standardowe wyniosĹo 2.3409333. WartoĹÄ \(s/\sqrt{40}\) jest rĂłwna 2.3105373.
Szacujemy ĹredniÄ na podstawie 70 kandydatĂłw pobranych losowo
Uwaga: 70 kandydatĂłw to okoĹo ok 1% caĹoĹci (1000 powtĂłrzeĹ)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 39.74 45.14 46.34 46.32 47.54 51.27
Ĺrednia Ĺrednich z prĂłby ma wartoĹÄ 46.32 lat. Odchylenie standardowe wyniosĹo 1.7485628 WartoĹÄ \(s/\sqrt{70}\) jest rĂłwna 1.746602.
Wykres
Podsumujmy eksperyment wykresem rozkĹadu wartoĹci Ĺrednich.
Obserwujemy to samo co w przypadku wagi rugbystĂłw: im wiÄksza prĂłba tym dokĹadniejsza wartoĹÄ Ĺredniej wieku. Bez wzglÄdu na wielkoĹÄ prĂłby przeciÄtnie otrzymujemy prawdziwÄ wartoĹÄ Ĺredniej.
Wniosek: precyzja wnioskowania zwiÄksza siÄ wraz z liczebnoĹciÄ prĂłby; tym szybciej im rozproszenie w populacji generalnej jest mniejsze. Ĺťeby z duĹźÄ dokĹadnoĹciÄ wnioskowaÄ o Ĺredniej dla duĹźej populacji wcale nie trzeba pobieraÄ duĹźej prĂłby (w ostatnim przykĹadzie byĹo to 1% caĹoĹci).
RozkĹad empiryczny zmiennej to przyporzÄ dkowanie kolejnym wartoĹciom zmiennej odpowiadajÄ cych im liczebnoĹci.
ZaĹóşmy Ĺźe istnieje zapotrzebowanie spoĹeczne na wiedzÄ na temat ryzyka Ĺrednich opóźnieĹ. MoĹźemy to jak widaÄ Ĺatwo liczyÄ ale jednoczeĹnie jest to kĹopotliwe. NaleĹźy do tego mieÄ zbiĂłr 272 tys liczb. RozkĹad teoretyczny to matematyczne uogĂłlnienie rozkĹadu empirycznego. Jest to model matematyczny operujÄ cy pojÄciem (ĹciĹle sformalizowanym) prawdopodobieĹstwa (zamiast liczebnoĹci). RozkĹad teoretyczny jest:
zbliĹźony do empirycznego jeĹźeli chodzi o wyniki (jest przybliĹźeniem empirycznego)
jest zdefiniowany za pomocÄ kilku liczb; nie ma potrzeby korzystania z liczebnoĹci
Ĺťeby byĹo ciekawiej istnieje dokĹadnie jeden rozkĹad teoretyczny, ktĂłry z dobrÄ dokĹadnoĹciÄ opisuje rozkĹady empiryczne bÄdÄ ce wynikiem powyĹźszej zabawy. Ten rozkĹad (zwany normalnym) zaleĹźy tylko od dwĂłch parametrĂłw: Ĺredniej i rozproszenia, gdzie Ĺrednia bÄdzie rĂłwna (prawdziwej) Ĺredniej w populacji a rozproszenie wartoĹci rozproszenia w populacji podzielonej przez pierwiastek z wielkoĹci prĂłby.
Dla prĂłby 40-elementowej (wiek kandydatĂłw) wyglÄ da to tak:
dla prĂłby 70-elementowej tak:
Prawda, Ĺźe wynik jest caĹkiem dobry? TeoretycznoĹÄ czerwonej krzywej polega na tym, Ĺźe ona zawsze bÄdzie identyczna, podczas gdy histogram bÄdzie róşny. GdybyĹmy powtĂłrzyli nasz eksperyment (generowania 1000 losowych prĂłb przypominam), to zapewne trochÄ by siÄ róşniĹ, bo byĹmy wylosowali inne wartoĹci do prĂłb. Ta teoretyczna abstrakcja nazywa siÄ prawdopodobieĹstwem. RzucajÄ c monetÄ 1000 razy spodziewamy siÄ po 500 orĹĂłw i reszek, co w modelu matematycznym bÄdzie opisane jak: prawdopodobieĹstwo wyrzucenia orĹa wynosi 0,5. Rzucanie monetÄ to bardzo prosty eksperyment; nasz z liczeniem Ĺredniej wieku jest bardziej skomplikowany wiÄc miĹo jest siÄ dowiedzieÄ, Ĺźe uĹźywajÄ c czerwonej krzywej moĹźna Ĺatwo obliczyÄ jak bardzo prawdopodobne jest na przykĹad popeĹnienie bĹÄdu wiÄkszego niĹź 10% Ĺredniej, albo wiÄkszego niĹź 0,1 lat. Albo jak duĹźa powinna byÄ prĂłba Ĺźeby ten bĹÄ d byĹ nie wiÄkszy niĹź 0,1 lat.
Interpretacja wartoĹci rozkĹadu empirycznego zwykle jest w kategoriach ryzyka/szansy czy prawdopodobieĹstwa. PrzykĹadowo interesuje nas prawdopodobieĹstwo, Ĺźe kandydat ma mniej niĹź 30 lat. Takich kandydatĂłw jest 1091 a wszystkich kandydatĂłw dla przypomnienia jest 7076. Iloraz tych wartoĹci bÄdzie interpretowany jako ryzyko/szansa/prawdopodobieĹstwo (wynosi ono 15.42%.)
Podobnie moĹźna obliczyÄ prawdopodobieĹstwo, Ĺźe wiek kandydata bÄdzie siÄ zawieraĹ w przedziale 50â60 lat. PoniewaĹź kandydatĂłw w wieku 50â60 lat jest 1570, to szukane prawdopodobieĹstwo jest rĂłwne: 22.19%.)
JeĹźeli zamiast rozkĹadu empirycznego bÄdziemy uĹźywaÄ rozkĹad normalnego, ktĂłry jak widzimy jest jego dobrym przybliĹźeniem, to nie musimy liczyÄ empirycznych liczebnoĹci. Wystarczy Ĺźe znamy ĹredniÄ i odchylenie standardowe a potrafimy obliczyÄ kaĹźde prawdopodobieĹstwo dla kaĹźdego przedziaĹu wartoĹci zmiennej.
W szczegĂłlnoĹci dla rozkĹadu normalnego prawdopodobieĹstwo \(m \pm s\) (przyjÄcie wartoĹci z przedziaĹu Ĺrednia plus/minus odchylenie standardowe) wynosi okoĹo 0,68 prawdopodobieĹstwo \(m \pm 2 \times s\) wynosi okoĹo 0,95 a \(m \pm 3 \times s\) okoĹo 0,997. Czyli w przedziale \([-3s < m, m +3s]\) znajdujÄ siÄ praktycznie wszystkie wartoĹci rozkĹadu. Albo innymi sĹowy przyjÄcie wartoĹci spoza przedziaĹu Ĺrednia plus/minus trzykrotnoĹÄ odchylenia standardowego jest bardzo maĹo prawdopodobna.
RozkĹad normalny bÄdzie identyczny dla wagi rugbystĂłw, wieku czy czasu opóźnieĹ. UogĂłlnieniem teoretycznym pojÄcia zmiennej statystycznej, ktĂłre do tej pory uĹźywaliĹmy jest zmienna losowa, zmienna ktĂłrej wartoĹci sÄ liczbami a realizujÄ siÄ z okreĹlonym prawdopodobieĹstwem np. okreĹlonym przez rozkĹad normalny.
AnalizujÄ c dane uzyskane z prĂłby celem jest ich uogĂłlnienie na caĹÄ populacjÄ. Przypominamy, Ĺźe wnioskujemy o wartoĹci parametru w populacji posĹugujÄ c siÄ estymatorem. W przypadku wnioskowania o Ĺredniej estymatorem jest Ĺrednia-z-prĂłby. Dobrze by byĹo wiedzieÄ jak bardzo wiarygodna jest ta wartoĹÄ (zwana ocenÄ parametru) uzyskana na podstawie konkretnego estymatora, inaczej mĂłwiÄ c jak duĹźo mogliĹmy siÄ pomyliÄ.
Do oceny tej wiarygodnoĹci moĹźna uĹźyÄ wariancji-Ĺredniej-z-prĂłby (ktĂłra nazywa siÄ wariancjÄ bĹÄdu albo error variance) JeĹźeli wariancja bĹÄdu jest duĹźa, to w pojedynczej prĂłbie mogÄ wystÄ piÄ wartoĹci znacznie róşniÄ ce siÄ od prawdziwej Ĺredniej; jeĹźeli jest maĹa to takie bardzo róşniÄ ce siÄ od prawdziwej Ĺredniej wartoĹci majÄ maĹe szanse na zaistnienie. Do tego w przypadku rozkĹadu normalnego wiemy ze wariancja bĹÄdu = \(s/\sqrt(n)\) (gdzie \(s\) jest wariancjÄ w populacji a \(n\) wielkoĹciÄ prĂłby.)
W ramach wnioskowania stosowane sÄ trzy metody (podejĹcia):
Estymacja punktowa,
Estymacja przedziaĹowa,
Testowanie hipotez.
Szacujemy ĹredniÄ (inny parametr) i tÄ wartoĹÄ uznajemy za wartoĹÄ prawdziwÄ ; dokĹadnoĹÄ szacunku jest nieokreĹlona. Inaczej mĂłwiÄ c wartoĹÄ estymatora dla konkretnej prĂłby przyjmujemy za ocenÄ parametru.
Nie moĹźna ustaliÄ prawdopodobieĹstwa popeĹnienia bĹÄdu dla dokĹadnej wartoĹci parametru (co wynika z wĹaĹciwoĹci matematycznych modelu) ale moĹźna dla dowolnego przedziaĹu odâdo.
Czyli nie moĹźna ustaliÄ, Ĺźe z prawdopodobieĹstwem 95% oszacujemy wartoĹÄ ĹredniÄ czegoĹ jako 5,000000, ale moĹźna z prawdopodobieĹstwem 95% oszacowaÄ przedziaĹ w ktĂłrym znajdzie siÄ Ĺrednia (np Ĺźe bÄdzie to na przykĹad 4,9â5,1).
Estymacja przedziaĹowa to oszacowanie przedziaĹu wartoĹci od-do, ktĂłry z zadanym z gĂłry prawdopodobieĹstwem zawiera prawdziwÄ wartoĹÄ Ĺredniej.
Z gĂłry wyznaczone prawdopodobieĹstwo nazywa siÄ poziomem ufnoĹci (okreĹla jak czÄsto mamy siÄ NIE rÄ bnÄ Ä)
WiÄkszoĹÄ analiz statystycznych polega na porĂłwnaniu. W wyniku tego porĂłwnania otrzymujemy liczbÄ. ZaĹóşmy, Ĺźe mamy dwie prĂłby dotyczÄ ce wieku kandydatĂłw na radnych do sejmikĂłw wojewĂłdzkich z roku 2018 (Ĺrednia 46,1) oraz z roku 2014 (47,2). Róşnica wynosi 1,1 lat i moĹźe byÄ spowodowana bĹÄdem przypadkowym (tj. gdybyĹmy wylosowali jeszcze raz dwie prĂłby to wynik byĹby zupeĹnie odmienny np 46,9 vs 46,5) i/lub wynikaÄ z tego Ĺźe faktycznie w roku 2014 kandydaci byli starsi.
Formalnie stawiamy hipotezÄ Ĺźe róşnica Ĺrednich wynosi zero. Jest to tzw. hipoteza zerowa. NiezbÄdne jest takĹźe postawienie hipotezy alternatywnej ktĂłrÄ moĹźe byÄ proste zaprzeczenie zerowej. Zapisuje siÄ to nastÄpujÄ co:
\(H_0\): róşnica Ĺrednich wieku wynosi zero (\(m_1 = m_2\))
\(H_1\): róşnica Ĺrednich wieku jest róşna od zera (\(m_1 \not= m_2\))
Hipotezy sprawdzamy wykorzystujÄ c test statystyczny czyli funkcjÄ ktĂłrej wartoĹci zaleĹźÄ wartoĹci testowanych parametrĂłw (w tym przypadku \(m_1\) oraz \(m_2\))
Nie jest chyba wielkim zaskoczeniem Ĺźe testem dla róşnicy Ĺrednich jest róşnica Ĺrednich w prĂłbie. CaĹkiem zdroworozsÄ dkowo moĹźemy przyjÄ Ä, Ĺźe duĹźe róşnice ĹwiadczÄ na rzecz hipotezy alternatywnej a maĹe na rzecz hipotezy zerowej.
DuĹźa róşnica pomiÄdzy hipotezÄ a wynikiem z prĂłby moĹźe wynikaÄ
z tego Ĺźe pechowo trafiĹa nam siÄ nietypowa prĂłba, ktĂłry zdarza siÄ rzadko (rozkĹad normalny)
hipoteza jest faĹszywa, Ĺrednie majÄ innÄ wartoĹÄ niĹź zakĹadamy w \(H_0\)
Statystyk zawsze wybierze drugÄ wersjÄ. Pozostaje tylko ustaliÄ (dla statystyka) co to jest rzadko?
Rzadko to rzadziej niĹź z gĂłry ustalone prawdopodobieĹstwo otrzymania róşnicy ktĂłrÄ otrzymaliĹmy w prĂłbie lub wiÄkszej (coĹ jak zaĹoĹźenie Ĺźe zrealizowaĹ siÄ najlepszy z najgorszych scenariuszy).
Przyjmijmy przykĹadowo Ĺźe prawdopodobieĹstwo wystÄ pienia róşnicy 1,1 lat (i wiÄkszej) oszacowane na podstawie odpowiedniego modelu matematycznego (rozkĹad normalny) wynosi 0,3 co znaczy Ĺźe coĹ takiego zdarza siÄ wzglÄdnie czÄsto â trzy razy na 10 pobranych prĂłb.
ZaĹóşmy z kolei Ĺźe, ta róşnica wyniosĹa 3,2 lata. PrawdopodobieĹstwo wystÄ pienia takiej róşnicy (i wiÄkszej) wynosi 0,009 co znaczy Ĺźe coĹ takiego zdarza siÄ wzglÄdnie rzadko â 9 razy na tysiÄ c prĂłb.
PrzyjmujÄ c, Ĺźe moĹźemy siÄ myliÄ 5 razy na 100 w pierwszym przypadku statystyk powie Ĺźe nie ma podstaw do odrzucenia hipotezy \(H_0\). Róşnica 1,1 lat wynika z przypadku. W drugim wypadku powie Ĺźe hipoteza jest faĹszywa bo zdarzyĹo siÄ coĹ co nie powinno siÄ zdarzyÄ.
PrawdopodobieĹstwo ,,graniczneââ ustalamy z gĂłry i nazywa siÄ ono poziomem istotnoĹci. OkreĹla ono jak czÄsto moĹźemy siÄ rÄ bnÄ Ä odrzucajÄ c hipotezÄ zerowÄ ktĂłra jest prawdziwa.
Ale jest jeszcze drugi przypadek popeĹnienia bĹÄdu: przyjmujemy hipotezÄ ktĂłra jest faĹszywa. W testach statystycznych nie okreĹla siÄ tego prawdopodobieĹstwa a w zwiÄ zku z tym nie moĹźna przyjÄ Ä hipotezy zerowej (bo nie znamy ryzyka popeĹnienia bĹÄdu).
W konsekwencji hipotezÄ zerowÄ albo siÄ odrzuca albo nie ma podstaw do odrzucenia. Wniosek cokolwiek niekonkluzywny ale tak jest.
Dlatego teĹź czÄsto ,,opĹaca siÄââ odrzuciÄ hipotezÄ zerowÄ , bo taki rezultat jest ,,bardziej konkretnyââ.
Estymator (nieobciÄ Ĺźony, zgodny, efektywny): funkcja na wartoĹciach prĂłby ktĂłra sĹuĹźy do oszacowania parametru. Estymator Ĺredniej wartoĹci
Ocena (parametru); konkretna wartoĹÄ estymatora dla pewnej prĂłby.
RozkĹad (prawdopodobieĹstwa)
Estymacja (punktowa, przedziaĹowa)
Wnioskowanie statystyczne
Hipoteza statystyczna
Test statystyczny
Poziom istotnoĹci (testu); oznaczany jako \(\alpha\); zwykle 0,05
Poziom ufnoĹci; prawdopodobieĹstwo, Ĺźe przedziaĹ ufnoĹci zawiera prawdziwÄ wartoĹÄ parametru; oznaczany jako \(1- \alpha\); zwykle 0,95
PomiÄdzy zjawiskami wystÄpujÄ zwiÄ zki (zaleĹźnoĹci.) Nauki formuĹujÄ te zwiÄ zki w postaci praw. Jak takie prawo naukowe powstaje? Typowo w dwu etapach, najpierw za pomocÄ dedukcji stawia siÄ hipotezÄ, potem konfrontuje siÄ hipotezÄ z danymi (podejĹcie hipotetyczno-dedukcyjne). Na tym drugim etapie uĹźywa siÄ statystyki (lub matematyki jeĹźeli prawo ma charakter deterministyczny)
UpraszczajÄ c metoda hypodedukcji sprowadza siÄ do dedukcyjnego sformuĹowania hipotezy, ktĂłra nastÄpnie jest empirycznie falsyfikowana, tj. prĂłbuje siÄ wykazaÄ, Ĺźe jest ona nieprawdziwa. Konsekwencje: nie moĹźna dowieĹÄ prawdziwoĹci Ĺźadnej hipotezy, moĹźna natomiast wykazaÄ, Ĺźe hipoteza jest faĹszywa.
ZwiÄ zki miÄdzy cechami mogÄ byÄ: funkcyjne (nauki przyrodnicze) â wartoĹciom jednej zmiennej odpowiada tylko jedna wartoĹÄ drugiej zmiennej lub stochastyczne â wartoĹciom jednej zmiennej odpowiadajÄ z pewnym przybliĹźeniem wartoĹci innej zmiennej.
Problem: czy istnieje zwiÄ zek (zaleĹźnoĹÄ) pomiÄdzy cechami? Dla uproszczenie pomiÄdzy dwoma cechami, np. czy istnieje zwiÄ zek pomiÄdzy paleniem a chorobÄ nowotworowÄ , wiekiem a prawdopodobieĹstwem zgonu z powodu COVID19 itd
Jaki jest charakter zaleĹźnoĹci? Jaka jest siĹa zaleĹźnoĹci?
Rodzaj metod zastosowanej do empirycznej weryfikacji zaleĹźy w szczegĂłlnoĹci od sposobu pomiaru danych (nominalne, porzÄ dkowe, liczbowe.)
Ryzyko to udziaĹ (iloraz) liczby sukcesĂłw do liczby prĂłb (zdarzeĹ pozytywnych/wyróşnionych do wszystkich). Zwykle podawany w procentach. Warto zauwaĹźyÄ Ĺźe jest to empiryczny odpowiednik prawdopodobieĹstwa.
PrzykĹad: Podawanie witaminy C a przeziÄbienie/brak przeziÄbienia
Eksperyment przeprowadziĹ Linus Pauling (laureat nagrody Nobla za odkrycie witaminy C).
Eksperyment Paulinga polegaĹ na tym, Ĺźe podzieliĹ 280 narciarzy na dwie grupy po 140 osĂłb; przez 5â7 dni podawaĹ witaminÄ C jednej grupie oraz placebo drugiej grupie; obserwowaĹ zachorowania na przeziÄbienie przez nastÄpne dwa tygodnie.
Jeden narciarz nie dokoĹczyĹ eksperymentu. Historia milczy dlaczego :-)
W eksperymencie Paulinga w grupie 139 narciarzy, ktĂłrym podano witaminÄ C (grupa C) zachorowaĹo 17, a w grupie 140 narciarzy ktĂłrym podano placebo (grupa P) zachorowaĹo 31. Zatem:
Prostymi miarami oceny siĹy zaleĹźnoĹci mogÄ byÄ: róşnica ryzyk (risk difference) ryzyko wzglÄdne (relative risk) oraz iloraz szans (odds ratio).
JeĹźeli \(r_e\) oznacza ryzyko w grupie eksperymentalnej (test group; grupa naraĹźona/exposed group), a \(r_k\) w grupie kontrolnej (control group; grupa nienaraĹźona/unexposed), to róşnica ryzyk to po prostu \(r_e - r_k\). W przykĹadzie bÄdzie to -9,94% Ta miara aczkolwiek prosta jest rzadko stosowana.
Znacznie czÄĹciej uĹźywa siÄ ryzyka wzglÄdnego definiowanego jako \(RR = r_e/r_k\). W przykĹadzie bÄdzie to 12,2/22,14 = 0,55. Podanie witaminy C zmniejsza ryzyko o prawie poĹowÄ. Oczywiste jest Ĺźe \(RR < 1\) oznacza zmniejszenie ryzyka; \(RR > 1\) zwiÄkszenia a \(RR = 1\) oznacza brak zaleĹźnoĹci.
Zamiast ryzyka (czyli ilorazu liczby sukcesĂłw do liczby prĂłb) moĹźna uĹźywaÄ pojÄcia szansa/szansy (odds) definiowanego jako iloraz sukcesĂłw do poraĹźek.
PrzykĹadowo jeĹźeli w dwukrotnym rzucie monetÄ otrzymano orĹa i reszkÄ to ryzyko otrzymania orĹa wynosi 1/2 = 0,5 a szansa otrzymania orĹa wynosi 1.
PrzykĹad: Narciarze Paulinga cd
Ryzyko zachorowania w grupie C wynosi 12,2 (jak wiemy); natomiast szansa, Ĺźe narciarz grupie C zachoruje wynosi 17/122 = 13,9%. (A w grupie P wynosi 28,44%)
Jak widaÄ dla duĹźych ryzyk (rzut monetÄ ) szansa róşni siÄ znacznie od prawdopodobieĹstwa, ale dla maĹych ryzyk obie miary majÄ zbliĹźonÄ wartoĹÄ.
JeĹźeli \(o_e\) oznacza szanse w grupie eksperymentalnej a \(o_k\) w grupie kontrolnej, to iloraz szans (odds ratio), jest definiowany jako stosunek \(\textrm{OR} = o_e/o_t\).
Zatem iloraz szans dla narciarzy wyniesie 13,9/28,44 = 0,48. Podanie witaminy C zmniejsza szansÄ na zachorowanie o ponad poĹowÄ. Albo 1/0,48 = 2,04, narciarz ktĂłry nie braĹ witaminy C ma ponad dwukrotnie wiÄkszÄ szansÄ na zachorowanie.
WĹaĹciwoĹci ilorazu szans:
Dane w badaniach wykorzystujÄ cych ryzyko/szanse majÄ czÄsto postaÄ tabeli dwudzielnej o wymiarach \(2\times 2\), ktĂłrÄ moĹźna przestawiÄ nastÄpujÄ co (a, b, c i d to liczebnoĹci):
sukces | poraĹźka | |
---|---|---|
grupa kontrolna | a | b |
grupa eksperymentalna | c | d |
Dla danych w tej postaci: \(RR = c(a+b)/a(c+d)\) oraz \(\textrm{OR} = (ad)/ (bc)\)
Dla duĹźej prĂłby moĹźna zaĹoĹźyÄ, Ĺźe \(\ln(RR)\) ma rozkĹad normalny o odchyleniu standardowym rĂłwnym:
\[se_{RR} (\ln(RR)) = \sqrt{1/a + 1/c - 1/(a+b) - 1/(c+d)},\]
stÄ d 95% przedziaĹ okreĹlony jest przez:
\[rr - 1,96 se_{RR} < \ln(RR) < RR + 1,96 se_{RR},\] albo po przeksztaĹceniu:
\[\exp(\ln(RR) \pm 1,96 se_{RR})\]
(dla przypomnienia \(\exp(x)\) to \(e^x\))
Dla duĹźej prĂłby moĹźna zaĹoĹźyÄ, Ĺźe \(\ln(OR)\) ma rozkĹad normalny o odchyleniu standardowym rĂłwnym: \(se_{OR} (\ln(OR)) = \sqrt{1/a + 1/b + 1/c + 1/d}\), stÄ d 95% przedziaĹ okreĹlony jest przez: \(OR - 1,96 se_{OR} < \ln(OR) < OR + 1,96 se_{OR}\), albo po przeksztaĹceniu: \(\exp(\ln(OR) \pm 1,96 se_{OR})\).
JeĹźeli przedziaĹ ufnoĹci zawiera 1 to Ĺwiadczy to o braku zaleĹźnoĹci (na 95% poziomie ufnoĹci).
PrzykĹadowo (kontynuujÄ c eksperyment Paulinga)
\(\ln(OR) = \ln(0,48) = -0.7339691\) oraz \(se_{OR} (\ln(OR)) = 0.3293214\) stÄ d \(-0,7339691 \pm 1,96 \cdot 0.3293214\).
KoĹce przedziaĹĂłw: [-1.379439044; -0.0884991560];
Ostatecznie: [0,2517; 0,9153]
PrzedziaĹ nie zawiera 1; zatem branie witaminy C zmniejsza szanse na zachorowanie; albo zwiÄksza na niezachorowanie od \(1/25 = 4\) do \(1/0,9 = 1,1\). Ĺťeby to zabrzmiaĹo Ĺadnie i po polsku. ZwiÄksza na niezachorowanie od 300% do 10%.
ĹÄ czny rozkĹad dwĂłch lub wiÄkszej liczby zmiennych moĹźna przedstawiÄ w tabeli. Taka tabela nazywa siÄ dwudzielcza (dla dwĂłch zmiennych) lub wielodzielcza albo wielodzielna (dla wiÄcej niĹź dwĂłch liczby zmiennych.) Inne nazwy tych tabel to krzyĹźowe albo kontyngencji (cross-tabulation, contingency two-way tables.)
Ograniczmy siÄ do analizy tabel dwudzielnych.
PrzykĹad: Narciarze Paulinga jeszcze raz
Eksperyment Paulinga moĹźna przedstawiÄ w postaci tablicy dwudzielczej (P/C oznacza czy narciarz zaĹźywaĹ witaminÄ czy placebo; cold/nocold czy zachorowaĹ czy nie zachorowaĹ na katar):
nocold | cold | razem | |
---|---|---|---|
C | 122 | 17 | 139 |
P | 109 | 31 | 140 |
Sum | 231 | 48 | 279 |
Taka tabela skĹada siÄ z wierszy i kolumn. Dolny wiersz (Sum czyli Razem po polsku) zawiera ĹÄ cznÄ liczebnoĹÄ dla wszystkich wierszy w danej kolumnie. Podobnie prawa skrajna kolumna zawiera ĹÄ cznÄ liczebnoĹÄ dla wszystkich kolumn dla danego wiersza. Dolny wiersz/PrawÄ kolumnÄ nazywamy rozkĹadami brzegowymi. PozostaĹe kolumny/wiersze (ale bez wartoĹci ĹÄ cznych) nazywane sÄ rozkĹadami warunkowymi. RozkĹadĂłw warunkowych jest tyle ile wynosi iloczyn \(r \times c\) gdzie \(r\) to liczba wariantĂłw jednej cechy a \(c\) to liczba wariantĂłw drugiej cechy.
Przy warunku Ĺźe narciarz braĹ witaminÄ C, 122 takich osĂłb nie zachorowaĹo (nocold) a 17 zachorowaĹo (cold). Drugi rozkĹad warunkowy: 109 narciarzy, ktĂłrzy brali placebo nie zachorowaĹo, a 31 zachorowaĹo. SÄ takĹźe rozkĹady warunkowe dla drugiej cechy. W grupie narciarzy, ktĂłrzy zachorowali 122 braĹo witaminÄ C, a 109 braĹo placebo. Wreszcie w grupie narciarzy, ktĂłrzy nie zachorowali 109 braĹo witaminÄ C, a 31 braĹo placebo. RozkĹadĂłw warunkowych jest 4 bo obie cechy majÄ po dwa warianty. Jest to najmniejsza moĹźliwa tabela wielodzielcza.
Zamiast liczebnoĹci moĹźna posĹugiwaÄ siÄ odsetkami (procentami):
N | Y | Sum | |
---|---|---|---|
C | 43.7276 | 6.09319 | 49.82079 |
P | 39.0681 | 11.11111 | 50.17921 |
Sum | 82.7957 | 17.20430 | 100.00000 |
Narciarzy ktĂłrzy brali witaminÄ C nie nie zachorowali stanowi 43.7275986% wszystkich narciarzy. MaĹo przydatneâŚ
Ciekawsze jest obliczenie procentĂłw kaĹźdego wiersza osobno, tj. dzielimy liczebnoĹci w kaĹźdej kolumnie przez liczebnoĹci rozkĹadu brzegowego (wartoĹci ostatniej kolumny):
N | Y | ||
---|---|---|---|
C | 87.76978 | 12.23022 | 100 |
P | 77.85714 | 22.14286 | 100 |
n.m | 82.79570 | 17.20430 | 100 |
OtrzymaliĹmy ryzyka zachorowania na katar (lub nie zachorowania). Ryzyko zachorowania dla caĹej grupy wynosi 17.2043011% a nie zachorowania 82.7956989%. Jest przyznajmy caĹkiem zdroworozsÄ dkowym zaĹoĹźeniem (uczenie hipotezÄ statystycznÄ ), Ĺźe jeĹźeli przyjmowanie witaminy nie ma zwiÄ zku z zachorowaniem lub nie na katar, to w grupie tych co brali i tych co nie brali powinniĹmy mieÄ identyczne rozkĹady warunkowe rĂłwne rozkĹadowi brzegowemu. Czyli powinno przykĹadowo zachorowaÄ 17.2043011% narciarzy, ktĂłrzy brali witaminÄ C a widzimy , Ĺźe zachorowaĹo jedynie 12.2302158%.
Na oko ksiÄgowego witamina C dziaĹa (bo sÄ róşnice), ale dla statystyka liczy siÄ czy ta róşnica jest na tyle duĹźa, Ĺźe (z zaĹoĹźonym prawdopodobieĹstwem) moĹźna wykluczyÄ dziaĹanie przypadku.
Rozumowanie jest nastÄpujÄ ce: jeĹźeli prawdopodobieĹstwo wystÄ pienia tak duĹźej róşnicy jest maĹe, to cechy nie sÄ niezaleĹźne. Jest to istota i jedyny wniosek z czegoĹ co siÄ nazywa testem istotnoĹci-chi-kwadrat. Test chi-kwadrat porĂłwnuje liczebnoĹci tablicy wielodzielnej z idealnÄ -tablicÄ -wielodzielnÄ , ktĂłra zakĹada niezaleĹźnoĹÄ jednej zmiennej od drugiej.
MoĹźna udowodniÄ, Ĺźe taka tablica powstanie przez przemnoĹźenie dla kaĹźdego elementu tablicy odpowiadajÄ cych mu wartoĹci brzegowych a nastÄpnie podzieleniu tego przez ĹÄ cznÄ liczebnoĹÄ (czyli przykĹadowo pierwszy element poniĹźszej tablicy to 231 pomnoĹźone przez 139 i podzielone przez 279; proszÄ sprawdziÄ, Ĺźe jest to 115.0860215):
N | Y | Sum | |
---|---|---|---|
C | 115.086 | 23.91398 | 139 |
P | 115.914 | 24.08602 | 140 |
Sum | 231.000 | 48.00000 | 279 |
ProszÄ zwrĂłciÄ uwagÄ Ĺźe rozkĹady brzegowe sÄ identyczne, identyczna jest teĹź ĹÄ czna liczebnoĹÄ. RóşniÄ siÄ tylko rozkĹady warunkowe (ktĂłre nie sÄ liczbami caĹkowitami ale tak ma byÄânie jest to bĹÄ d)
Za pomocÄ testu Chi-kwadrat obliczamy jakie jest prawdopodobieĹstwo, wystÄ pienia tak duĹźych lub wiÄkszych róşnic. Wynosi ono 0.041864. Czyli wystÄ pienie tak duĹźych róşnic pomiÄdzy oczekiwanymi (przy zaĹoĹźeniu o niezaleĹźnoĹci zmiennych) liczebnoĹciami a obserwowanymi liczebnoĹciami zdarza siÄ okoĹo 4 razy na 100.
Jeszcze raz przypominamy ideÄ testu: jeĹźeli prawdopodobieĹstwo zaobserwowanych róşnic jest maĹe to zakĹadamy Ĺźe
albo mamy pecha i piÄÄ razy podrzucajÄ c monetÄ zawsze nam spadĹa reszka (prawdopodobieĹstwo okoĹo 0,03), albo
Ĺźe zaĹoĹźenie co do niezaleĹźnoĹci jest faĹszywe.
Statystyk zawsze wybierze drugie. Pozostaje tylko ustalenie co to znaczy maĹe.
MaĹe to takie ktĂłre jest mniejsze od arbitralnie przyjÄtego przez statystyka. Zwykle jest to 0,05 lub 0,01 (czasami 0,1) co oznacza Ĺźe odrzucajÄ c zaĹoĹźenie o braku zwiÄ zku pomiÄdzy katarem a braniem witaminy C pomylimy siÄ piÄÄ lub raz na 100.
Uwaga: proszÄ zwrĂłciÄ uwagÄ Ĺźe wniosek z testu niezaleĹźnoĹci jest sĹabszy niĹź z porĂłwania ryzyk. Tam mamy informacjÄ Ĺźe zaleĹźnoĹÄ istnieje i oszacowanÄ jej wielkoĹÄ (np. za pomocÄ ryzyka wzglÄdnego) tutaj tylko zweryfikowaliĹmy fakt czy obie zmienne sÄ niezaleĹźne czy teĹź nie.
PrzykĹad: palenie a status spoĹeczno-ekonomiczny
Dla pewnej grupy osĂłb odnotowujemy ich status-spoĹeczno-ekonomiczny (wysoki/high, Ĺredni/middle, niski/low) oraz status-wzglÄdem-palenia (wartoĹci: pali/current, paliĹ-nie-pali/former, nigdy-nie-paliĹ/never). Obie zmienne sÄ nominalne, obie majÄ po trzy wartoĹci. MoĹźna poklasyfikowaÄ wszystkich badanych w nastÄpujÄ cy sposĂłb:
High | Low | Middle | Sum | |
---|---|---|---|---|
current | 51 | 43 | 22 | 116 |
former | 92 | 28 | 21 | 141 |
never | 68 | 22 | 9 | 99 |
Sum | 211 | 93 | 52 | 356 |
Uwaga: status-spoĹeczno-ekonomiczny to powiedzmy miara prestiĹźu uĹźywana w socjologii (moĹźna na Wikipedii doczytaÄ co to dokĹadnie jest)
Tym razem tabela skĹada siÄ z 3 wierszy i 3 kolumn (ostatni wiersz/kolumna siÄ nie liczÄ bo to sumyârozkĹady brzegowe)
Przedstawmy tÄ tabelÄ w postaci udziaĹow procentowych sumujÄ cych siÄ dla kaĹźdego wiersza osobno do 100% (tj. dzielimy liczebnoĹci w kaĹźdej kolumnie przez liczebnoĹci rozkĹadu brzegowego (wartoĹci ostatniej kolumny):
High | Low | Middle | ||
---|---|---|---|---|
current | 43.96552 | 37.06897 | 18.965517 | 100 |
former | 65.24823 | 19.85816 | 14.893617 | 100 |
never | 68.68687 | 22.22222 | 9.090909 | 100 |
n.m | 59.26966 | 26.12360 | 14.606742 | 100 |
Rozumowanie jest identyczne jak dla narciarzy Pauliga. JeĹźeli nie ma zaleĹźnoĹci pomiÄdzy paleniem a statusem to procenty w ostatnim wierszu powinny byÄ identyczne jak w wierszach 1â3 (nagĹĂłwka nie liczymy). Tym idealnym procentom odpowiadajÄ nastÄpujÄ ce liczebnoĹci:
High | Low | Middle | Sum | |
---|---|---|---|---|
current | 68.75281 | 30.30337 | 16.94382 | 116 |
former | 83.57022 | 36.83427 | 20.59551 | 141 |
never | 58.67697 | 25.86236 | 14.46067 | 99 |
Sum | 211.00000 | 93.00000 | 52.00000 | 356 |
WartoĹÄ prawdopodobieĹstwa dla testu chi-kwadrat okreĹlajÄ ca, Ĺźe przy zaĹoĹźeniu niezaleĹźnoĹci obu zmiennych tak duĹźa róşnica miÄdzy liczebnoĹciami rzeczywistymi a idealnymi (porĂłwnaj stosowne tabele wyĹźej) jest dzieĹem przypadku wynosi 0.000981. Jest to prawdopodobieĹstwo tak maĹe, Ĺźe statystyk odrzuca zaĹoĹźenie o niezaleĹźnoĹci statusu i palenia (mylÄ c siÄ w przybliĹźeniu 0.000981 â raz na tysiÄ c)
Obliczamy Ĺrednie wartoĹci zmiennej liczbowej w grupach okreĹlonych przez wartoĹci zmiennej nominalnej, np wypalenie zawodowe w podziale na miejsce pracy. Grup moĹźe byÄ dwie lub wiÄcej
Stawiamy hipotezÄ Ĺźe wartoĹci Ĺrednie w kaĹźdej grupie sÄ rĂłwne, wobec hipotezy alternatywnej Ĺźe tak nie jest (Ĺźe sÄ róşne jeĹźeli grup jest dwie; co najmniej jedna jest róşna jeĹźeli grup jest wiÄcej niĹź dwie). Stosujemy odpowiedni test statystyczny:
jeĹźeli liczba grup wynosi 2 oraz moĹźna przyjÄ Ä zaĹoĹźenie o przybliĹźonej normalnoĹci rozkĹadĂłw, to stosujemy test \(t\)-Studenta (dla prĂłb niezaleĹźnych),
jeĹźeli liczba grup wynosi 2, ale nie moĹźna zaĹoĹźyÄ normalnoĹci rozkĹadĂłw to stosujemy test U-Manna-Whitneya
jeĹźeli liczba grup jest wiÄksza niĹź dwie oraz moĹźna przyjÄ Ä zaĹoĹźenie o normalnoĹci rozkĹadĂłw to stosujemy test pn. ANOVA
jeĹźeli liczba grup jest wiÄksza od dwĂłch oraz nie moĹźna przyjÄ Ä zaĹoĹźenia o normalnoĹci rozkĹadĂłw, to stosujemy test Kruskall-Wallisa
PowyĹźsze w postaci diagramu ze strzaĹkami przedstawiono na rysunku
Test stosujemy jeĹźeli porĂłwnujemy dwie Ĺrednie oraz moĹźna przyjÄ Ä zaĹoĹźenie Ĺźe rozkĹad wartoĹci w obu grupach jest normalny.
PrzykĹad: Poziom depresji a miejsce pracy
Studenci pielÄgniarstwa i ratownictwa PSW w 2023 roku wypeĹnili ankietÄ zawierajÄ cÄ test depresji Becka, mierzÄ cy poziom depresji (wartoĹÄ liczbowa) oraz pytanie o rodzaj miejsca pracy (skala nominalna). PoniĹźej zestawiono Ĺrednie wartoĹci poziomu depresji w podziale na rodzaj miejsca pracy (szpital/przychodnia)
m-pracy | Ĺrednia | n |
---|---|---|
Przychodnia | 7.833333 | 12 |
Szpital | 8.450549 | 91 |
Ĺrednie róşniÄ siÄ o 0.62. Pytanie czy to duĹźo czy maĹo?
Przyjmijmy (na razie bez sprawdzania), Ĺźe rozkĹady wartoĹci poziomu depresji w obu grupach sÄ (w przybliĹźeniu) normalne. MoĹźna zatem zastosowaÄ test \(t\)-Studenta
Grupa1 | Grupa2 | n1 | n2 | t | p |
---|---|---|---|---|---|
Przychodnia | Szpital | 12 | 91 | -0.3241142 | 0.749 |
PoniewaĹź wartoĹÄ \(p\) rĂłwna 0.749` jest wiÄksza od kaĹźdego zwyczajowo przyjmowanego poziomu istotnoĹci nie ma podstaw do odrzucenia hipotezy, Ĺźe Ĺrednie w obu grupach sÄ rĂłwne. Skoro tak, to w konsekwencji stwierdzamy Ĺźe pomiÄdzy poziomem depresji a miejscem pracy nie ma zaleĹźnoĹci.
Statystyk nie przyjmuje zaĹoĹźeĹ na sĹowo honoru. Kiedy zatem moĹźna przyjÄ Ä zaĹoĹźenie o normalnoĹci a kiedy nie? MoĹźna to oceniÄ na podstawie wykresu kwantylowego. Oraz posĹugujÄ c siÄ testem Shapiro-Wilka (bo Statystycy na kaĹźde pytanie majÄ zawsze jakiĹ stosowny test)
PrzykĹad: Poziom depresji a miejsce pracy
Wykres kwantylowy dla poziomu depresji wyglÄ da jak na poniĹźszym rysunku
Prosta odpowiada teoretycznym wartoĹciom kwantyli rozkĹadu poziomu depresji przy zaĹoĹźeniu Ĺźe majÄ one rozkĹad normalny. Punkty odpowiadajÄ zaobserwowanym wartoĹciom kwantyli. Im bardziej punkty nie pokrywajÄ siÄ z prostÄ (zwĹaszcza na skrajach rozkĹadu) tym mniej wierzymy, Ĺźe rozkĹad jest normalny.
W tym przypadku wyglÄ da, Ĺźe rozkĹad w grupie Szpital nie jest normalny. W grupie Przychodnia jest lepiej ale jednoczeĹnie to lepiej jest maĹo wiarygodne z uwagi na maĹÄ liczebnoĹÄ grupy (zaledwie 12).
Wizualne obserwacja moĹźna potwierdziÄ stosujÄ c test Shapiro-Wilka. Interpretacja tego testu jest âstandardowaâ, mianowicie maĹe wartoĹci \(p\) ĹwiadczÄ przeciwko hipotezie zerowej (Ĺźe rozkĹad jest Normalny)
m-pracy | statystyka | p |
---|---|---|
Przychodnia | 0.9256178 | 0.3359655 |
Szpital | 0.7865090 | 0.0000000 |
RozkĹad w grupie szpital
nie jest normalny. Nasze
zaĹoĹźenie co do normalnoĹci byĹo niepoprawne i naleĹźy do weryfikacji
hipotezy o rĂłwnoĹci Ĺredniej zamiast testu \(t\)-Studenta zastosowaÄ test U
Manna-Whitneya.
PrzykĹad: Poziom depresji a miejsce pracy
PoniewaĹź grup jest dokĹadnie 2 a rozkĹad nie jest normalny, stosujemy test U Manna-Whitneya.
Grupa1 | Grupa2 | n1 | n2 | U | p |
---|---|---|---|---|---|
Przychodnia | Szpital | 12 | 91 | 564.5 | 0.853 |
PrawdopodobieĹstwo wystÄ pienia tak duĹźej róşnicy przy zaĹoĹźeniu, Ĺźe Ĺrednie w obu grupach sÄ identyczne wynosi 0.853 (róşnica jest zatem nieistotna; obie Ĺrednie sÄ identyczneânie ma zaleĹźnoĹci)
JeĹźeli liczba grup jest wiÄksza niĹź dwie ale moĹźna przyjÄ Ä zaĹoĹźenie o normalnoĹci rozkĹadĂłw to stosujemy test ANOVA
PrzykĹad: Poziom depresji a staĹź pracy
W ankiecie, ktĂłrÄ
wypeĹnili Studenci pielÄgniarstwa i ratownictwa PSW
w 2023 roku byĹo teĹź pytanie o staĹź pracy. OryginalnÄ
liczbowÄ
wartoĹÄ
zmiennej staĹź zamieniono na zmiennÄ
w skali nominalnej o nastÄpujÄ
cych
czterech wartoĹciach: <6
(oznacza od 0 do 6 lat staĹźu
pracy), 07-12
(7â12 lat), 13-18
(13â18 lat)
oraz >19
(19 i wiÄcej lat.)
staĹź (kategoria) | Ĺrednia | n |
---|---|---|
07-12 | 7.857143 | 7 |
13-18 | 7.666667 | 12 |
<06 | 8.512821 | 39 |
>19 | 8.533333 | 45 |
ZakĹadajÄ c Ĺźe rozkĹady w grupach sÄ normalne, do weryfikacji hipotezy o rĂłwnoĹci wszystkich Ĺrednich moĹźemy zastosowaÄ test ANOVA.
WartoĹÄ \(p\) rĂłwna 0.988 Ĺwiadczy Ĺźe nie istotnych róşnic pomiÄdzy Ĺrednimi, co oznacza Ĺźe pomiÄdzy poziomem depresji a kategoriami staĹźu pracy nie ma zaleĹźnoĹci.
Czy zastosowanie testu ANOVA byĹo poprawne? Ĺťeby siÄ o tym przekonaÄ trzeba zastosowaÄ (znowu) test Shapiro-Wilka:
m-pracy | statystyka | p |
---|---|---|
07-12 | 0.8565271 | 0.1408865 |
13-18 | 0.7596157 | 0.0033736 |
<06 | 0.9008198 | 0.0023292 |
>19 | 0.6780397 | 0.0000000 |
Wobec takiego wyniku testu do oceny istotnoĹci róşnic naleĹźy zastosowaÄ bardziej ogĂłlny test Kruskalla-Wallisa
PrzykĹad: Poziom depresji a staĹź pracy
PrawdopodobieĹstwo tak duĹźych róşnic w Ĺrednich przy zaĹoĹźeniu, Ĺźe Ĺrednie we wszystkich grupach sÄ identyczne wynosi 0.678923 (róşnice sÄ zatem nieistotne; wszystkie Ĺrednie sÄ identyczneânie ma zaleĹźnoĹci)
W tym przypadku dobrze jest rozpoczÄ Ä analizÄ od wykresu
W ukĹadzie kartezjaĹskim kaĹźdej obserwacji odpowiada kropka o wspĂłĹrzÄdnych XY.
O wystÄpowaniu zwiÄ zku Ĺwiadczy ukĹadanie siÄ kropek wedĹug jakiegoĹ ksztaĹtu (krzywej). O braku zwiÄ zku Ĺwiadczy chmura punktĂłw niepodobna do Ĺźadnej krzywej.
Punkty ukĹadajÄ ce siÄ wedĹug prostej ĹwiadczÄ o zaleĹźnoĹci liniowej (wyjÄ tek: linia pozioma lub pionowa) Punkty ukĹadajÄ ce siÄ wedĹug krzywej ĹwiadczÄ o zaleĹźnoĹci nieliniowej.
PrzykĹad: ZaleĹźnoĹÄ pomiÄdzy zamoĹźnoĹciÄ a spoĹźyciem miÄsa
Organizacja NarodĂłw Zjednoczonych do spraw WyĹźywienia i Rolnictwa znana jako FAO udostÄpnia dane dotyczÄ ce konsumpcji ĹźywnoĹci na Ĺwiecie. Bank Ĺwiatowy udostÄpnia dane dotyczÄ ce dochodu narodowego.
Konsumpcja miÄsa jest mierzona jako Ĺrednia konsumpcja w kilogramach w kaĹźdym kraju (per capita siÄ mĂłwi); DochĂłd podobnie jako Ĺrednia wielkoĹÄ dochodu narodowego per capita. Dane dotyczÄ roku 2013.
Kowariancja to suma iloczynĂłw odchyleĹ wartoĹci zmiennych \(XY\) od ich wartoĹci Ĺrednich:
\[cov (xy) = \frac{1}{n} \sum_{i=1}^N (x - \bar x) (y - \bar y)\]
Kowariancja zaleĹźy od rozproszenia (im wiÄksze tym wiÄksza), ma teĹź dziwnÄ jednostkÄ (jednostkaX ¡ jednostkaY) oraz zaleĹźy od wybranych skal (tony vs gramy na przykĹad)
https://tinystats.github.io/teacups-giraffes-and-statistics/05_correlation.html
Dlatego do pomiaru zwiÄ zku pomiÄdzy cechami nie uĹźywa siÄ kowariancji, ale wspĂłĹczynnika korelacji (liniowej, Pearson linear correlation coefficient):
\[r_xy = cov(xy) / (S_x \cdot S_y)\]
WspĂłĹczynnik jest miarÄ niemianowanÄ , o wartoĹciach ze zbioru \([-1;1]\); Skrajne wartoĹci \(\pm 1\) ĹwiadczÄ o zwiÄ zku funkcyjnym (wszystkie punkty ukĹadajÄ siÄ na linii prostej); wartoĹÄ zero Ĺwiadczy o braku zwiÄ zku (linia pozioma/pionowa)
Interpretacja opisowa: wartoĹci powyĹźej 0,9 ĹwiadczÄ o silnej zaleĹźnoĹci
PrzykĹad: korelacja miÄdzy spoĹźyciem miÄsa a GDP
WspĂłĹczynnik korelacji liniowej wynosi 0.6823158 (umiarkowana korelacja).
Czy ta wartoĹÄ jest istotnie róşna od zera? Jest na to stosowny test statystyczny, ktĂłry sprowadza siÄ do okreĹlenia jakie jest prawdopodobieĹstwo otrzymania r = 0.6823158 przy zaĹoĹźeniu Ĺźe prawdziwa wartoĹÄ r wynosi zero. Otóş w naszym przykĹadzie to prawdopodobieĹstwo wynosi 3.850676e-26 (czyli jest ekstremalnie maĹe â r jest istotnie róşne od zera).
WstÄpnym etapem analizy zaleĹźnoĹci miÄdzy zmiennymi jest czÄsto hurtowa ocena wspĂłĹczynnikĂłw korelacji w postaci kwadratowej macierzy korelacji.
PrzykĹad: korelacja pomiÄdzy wiekiem, edukacjÄ , szczÄĹciem a stanem zdrowia
Mohammadi S. i inni badali zaleĹźnoĹÄ pomiÄdzy wiekiem, poziomem edukacji, szczÄĹciem a stanem zdrowia. (The relationship between happiness and self-rated health: A population-based study of 19499 Iranian adults; https://doi.org/10.1371/journal.pone.0265914)
## age edu Happiness Health
## age 1.00000000 -0.18341325501 0.04491863 0.00125622963
## edu -0.18341326 1.00000000000 0.07418519 -0.00003728405
## Happiness 0.04491863 0.07418519038 1.00000000 0.17863069296
## Health 0.00125623 -0.00003728405 0.17863069 1.00000000000
Albo w bardziej efektownej postaci tekstowo-graficznej:
Regresja liniowa zakĹada, Ĺźe istnieje zwiÄ zek przyczyna-skutek i ten zwiÄ zek moĹźna opisaÄ liniÄ prostÄ (stÄ d liniowa). Skutek jest jeden i nazywa siÄ go zmiennÄ zaleĹźnÄ a przyczyn moĹźe byÄ wiele i noszÄ nazwÄ zmiennych niezaleĹźnych (albo predyktorĂłw). W przypadku gdy zwiÄ zek dotyczy dwĂłch zmiennych mĂłwi siÄ o regresji prostej. PrzykĹadowo zaleĹźnoĹÄ pomiÄdzy spoĹźywaniem kawy w czasie sesji egzaminacyjnej a wynikiem egzaminu moĹźna formalnie zapisaÄ jako:
\[ \textrm{wynik} = b_0 + b_1 \cdot \textrm{kawa}\]
WspĂłĹczynnik \(b_1\) okreĹla wpĹyw spoĹźycia kawy na wynik egzaminu. W szczegĂłlnoĹci jeĹźeli \(b_1 = 0\) to nie ma zwiÄ zku miÄdzy spoĹźywaniem kawy a wynikiem egzaminu.
JeĹźeli zmiennych niezaleĹźnych jest wiÄcej niĹź jedna, to mĂłwimy o **regresji wielorakiej. PrzykĹadowo zaleĹźnoĹÄ pomiÄdzy wynikiem egzaminu, spoĹźyciem kawy czasem nauki oraz predyspozycjami opisuje nastÄpujÄ cy model regresji:
\[\textrm{wynik} = b_0 + b_1 \cdot \textrm{kawa} + b_2 \cdot \textrm{czas} + b_3 \cdot \textrm{predyspozycje} \]
WspĂłĹczynnik \(b_1\) okreĹla wpĹyw spoĹźycia kawy \(b_2\) czasu poĹwiÄconego na naukÄ, a \(b_3\) predyspozycji (intelektualnych, mierzonych np. ĹredniÄ ocenÄ ze studiĂłw)
RĂłwnianie regresji w ogĂłlnoĹci moĹźna zapisaÄ nastÄpujÄ co:
\[Y = b_0 + b_1 \cdot X_1 + e \]
\(Y = b_0 + b_1 \cdot X_1\) to czÄĹÄ deterministyczna, a \(e\) oznacza skĹadnik losowy. O tym skĹadniku zakĹadamy Ĺźe Ĺrednia jego wartoĹÄ wynosi zero. MoĹźna to sobie wyobraziÄ Ĺźe w populacji jest jakaĹ prawdziwa zaleĹźnoĹÄ \(Y = b_0 + b_1 \cdot X_1\) pomiÄdzy \(X\) a \(Y\), ktĂłra w prĂłbie ujawnia siÄ z bĹÄdem o charakterze losowym. Ten bĹÄ d moĹźe wynikaÄ z pominiÄcia jakiejĹ waĹźnej zmiennej (model to zawsze uproszczenie rzeczywistoĹci), przybliĹźonego charakteru linii prostej jako zaleĹźnoĹci pomiÄdzy \(X\) a \(Y\) (prosta ale nie do koĹca prosta) albo bĹÄdu pomiaru.
WspĂłĹczynnik \(a\) (nachylenia prostej) okreĹla wielkoĹÄ efektu w przypadku regresji, tj. siĹy zaleĹźnoĹci pomiÄdzy zmiennymi.
WspĂłĹczynnik \(a\) ma prostÄ interpretacjÄ: jeĹźeli wartoĹÄ zmiennej \(X\) roĹnie o jednostkÄ to wartoĹÄ zmiennej \(Y\) zmienia siÄ przeciÄtnie o \(b_1\) jednostek zmiennej Y. Wyraz wolny zwykle nie ma sensownej interpretacji (formalnie jest to wartoĹÄ zmiennej \(Y\) dla \(X=0\))
Oznaczmy przez \(y_i\) wartoĹci obserwowane (zwane teĹź empirycznymi) a przez \(\hat y_i\) wartoĹci teoretyczne (leĹźÄ ce na prostej linii regresji).
WartoĹci \(b_0\) oraz \(b_1\) wyznacza siÄ minimalizujÄ c:
\[\sum_{i=1}^N (\hat y_i - y_i)^2\]
PowyĹźsze kryterium minimalizacyjne oznacza, Ĺźe suma kwadratĂłw odchyleĹ wartoĹci empirycznych od wartoĹci teoretycznych ma byÄ minimalna. StÄ d metoda najwiÄkszych kwadratĂłw szacowania parametrĂłw linii regresji.
RozwiÄ zujÄ c powyĹźszy problem minimalizacyjny otrzymujemy wzory definiujÄ ce parametry \(b_0\) oraz \(b_1\). Przypominamy, Ĺźe estymatorem nazywamy metodÄ oszacowania parametru na podstawie prĂłby. PoniewaĹź traktujemy \(b_0\) oraz \(b_1\) jako parametry jakieĹ populacji generalnej to wzory na \(b_0\) oraz \(b_1\) statystyk nazwie estymatorami parametrĂłw \(b_0\) oraz \(b_1\). W konsekwencji tego \(b_0\)/\(b_1\) posiadajÄ jakÄ Ĺ wartoĹÄ ĹredniÄ oraz wariancjÄ.
Przypominamy Ĺźe wartoĹÄ Ĺrednia dobrego estymatora powinna wynosiÄ zero (bo wtedy nie ma bĹÄdu systematycznego) oraz Ĺźe wariancja estymatora powinna maleÄ wraz ze wzrostem liczebnoĹci prĂłby. MoĹźna udowodniÄ Ĺźe estymatory parametrĂłw \(b_0\)/\(b_1\) uzyskane metodÄ najmniejszych kwadratĂłw posiadajÄ obie wĹaĹciwoĹci.
Graficznie kryterium minimalizacyjne przedstawia rysunek
Suma podniesionych do kwadratu odlegĹoĹci pomiÄdzy czerwonymi i niebieskimi kropkami ma byÄ minimalna. Zadanie wyznaczenie parametrĂłw takiej prostej oczywiĹcie realizuje program komputerowy.
MoĹźna udowodniÄ Ĺźe bez wzglÄdu czy punkty na wykresie ukĹadajÄ siÄ w przybliĹźeniu wzdĹuĹź prostej czy nie, zawsze jakaĹ prosta zostanie dopasowana (jeĹźeli tylko punktĂłw jest wiÄcej niĹź dwa.)
W oczywisty sposĂłb regresja po lewej lepiej opisuje zaleĹźnoĹÄ (linia prosta jest bliĹźej wartoĹci zaobserwowanych) niĹź regresja po prawej. Jak to oceniÄ w sposĂłb bardziej konkretny a nie tylko na oko?
Ocena dopasowania: Ĺredni bĹÄ d szacunku
OznaczajÄ c resztÄ jako: \(e_i = y_i - \hat y_i\), definiujemy Ĺredni bĹÄ d szacunku (mean square error, MSE) jako:
\[S_e = \sqrt {\sum (e_i^2 / n - k)}\].
Gdzie \(n\) oznacza liczbÄ obserwacji (liczebnoĹÄ prĂłby), a \(k\) liczbÄ szacowanych parametrĂłw bez wyrazu wolnego czyli jeden w regresji prostej (a wiÄcej niĹź jeden w regresji wielorakiej o czym dalej.)
Przy okazji \(S_e^2\) nazywamy wariancjÄ resztowÄ .
Ocena dopasowania: wspĂłĹczynniki zbieĹźnoĹci i determinacji
Suma kwadratĂłw reszt (albo odchyleĹ wartoĹci teoretycznych od wartoĹci empirycznych, albo suma kwadratĂłw bĹÄdĂłw vel resztowa suma kwadratĂłw):
\[RSK = \sum (y_i - \hat y_i)^2\].
Suma kwadratĂłw odchyleĹ wartoĹci empirycznych od Ĺredniej (ogĂłlna suma kwadratĂłw):
\[OSK = \sum (y_i - \bar y)^2\]
Suma kwadratĂłw odchyleĹ wartoĹci teoretycznych od Ĺredniej (wyjaĹniona suma kwadratĂłw):
\[WSK = \sum (\hat y_i - \bar y)^2\]
MoĹźna wykazaÄ, Ĺźe \(OSK = WSK + RSK\).
WspĂłĹczynnik zbieĹźnoĹci to \(R^2 = WSK/OSK\).
WspĂłĹczynnik determinacji to \(\Phi^2 = RSK/OSK\).
WspĂłĹczynniki przyjmujÄ wartoĹÄ z przedziaĹu \([0,1]\) lub \([0, 100]\)%
Interpretacja wspĂłĹczynnikĂłw: procent zmiennoĹÄ wyjaĹniane/nie wyjaĹniane przez liniÄ regresji. Im \(R^2\) jest bliĹźsze jednoĹci (lub 100% jeĹźeli jest wspĂłĹczynnik zbieĹźnoĹci jest wyraĹźony w procentach) tym lepiej.
Ocena dopasowania: istotnoĹÄ parametru \(a\)
JeĹźeli: \(Y= 0 \cdot X + b_0\), to \(Y = b_0\) czyli nie ma zaleĹźnoĹci pomiÄdzy \(X\) oraz \(Y\). WartoĹci \(b_1\) bliskie zero wskazujÄ na sĹabÄ zaleĹźnoĹÄ pomiÄdzy cechami.
Przypominamy, Ĺźe estymator parametru \(b_1\) ma ĹredniÄ rĂłwnÄ prawdziej wartoĹci \(b_1\) oraz wariancjÄ. Dodatkowo zakĹadamy, Ĺźe rozkĹad tego estymatora jest normalny. To zaĹoĹźenie pozwala wiarygodnie oszacowaÄ wariancjÄ; w konsekwencji znamy dokĹadny rozkĹad (bo przypominamy, Ĺźe rozkĹad normalny jest okreĹlony przez dwa parametry: ĹredniÄ oraz wĹaĹnie wariancjÄ)
MoĹźna teraz zadaÄ pytanie jeĹźeli faktycznie \(b_1=0\), to jakie jest prawdopodobieĹstwo, Ĺźe wspĂłĹczynnik \(\hat b_1\) oszacowany na podstawie \(n\) obserwacji bÄdzie (co do wartoĹci bezwzglÄdnej) wiÄkszy niĹź \(b_e\). Albo inaczej: otrzymaliĹmy \(b_e\), jakie jest prawdopodobieĹstwo otrzymania takiej wartoĹci (lub mniejszej co do wartoĹci bezwzglÄdnej) przy zaĹoĹźeniu, Ĺźe istotnie \(b_1=0\).
JeĹźeli takie prawdopodobieĹstwo jest duĹźe, to zakĹadamy Ĺźe byÄ moĹźe \(b_1 = 0\), a jeĹźeli maĹe to Ĺźe \(b_1 \not 0\). DuĹźe/maĹe przyjmujemy arbitralnie, zwykle jest to \(0,1\), \(0,05\) lub \(0,01\). Tak zgadza siÄ, to prawdopodobieĹstwo to poziom istotnoĹci
W kaĹźdym programie komputerowym na wydruku wynikĂłw linii regresji sÄ podane wartoĹci prawdopodobieĹstwa \(\hat b_1\) > b_e $ (co do wartoĹci bezwzglÄdnej). JeĹźeli jest ono mniejsze niĹź ustalony poziom istotnoĹci to \(b_1\) ma wartoĹÄ istotnie róşnÄ od zera.
Testowanie istotnoĹci wspĂłĹczynnika regresji jest waĹźnym kryterium oceny jakoĹci dopasowania. Regresja z nieistotnym wspĂłĹczynnikiem nie moĹźe byÄ podstawÄ do interpretowania zaleĹźnoĹci pomiÄdzy XY.
PrzykĹad: Waga a wzrost rugbystĂłw
ZaleĹźnoĹÄ miÄdzy wagÄ
(weight
) a wzrostem
(height
):
\[ \textrm{height} = \beta_0 + \beta_1 \textrm{weight}\] Oszacowanie tego rĂłwnania na prĂłbie 635 uczestnikĂłw Pucharu Ĺwiata w rugby w 2023 roku daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI95 |
---|---|---|---|---|---|---|
(Intercept) | 157.1485718 | 2.1297673 | 73.78673 | 0 | NA | 152.970000â161.330000 |
weight | 0.2808207 | 0.0206739 | 13.58336 | 0 | 0.480000 | 0.240000â0.320000 |
Co oznacza, Ĺźe wzrost wagi o 1kg skutkuje przeciÄtnie wiÄkszym wzrostem o 0.2808207 cm. WspĂłĹczynnik determinacji wynosi 23.16%. WspĂłĹczynnik nachylenia prostej jest istotny poniewaĹź wartoĹÄ \(p\) jest grubo poniĹźej zwyczajowego poziomu istotnoĹci (p < 0,05).
Kolumna Beta
zawiera standaryzowane wartoĹci
wspĂłĹczynnikĂłw; kolumna CI95
zawiera 95% przedziaĹy
ufnoĹci. Z 95% prawdopodobieĹstwem wartoĹÄ wspĂłĹczynnika nachylenia
prostej znajduje siÄ w przedziale 0,24â0,32.
PrzykĹad: zamoĹźnoĹÄ a konsumpcja miÄsa
NastÄpujÄ cy rĂłwnanie opisuje zaleĹźnoĹÄ pomiÄdzy dochodem narodowym na gĹowÄ (per capita) a konsumpcjÄ miÄsa w kilogramach:
\[\textrm{konsumpcja} = \beta_0 + \beta_1 \textrm{gdp}\] Model oszacowano dla krajĂłw Ĺwiata w roku 2013 na podstawie danych pobranych z bazy FAO Food Balance Sheet oraz Banku Ĺwiatowego, otrzymujÄ c nastÄpujÄ ce wyniki
Zmienna | B | BĹÄ d stand | z | p | Beta | CI95 |
---|---|---|---|---|---|---|
(Intercept) | 34.0847681 | 2.2324799 | 15.26767 | 0 | NA | 29.680000â38.490000 |
gdp2013 | 0.0011075 | 0.0000996 | 11.12427 | 0 | 0.640000 | 0.000000â0.000000 |
KaĹźdy USD per capita wiÄcej dochodu narodowego (GDP) oznacza przeciÄtny wzrost spoĹźycia miÄsa o 0.0011075 kg. PrzeciÄtna róşnica wartoĹci teoretycznych od empirycznych wynosi 21,04 kg (Ĺredni bĹÄ d szacunku). WspĂłĹczynnik zbieĹźnoĹci wynosi 40.88%. WspĂłĹczynnik nachylenia prostej (mimo Ĺźe jego wartoĹÄ wynosi zaledwie 0.0011075) jest statystycznie istotny.
Nie ma przykĹadĂłw zastosowania regresji prostej w literaturze przedmiotu, bo jest ona zbyt duĹźym uproszczeniem rzeczywistoĹci. Jest to jednak dobry punkt startu do bardziej skomplikowanego modelu regresji wielorakiej.
UogĂłlnieniem regresji prostej jest regresja wieloraka. W modelu regresji wielorakiej po lewej stronie rĂłwnania wystÄpuje zmienna liczbowa a po prawej zmienne liczbowe lub nominalne.
\[Y = b_0 + b_1 \cdot X_1 + b_2 \cdot X_2 + ... + b_k \cdot X_k \]
W ktĂłrej zmienna \(Y\) jest objaĹniana przez wiele zmiennych \(X_1, \ldots, X_k\). WpĹyw kaĹźdej zmiennej \(X_i\) na zmiennÄ zaleĹźnÄ \(Y\) jest okreĹlony przez odpowiedni wspĂłĹczynnik \(b_i\).
Podobnie jak w przypadku regresji prostej do oceny stopnia dopasowania modelu do danych wykorzystuje siÄ: Ĺredni bĹÄ d szacunku, wspĂłĹczynnik zbieĹźnoĹci \(R^2\) oraz weryfikuje siÄ istotnoĹÄ wspĂłĹczynnikĂłw \(b_i\).
Standaryzacja wspĂłĹczynnikĂłw regresji
PoniewaĹź wspĂłĹczynniki regresji \(b_1, âŚ, b_k\) mogÄ byÄ wyraĹźone w róşnych jednostkach miary, bezpoĹrednie porĂłwnanie jest niemoĹźliwe; maĹy wspĂłĹczynnik moĹźe w rzeczywistoĹci byÄ waĹźniejszy niĹź wiÄkszy. JeĹźeli chcemy porĂłwnywaÄ wielkoĹci wspĂłĹczynnikĂłw to trzeba je zestandaryzowaÄ.
Standaryzowany wspĂłĹczynnik regresji dla \(i\)-tej zmiennej, obliczony poprzez pomnoĹźenie wspĂłĹczynnika regresji \(b_i\) przez \(s_{xi}\) i podzielenie przez \(s_y\), tj. \(\beta_i = b_i s_{xi}/ s_y\). Jego interpretacja jest cokolwiek dziwaczna: zmiana zmiennej \(X_i\) o jedno odchylenie standardowe (s_{xi}) skutkuje zmianÄ zmiennej \(Y\) o \(\beta_i\) jej odchylenia standardowego \(s_y\). Na szczÄĹcie wspĂłĹczynniki regresji standaryzuje siÄ nie w celu lepszej interpretacji, tylko w celu umoĹźliwienia porĂłwnania ich wzglÄdnej wielkoĹci (wielkoĹci efektu). W publikacjach medycznych zwykle uĹźywa siÄ litery \(b\) na oznaczenie wspĂłĹczynnikĂłw niestandaryzowanych a litery \(\beta\) na oznaczenie wspĂłĹczynnikĂłw standaryzowanych.
WielkoĹÄ efektu
WspĂłĹczynniki regresji to miara wielkoĹci efektu, ktĂłra wskazuje na siĹÄ zaleĹźnoĹci miÄdzy zmiennymi. Standaryzacja pozwala na porĂłwnanie wielkoĹci efektu zmiennych mierzonych w róşnych jednostkach miary. Standaryzacja przydaje siÄ takĹźe w przypadku posĹugiwania siÄ skalami pomiarowymi mierzÄ cymi przekonania i postawy, ktĂłre z definicji sÄ bezjednostkowe.
WybĂłr zmiennych objaĹniajÄ cych
Zwykle jest tak, Ĺźe do objaĹniajÄ cej ksztaĹtowanie siÄ wartoĹci zmiennej \(Y\) kandyduje wiele potencjalnych predyktorĂłw \(X_k\). Model zawierajÄ cy wszystkie \(X_k\) predyktory niekoniecznie bÄdzie najlepszy. Nie wdajÄ c siÄ w omawianie szczegĂłĹowych zasad poprzestaniemy na dwĂłch kryteriach:
Model prostszy jest lepszy od modelu bardziej skomplikowanego jeĹźeli adekwatnie objaĹnia zmiennoĹÄ \(Y\) (zasada brzytwy Ockhama)
Model powinien zawieraÄ tylko zmienne o wspĂłĹczynnikach, ktĂłrych wartoĹci sÄ statystycznie róşne od zera
Regresja krokowa (stepwise regression) jest metodÄ wyboru najlepszych predyktorĂłw spoĹrĂłd wiÄkszego zbioru zmiennych. WystÄpuje w dwĂłch wariantach doĹÄ czania i eliminacji. PoniewaĹź eliminacja wydaje siÄ prostsza omĂłwimy tylko ten wariant.
W metodzie eliminacji poczÄ tkowym modelem jest model zawierajÄ cy wszystkie potencjalne \(X_k\) predyktory. NastÄpnie testujemy istotnoĹÄ wszystkich wspĂłĹczynnikĂłw regresji i usuwamy ze zbioru predyktorĂłw ten, ktĂłry jest ânajbardziej nieistotnyâ (ma najwiÄkszÄ wartoĹÄ \(p\)) ProcedurÄ powtarzamy dla modelu bez usuniÄtej zmiennej. ProcedurÄ przerywamy gdy wszystkie wspĂłĹczynniki regresji sÄ statystycznie istotne.
PrzykĹad: zaleĹźnoĹÄ pomiÄdzy ciĹnienie skurczowym, BMI oraz wiekiem
\[\textrm{ciĹnienie} = b_0 + b_1 \textrm{BMI} + b_2\textrm{wiek}\]
Dane pochodzÄ z badania: ZaleĹźnoĹÄ pomiÄdzy BMI i wiekiem a wystÄpowaniem cukrzycy wĹrĂłd dorosĹych osĂłb w Chinach. Badanie kohortowe (Chen i inni, Association of body mass index and age with incident diabetes in Chinese adults: a population-based cohort study. BMJ Open. 2018 Sep 28;8(9):e021768. doi: 10.1136/bmjopen-2018-021768. PMID: 30269064; PMCID: PMC6169758.)
Oryginalny zbiĂłr danych liczy 60 tysiÄcy obserwacji. Dla celĂłw przykĹadu losowo wybrano 90, 490 oraz 4490 obserwacji.
Oszacowanie tego samego rĂłwnania dla prĂłba o wielkoĹci 90 obserwacji daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI95 |
---|---|---|---|---|---|---|
(Intercept) | 59.6980648 | 11.9647074 | 4.989513 | 0.0000031 | NA | 35.920000â83.480000 |
BMI | 1.7416538 | 0.4860235 | 3.583477 | 0.0005584 | 0.330000 | 0.780000â2.710000 |
age | 0.4838519 | 0.1238715 | 3.906079 | 0.0001849 | 0.360000 | 0.240000â0.730000 |
WspĂłĹczynnik zbieĹźnoĹci wynosi 26.24%.
Oszacowanie tego samego rĂłwnania dla prĂłba o wielkoĹci 490 obserwacji daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI95 |
---|---|---|---|---|---|---|
(Intercept) | 79.0607936 | 4.3783434 | 18.057239 | 0.0000000 | NA | 70.460000â87.660000 |
BMI | 1.2125475 | 0.1827041 | 6.636675 | 0.0000000 | 0.280000 | 0.850000â1.570000 |
age | 0.2593172 | 0.0534066 | 4.855526 | 0.0000016 | 0.210000 | 0.150000â0.360000 |
WspĂłĹczynnik zbieĹźnoĹci wynosi 14.97%.
Oszacowanie tego samego rĂłwnania dla prĂłba o wielkoĹci 4490 obserwacji daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI |
---|---|---|---|---|---|---|
(Intercept) | 74.0109877 | 1.5304851 | 48.35786 | 0 | NA | 71.010000â77.010000 |
BMI | 1.3747728 | 0.0642304 | 21.40377 | 0 | 0.300000 | 1.250000â1.500000 |
age | 0.3204461 | 0.0175393 | 18.27012 | 0 | 0.250000 | 0.290000â0.350000 |
WspĂłĹczynnik zbieĹźnoĹci wynosi 18.54%.
Zamiast porĂłwnywaÄ Ĺrednie moĹźemy wykorzystaÄ metodÄ regresji wielorakiej. Zmienna nominalna jest zamieniana na jednÄ lub wiÄcej zmiennych binarnych, ktĂłre przyjmujÄ tylko dwie wartoĹci 0 lub 1.
PrzykĹadowo rodzaj miejsca pracy (skala nominalna; dwie wartoĹci: szpital, przychodnia) moĹźna zamieniÄ na zmiennÄ binarnÄ praca przypisujÄ c 1 = szpital, oraz 0 = przychodnia (lub odwrotnie)
\[\textrm{stres} = \ldots + b \cdot \textrm{praca}\] Jaka jest interpretacja \(a\)? ZakĹadajÄ c Ĺźe 0 = przychodnia, oznacza zmianÄ stresu spowodowanÄ pracÄ w szpitalu w porĂłwnaniu do przychodni. JeĹźeli ten wspĂłĹczynnik jest istotny statystycznie istnieje zaleĹźnoĹÄ pomiÄdzy stresem a miejscem pracy. Czyli zamiast stosowaÄ test \(t\)-Studenta moĹźemy oszacowaÄ model regresji z wykorzystaniem stosownej zmiennej zero-jedynkowej a nastÄpnie sprawdziÄ czy wspĂłĹczynnik stojÄ cy przy tej zmiennej jest istotny.
JeĹźeli zmienna nominalna ma \(n\) wartoĹci naleĹźy jÄ zamieniÄ na \(n-1\) zmiennych zero-jedynkowych. PrzykĹadowo wyksztaĹcenie (Ĺrednie, licencjat, magisterskie) zamieniamy na magister (jeden jeĹźeli tak, 0 jeĹźeli nie) oraz licencjat (jeden jeĹźeli tak lub 0 jeĹźeli nie)
\[\textrm{stres} = \ldots + b_4 \cdot \textrm{magister} + b_5 \cdot \textrm{licencjat} \] JeĹźeli \(\textrm{magister} = 0\) oraz \(\textrm{licencjat} = 0\) to osoba ma wyksztaĹcenie Ĺrednie; Interpretacja: \(a\) (jeĹźeli istotne) oznacza zmianÄ stresu osoby z wyksztaĹceniem magisterskim w porĂłwnaniu do osoby z wyksztaĹceniem Ĺrednim. Podobnie \(b\) oznacza zmianÄ stresu osoby z wyksztaĹceniem licencjackim w porĂłwnaniu do osoby z wyksztaĹceniem Ĺrednim.
PrzykĹad: zaleĹźnoĹÄ pomiÄdzy ciĹnienie skurczowym, BMI, wiekiem, pĹciÄ , paleniem i piciem
Poprzednio rozwaĹźany model rozszerzymy o trzy zmienne: pĹeÄ (kobieta/mÄĹźczyzna), status wzglÄdem picia alkoholu (pije, piĹ, nigdy nie piĹ) oraz status wzglÄdem palenia (paliĹ, pali, nigdy nie paliĹ). ZwrĂłÄmy uwagÄ Ĺźe zmienne mierzÄ ce status wzglÄdem palenia/picia majÄ nie dwie a trzy wartoĹci. NaleĹźy kaĹźdÄ zamieniÄ na dwie zmienne binarne, wg schematu:
current.smoker
(pali) = 1 jeĹźeli pali, 0 w przeciwnym
przypadku
ever.smoker
(kiedyĹ paliĹ) = 1 jeĹźeli paliĹ ale nie
pali, 0 w przeciwnym przypadku
Zmienna pĹeÄ genderF
= 1 jeĹźeli kobieta, lub 0 jeĹźeli
mÄĹźczyzna. ZauwaĹźmy, Ĺźe nazwa zmiennej dwuwartoĹciowej wskazuje ktĂłra
wartoĹÄ jest zakodowana jako 1. PrzykĹadowo genderF
(female Ĺźeby siÄ trzymaÄ jÄzyka angielskiego) wskazuje Ĺźe
jedynkÄ
jest kobieta. Taka konwencja uĹatwia interpretacjÄ. GdybyĹmy
zamiast genderF
nazwali zmiennÄ
gender
to na
pierwszy rzut oka nie byĹo by wiadomo co zakodowano jako jeden. A tak
wiadomo od razu jak interpretowaÄ parametr stojÄ
cy przy tej zmiennej:
zmiana wielkoĹci ciĹnienia u kobiet w porĂłwnaniu do mÄĹźczyzn.
RozwaĹźany model ma postaÄ:
\[SBP = b_0 + b_1 \textrm{BMI} + b_2 \textrm{age} + b_3 \textrm{genderF} + b_4 \textrm{current.smoker} + b_5 \textrm{ever.smoker} + b_6 \textrm{current.drinker} + b_7 \textrm{ever.drinker}\]
Oszacowanie tego rĂłwnania dla prĂłby o wielkoĹci 90 obserwacji daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI |
---|---|---|---|---|---|---|
(Intercept) | 90.3324858 | 15.7447575 | 5.7373056 | 0.0000002 | NA | 59.010000 121.650000 |
BMI | 0.7780668 | 0.5922540 | 1.3137383 | 0.1925980 | 0.150000 | -0.400000 1.960000 |
age | 0.4408317 | 0.1205219 | 3.6576902 | 0.0004484 | 0.330000 | 0.200000 0.680000 |
genderF | -13.8196581 | 4.3993394 | -3.1413030 | 0.0023400 | -0.400000 | -22.570000 -5.070000 |
current.smoker | -6.8898579 | 3.9716110 | -1.7347766 | 0.0865377 | -0.180000 | -14.790000 1.010000 |
ever.smoker | 7.6258343 | 6.8823895 | 1.1080213 | 0.2710921 | 0.110000 | -6.070000 21.320000 |
current.drinker | -3.9592512 | 8.5230314 | -0.4645356 | 0.6434952 | -0.040000 | -20.910000 13.000000 |
ever.drinker | -4.0011737 | 4.5751715 | -0.8745407 | 0.3843781 | -0.080000 | -13.100000 5.100000 |
WspĂłĹczynnik zbieĹźnoĹci wynosi 38.11%. Tylko dwie na siedem zmiennych
sÄ
istotne. ZwrĂłÄmy uwagÄ Ĺźe nieistotnie zmienne majÄ
przedziaĹy ufnoĹci
zawierajÄ
ce zero. W konsekwencji z 95% prawdopodobieĹstwem wartoĹci tych
wspĂłĹczynnikĂłw mogÄ
byÄ raz ujemne raz dodatnieânie mamy nawet pewnoĹci
co do kierunku zaleĹźnoĹci miÄdzy zmiennÄ
zmiennÄ
objaĹniajÄ
cÄ
a
ciĹnieniem. Zmienne, ktĂłre okazaĹy siÄ istotne jednoczeĹnie majÄ
najwiÄkszÄ
wielkoĹÄ efektu (kolumna Beta
) i nie jest to
przypadek.
Oszacowanie tego samego rĂłwnania dla prĂłba o wielkoĹci 4490 obserwacji daje nastÄpujÄ ce wyniki:
Zmienna | B | BĹÄ d stand | z | p | Beta | CI |
---|---|---|---|---|---|---|
(Intercept) | 80.0892506 | 1.6234001 | 49.3342644 | 0.0000000 | NA | 76.910000 83.270000 |
BMI | 1.1923484 | 0.0662091 | 18.0088428 | 0.0000000 | 0.260000 | 1.060000 1.320000 |
age | 0.3356278 | 0.0175842 | 19.0868652 | 0.0000000 | 0.260000 | 0.300000 0.370000 |
genderF | -5.3287419 | 0.5076689 | -10.4964911 | 0.0000000 | -0.160000 | -6.320000 -4.330000 |
current.smoker | -2.7520369 | 0.5834007 | -4.7172331 | 0.0000025 | -0.070000 | -3.900000 -1.610000 |
ever.smoker | -2.0210024 | 1.0452758 | -1.9334633 | 0.0532420 | -0.030000 | -4.070000 0.030000 |
current.drinker | 3.6213408 | 1.5345859 | 2.3598163 | 0.0183266 | 0.030000 | 0.610000 6.630000 |
ever.drinker | 0.1928834 | 0.6231969 | 0.3095063 | 0.7569508 | 0.000000 | -1.030000 1.410000 |
WspĂłĹczynnik zbieĹźnoĹci wynosi 20.72%. ZwiÄkszenie liczebnoĹci prĂłby spowodowaĹo Ĺźe tylko dwie z siedmiu zmiennych majÄ nieistotne wartoĹci. AnalizujÄ c wartoĹci standaryzowane moĹźemy ustaliÄ ktĂłre zmienne majÄ najwiÄkszy wpĹyw na wielkoĹÄ ciĹnienia krwi.
KtoĹ mĂłgĹby dojĹÄ do wniosku Ĺźe wszystko da siÄ uistotniÄ wystarczy zwiÄkszyÄ wielkoĹÄ prĂłby. Teoretycznie tak, praktycznie nie. W praktyce nie interesuje nas niewielka wielkoĹÄ efektu (znikomy wpĹyw czegoĹ na coĹ). Dodatkowo zebranie duĹźej prĂłby moĹźe byÄ kosztowne czyli w praktyce niemoĹźliwe â nie mamy doĹÄ duĹźo pieniÄdzy. MoĹźna teoretycznie okreĹliÄ jaka wielkoĹÄ prĂłby pozwoli nam na ocenÄ jakiej wielkoĹci efektu. SposĂłb postÄpowania jest wtedy nastÄpujÄ cy: okreĹlamy jaka wielkoĹÄ efektu ma znaczenie praktyczne, na tej podstawie okreĹlamy niezbÄdnÄ minimalnÄ liczebnoĹÄ prĂłby. Takie zaawansowane podejĹcie wykracza poza ramy tego podrÄcznika.
JeĹźeli \(Y\) jest zmiennÄ dwuwartoĹciowÄ , to jest takÄ , ktĂłra przyjmuje tylko dwie wartoĹci (chory/zdrowy) to metoda regresji nie moĹźe byÄ zastosowana. PrzykĹadowo jeĹźeli zakodujemy te wartoĹci jako 0 i 1 odpowiednio, to zastosowanie regresji doprowadzi do obliczenia (teoretycznych) wartoĹci \(Y\) róşnych od \(0\) i \(1\). Taki wynik nie ma sensownej interpretacjiâŚ
Ale zamiast szacowaÄ regresjÄ \(Y\) wzglÄdem (\(X\)/\(X\)-Ăłw) moĹźna szacowaÄ regresjÄ wzglÄdem ryzyka dla \(Y\) (czyli prawdopodobieĹstwa Ĺźe \(Y\) przyjmnie wartoĹÄ 1). Tutaj znowu pojawia siÄ jednak trudnoĹÄ, bo ryzyko moĹźe przyjÄ Ä tylko wartoĹci z przedziaĹu \([0,1]\). Nie wchodzÄ c w matematyczne zawiĹoĹci model zapisuje siÄ jako (ln oznacza logarytm naturalny):
\[\ln(p/(1-p)) = b_0 + b_1 \cdot x_1 + \ldots + b_k \cdot x_k\]
ZauwaĹźmy, Ĺźe \(o = p/(1-p)\) to nic innego jak szansa (odds). Parametr \(b_i\) jest miarÄ wpĹywu zmiennej \(X_i\) na zmiennÄ \(Y\). JeĹźeli \(X_i\) wzroĹnie o jednostkÄ, to logarytm ilorazu szans wzroĹnie o \(\ln(o)\) (przy zaĹoĹźeniu Ĺźe pozostaĹem zmienne \(X\) majÄ pewne ustalone wartoĹciâzmienia siÄ tylko \(X_i\)).
Zwykle zamiast \(ln(o)\) wolimy interpretowaÄ zmianÄ w kategoriach ilorazu szans: \(o = exp^{\ln(o)}\). JeĹźeli \(X_i\) jest zmiennÄ dwuwartoĹciowÄ to interpretacja jest jeszcze prostsza: jest to iloraz szans dla przypadku gdy \(X_i=1\).
Dla przypomnienia: zwykle iloraz szans wyraĹźa siÄ w procentach, czyli mnoĹźy przez 100. JeĹźeli ta liczba jest wiÄksza od 100 oznacza to wzrost szansy, a jeĹźeli mniejsza od 100, spadek szansy.
Ocena dopasowania
Nie ma w przypadku regresji logistycznej moĹźliwoĹci obliczenia sumy kwadratĂłw reszt (residual sum of squares) oraz wspĂłĹczynnika zbieĹźnoĹci. Model ocenia siÄ uĹźywajÄ c jako kryterium dewiancjÄ (deviance). Dewiancja to miara, ktĂłrej wielkoĹÄ zaleĹźy od proporcji pomiÄdzy liczbÄ sukcesĂłw obliczonych z modelu a liczbÄ sukcesĂłw zaobserwowanych (jak dokĹadnie dewiancja jest liczona nie jest dla nas istotne).
WyjaĹnijmy to na przykĹadzie prostego modelu pomiÄdzy wystÄ pieniem osteoporozy a pĹciÄ . Model ma postaÄ:
\[\ln(o) = \beta_0 + \beta_1 pĹeÄ\]
Po oszacowaniu \(\beta_0\) oraz \(\beta_1\) moĹźemy Ĺatwo obliczyÄ \(\ln(o)\). WiedzÄ c Ĺźe \(ln(o)=p/1-p\) moĹźemy stÄ d obliczyÄ prawdopodobieĹstwo, ktĂłre jak widaÄ bÄdzie róşne dla kobiet i mÄĹźczyzn. Po pomnoĹźeniu tych prawdopodobieĹstw przez liczebnoĹci dostajemy (teoretyczne) liczebnoĹci sukcesĂłw (tj. wystÄ pienia osteoporozy). Dewiacja bÄdzie tym wiÄksza im róşnica miÄdzy tymi teoretycznymi liczebnoĹciami a liczebnoĹciami empirycznymi bÄdzie wiÄksza.
Jako minimum porĂłwnuje siÄ wielkoĹÄ dewiacji szacowanego modelu z modelem zerowym (null model), tj. modelem w ktĂłrym po prawej stronie rĂłwnania wystÄpuje tylko staĹa:
\[\ln(o) = \beta_0\]
W tym modelu prawdopodobieĹstwo osteoporozy jest identyczne dla kobiet i mÄĹźczyzn, zatem w oczywisty sposĂłb dewiacja tego modelu bÄdzie wiÄksza. Pytanie jest czy róşnica jest istotna statystycznie. JeĹźeli jest przyjmuje siÄ, Ĺźe szacowany model jest lepszy od modelu trywialnego (warunek minimum przydatnoĹci)
JeĹźeli model zawiera wiele zmiennych w tym zmienne liczbowe, idea liczenia dewiacji jest podobna, ale oczywiĹcie szczegĂłĹy sÄ juĹź bardziej skomplikowane. SzczegĂłĹy te nie sÄ wszakĹźe dla nas istotne.
Minimalne kryteria oceny przydatnoĹci modelu regresji logistycznej: istotnie mniejsza od modelu zerowego dewiancja oraz istotnie róşne od zera parametry przy zmiennych niezaleĹźnych (predyktorach)
Ocena skutecznoĹci klasyfikacji
Model regresji logistycznej nie oblicza wartoĹci zmiennej prognozowanej, bo ta nie jest liczbÄ , tylko klasyfikuje, tj. ustala (albo prognozuje) wartoĹÄ zmiennej nominalnej w kategoriach âsukces/âporaĹźka. WaĹźnym kryterium oceny jakoĹci modelu jest ocena jakoĹci klasyfikacji, to jest ocena na ile model poprawnie przypisuje przypadkom kategorie zmiennej prognozowanej. Im mniejsza rozbieĹźnoĹÄ pomiÄdzy wartoĹciami rzeczywistymi, a prognozowanymi tym oczywiĹcie lepiej.
TÄ jakoĹÄ klasyfikacji ocenia siÄ za pomocÄ dwĂłch wskaĹşnikĂłw, czuĹoĹÄ (sensitivity) oraz swoistoĹÄ (specifity).
Klasyfikacja w modelu regresji logistycznej wyglÄ da nastÄpujÄ co. JeĹźeli prawdopodobieĹstwo obliczone jest wyĹźsze-lub-rĂłwne niĹź zaĹoĹźona wartoĹÄ graniczna, to zakĹadamy âsukces, jeĹźeli tak nie jest âporaĹźkÄ. WartoĹÄ graniczna jest ustala albo arbitralnie albo na podstawie jakieĹ dodatkowej (pozastatystycznej) informacji. DomyĹlnie za wartoĹÄ granicznÄ przyjmuje siÄ zwykle 0,5, co oznacza Ĺźe wartoĹci \(p \geq p_g\) zostanÄ zamienione na âsukces a wartoĹci \(p < p_g\) zostanÄ zamienione na âporaĹźkÄ.
Ocena dopasowania: krzywa ROC
CzuĹoĹci oraz swoistoĹci zaleĹźÄ od prawdopodobieĹstwa granicznego. Im wyĹźsza jest wartoĹÄ prawdopodobieĹstwa granicznego tym mniej bÄdzie âsukcesĂłwâ.
Krzywa ROC przedstawia w ukĹadzie wspĂłĹrzÄdnych XY wartoĹci czuĹoĹci oraz swoistoĹci dla róşnych wartoĹci granicznych. WspĂłĹczynnik AUC (area under curve) to wielkoĹÄ pola pod krzywÄ wyraĹźona w procentach pola kwadratu o boku 100%. AUC zawiera siÄ w przedziale 50â100. Im wiÄksza wartoĹÄ tym lepiej. Model ktĂłry klasyfikuje czysto losowo ma wartoĹÄ AUC rĂłwnÄ 50%.
PrzykĹad #1: Osteoporoza i witamina D
Al Zarooni A.A.R i inni badali wpĹyw róşnych czynnikĂłw na ryzyka na wystÄ pienie osteoporozy (Risk factors for vitamin D deficiency in Abu Dhabi Emirati population; https://doi.org/10.1371/journal.pone.0264064), takich jak deficyt witaminy D, wiek oraz pĹeÄ w grupie 392 osĂłb.
Zacznijmy od modelu zerowego tj. takiego w ktĂłrym ryzyko/prawdopodobieĹstwo/szansa wystÄ pienia osteoporozy jest takie same bez wzglÄdu na wielkoĹci innych zmiennych. Odpowiada to nastÄpujÄ cemu rĂłwnaniu:
\[\ln(o) = \beta_0\]
W tabeli zestawiono wartoĹci parametrĂłw oszacowanego modelu, ilorazy szans, przedziaĹu ufnoĹci oraz prawdopodobieĹstwo
MoĹźna obliczyÄ Ĺźe (teoretyczne) prawdopodobieĹstwo wystÄ pienia osteoporozy wyniosĹo 0.0663265. Krzywa ROC dla modelu zerowego wyglÄ da nastÄpujÄ co:
Model zerowy jak sama nazwa wskazuje moĹźe tylko sĹuĹźyÄ do porĂłwnania z bardziej skomplikowanymi modelami.
Takim bardziej skomplikowanym modelem bÄdzie przykĹadowo zaleĹźnoĹÄ pomiÄdzy wystÄ pieniem osteoporozy a pĹciÄ , ktĂłrÄ moĹźna opisaÄ nastÄpujÄ cym rĂłwnaniem regresji:
\[\ln(o) = \beta_0 + \beta_1 \textrm{kobieta}\]
Zmienna kobieta
przyjmuje wartoĹÄ 1 jeĹźeli osoba byĹa
kobietÄ
oraz zero w przypadku jeĹźeli byĹa mÄĹźczyznÄ
. Dla przypomnienia
\(o\) jest szansÄ
wystÄ
pienia
osteoporozy.
W tabeli zestawiono wartoĹci parametrĂłw oszacowanego modelu, ilorazy szans, przedziaĹu ufnoĹci oraz prawdopodobieĹstwo
Parametr | Ocena | BĹÄ d stand | z | p | OR | CI |
---|---|---|---|---|---|---|
(Intercept) | -3.367296 | 0.4548585 | -7.402952 | 0.0000000 | 0.030000 | 0.010000â0.080000 |
genderF | 1.013656 | 0.5089599 | 1.991621 | 0.0464126 | 2.760000 | 1.090000â8.400000 |
ZnajÄ c wartoĹci wspĂłĹczynnikĂłw rĂłwnania moĹźna obliczyÄ wartoĹci \(\ln(o)\)
Dewiacja modelu jest istotnie mniejsza od modelu zerowego
## [1] 0.03035215
ZaleĹźnoĹÄ pomiÄdzy wystÄ pieniem osteoporozy a pĹciÄ , wiekiem oraz poziomem witaminy D moĹźna opisaÄ nastÄpujÄ cym rĂłwnaniem regresji:
\[\ln(o) = \beta_0 + \beta_1 \textrm{kobieta} + \beta_2 \textrm{wiek} + \beta_3 \textrm{poziomD}\]
W tabeli zestawiono wartoĹci parametrĂłw oszacowanego modelu, ilorazy szans, przedziaĹu ufnoĹci oraz prawdopodobieĹstwo
Parametr | Ocena | BĹÄ d stand | z | p | OR | CI |
---|---|---|---|---|---|---|
(Intercept) | -12.1833261 | 1.7661567 | -6.8982135 | 0.0000000 | 0.000000 | 0.000000â0.000000 |
d | 0.0046126 | 0.0086084 | 0.5358247 | 0.5920797 | 1.000000 | 0.990000â1.020000 |
age | 0.1563185 | 0.0263592 | 5.9303149 | 0.0000000 | 1.170000 | 1.120000â1.240000 |
genderF | 2.4627808 | 0.6616269 | 3.7223105 | 0.0001974 | 11.740000 | 3.540000â48.760000 |
Macierz pomyĹek (confussion matrix)
## Osteoporoza
## Prognoza 0 1
## 0 362 22
## 1 4 4
StÄ d: czuĹoĹÄ 0.1538462; swoistoĹÄ 0.989071
IstotnoĹÄ modelu
## [1] 0.000000000000005226858
Dewiancja jest istotnie mniejsza od dewiancji modelu zerowego (p = 0)
Krzywa ROC
WspĂłĹczynnik korelacji rang (Spearmana vel Spearmanâs Rank-Order Correlation) moĹźe byÄ stosowany w przypadku gdy cechy sÄ mierzone w skali porzÄ dkowej (lub lepszej)
Obliczenie wspĂłĹczynnika Spearmana dla \(N\) obserwacji na zmiennych \(XY\) polega na zamianie wartoĹci \(XY\) na rangi (numery porzÄ dkowe od \(1...N\)). NastÄpnie stosowana jest formuĹa Pearsona, tj. (\(\tau_x\) oraz \(\tau_y\) oznaczajÄ rangi):
\[\rho_{xy} = cov(\tau_x, \tau_y) / ( S_{\tau_x} \cdot S_{\tau_y} )\]
WspĂłĹczynnik \(\rho_{xy}\) to takĹźe miara niemianowana, o wartoĹciach ze zbioru [-1;1];
W podrÄcznikach moĹźna teĹź spotkaÄ formuĹÄ alternatywnÄ :
\[r_s = 1 - \frac{6 \cdot \sum\limits_{i=1}^N d_i^2}{ N(N^2 -1)}\]
gdzie \(d_i\) oznacza róşnicÄ miÄdzy rangami dla cechy \(X\) oraz \(Y\), tj. \(d_i = \tau_{x_i} - \tau_{y_i}\). Wymagany jest aby \(d_i\) byĹy róşne od siebie. MoĹźna teĹź spotkaÄ (w podrÄcznikach) przykĹady uĹźycia formuĹy alternatywnej dla rang identycznych, wĂłwczas (dla \(k\) identycznych rang, zamienia siÄ je na wartoĹci Ĺrednie) \(d_i = \frac{1}{k}\sum\limits_{i=1}^k d_i^k\). Raczej nie zalecaneâŚ
PrzykĹad: spoĹźycie miÄsa
WspĂłĹczynnik Pearsona i Spearmana dla zaleĹźnoĹci miÄdzy spoĹźyciem miÄsa w 1980 a spoĹźyciem miÄsa w 2013 roku (zmienna objaĹniana):
## [1] "wspĂłĹczynnik Pearsona: 0.68"
## [1] "wspĂłĹczynnik Spearmana: 0.68"
Nie ma sensu liczenia wspĂłĹczynnika korelacji rang w przypadku kiedy obie cechy sÄ liczbami, bo wtedy naleĹźy uĹźyÄ normalnego wspĂłĹczynnika Pearsona. Ale nie jest to teĹź bĹÄdem wiÄc w powyĹźszym przykĹadzie go liczymy :-)
WspĂłĹczynnik korelacji liniowej Spearmana wynosi 0.6845429 (umiarkowana korelacja).
Czy ta wartoĹÄ jest istotnie róşna od zera? Jest na to stosowny test statystyczny, ktĂłry sprowadza siÄ do okreĹlenia jakie jest prawdopodobieĹstwo otrzymania \(r_s\) = 0.6845429 przy zaĹoĹźeniu Ĺźe prawdziwa wartoĹÄ \(r_s\) wynosi zero. Otóş w naszym przykĹadzie to prawdopodobieĹstwo wynosi 2.302116e-26 (czyli jest ekstremalnie maĹe â \(r_s\) jest istotnie róşne od zera).
Przedstawiono 6 nastÄpujÄ cych metod:
korelogram
tablica korelacyjna/test chi-kwadrat
wspĂłĹczynnik korelacji Pearsona
wspĂłĹczynnik korelacji Spearmana
regresjÄ liniowÄ i logistyczna
testy \(t\)-Studenta, U Manna-Whitneya, ANOVA albo test Kruskalla-Wallisa
Uwaga: ankieta nie jest kolejnÄ metodÄ statystycznÄ tylko technikÄ zbierania danych. Wszystkie metody juĹź zostaĹy przedstawione i Ĺźadna nowe nie bÄdzie.
KaĹźde w tym ankietowe.
NaleĹźy zastanowiÄ siÄ nad trzema sprawami:
Najlepiej jakÄ Ĺ zaleĹźnoĹÄ. Na przykĹad: Stress a wypalenie zawodowe; satysfakcja zawodowa a retencja; determinanty satysfakcji zawodowej
MoĹźe byÄ od biedy opis czegoĹ lub porĂłwnanie czegoĹ z czymĹ. PrzykĹady: nadwaga wĹrĂłd studentĂłw wydziaĹu zdrowia PSW; Analiza porĂłwnawcza wypalenia zawodowego pielÄgniarek pracujÄ cych w róşnych systemach opieki.
JeĹźeli mamy zamiar badaĹ nadwagÄ, to powinniĹmy zmierzyÄ masÄ ciaĹa. JeĹźeli celem jest ustalenie zaleĹźnoĹci pomiÄdzy stresem a wypaleniem zawodowym to niewÄ tpliwie powinniĹmy zmierzyÄ stress i wypalenia. Jak dotÄ d banalnie prosto. Problem zaczyna siÄ w momencie odpowiedzi na pytanie jak
MoĹźemy pytaÄ w ankiecie o dwie rzeczy:
Fakty (wiek, staĹź, zawĂłd, tÄtno, przebyte choroby)
Przekonania, WartoĹci, Postawy; Uczucia (strach / radoĹÄ) albo Zamiary (w jÄzyku Attitudes/Emotions/Intentions)
Mierzenie faktĂłw nie wymaga dodatkowych objaĹnieĹ. Problem jest z mierzeniem przekonaĹ.
Przekonanie to idea, ktĂłrÄ jednostka uwaĹźa za prawdziwÄ . WartoĹci to trwaĹe przekonania o tym, co jest waĹźne dla jednostki. StajÄ siÄ standardami, wedĹug ktĂłrych jednostki dokonujÄ wyborĂłw. Postawy to mentalne dyspozycje/nastawienie przed podjÄciem decyzji, ktĂłre skutkujÄ okreĹlonym zachowaniem (zrobiÄ to a nie tamto). Postawy ksztaĹtowane sÄ wartoĹciami i przekonaniami.
Postawy/uczucia/zamiary sÄ to pojÄcia abstrakcyjne. CzÄsto (albo zawsze) definiowane w obszarze psychologii, nauk o zarzÄ dzaniu itp.
Pomiar przekonaĹ jest dokonywany w specyficzny sposĂłb. Definicja koncepcyjna definiuje pojÄcie (zaufanie do kogoĹ/czegoĹ to przekonanie, Ĺźe dziaĹania tego kogoĹ/czegoĹ okaĹźÄ siÄ zgodne z naszymi oczekiwaniami; satysfakcja to uczucie przyjemnoĹci, zadowolenia z czegoĹ; samoskutecznoĹÄ to przekonanie, iĹź jest siÄ w stanie zrealizowaÄ okreĹlone dziaĹanie lub osiÄ gnÄ Ä wyznaczone cele). Definicja operacyjna okreĹla jak zmierzyÄ pojÄcie (jak zmierzyÄ satysfakcjÄ) PrzejĹcie od DK do DO bywa czasami mocno, hmm⌠arbitralne.
PrzykĹadowo chcemy siÄ dowiedzieÄ czy i jak bardzo respondenci bojÄ siÄ COVID19.
W najprostszej wersji siÄ po prostu pytamy: Czy pan/pani boi siÄ COVID19? i dajemy respondentowi trzy moĹźliwe warianty odpowiedzi: Tak/Nie/Nie wiem.
MoĹźe teĹź byÄ piÄÄ wariantĂłw: bardzo siÄ bojÄâbojÄ siÄâani/aniânie bojÄ siÄâzupeĹnie siÄ nie bojÄ.
TakÄ skalÄ pomiarowÄ okreĹlamy jak wiemy jako porzÄ dkowÄ . Pomiary nie sÄ liczbami ale sÄ uporzÄ dkowane. Rangi wartoĹci sÄ juĹź liczbami (np 1â5 w drugim przykĹadzie), moĹźna je np. uĹredniaÄ Tego typu skala pomiarowa, typowa dla ankiet, nosi nazwÄ skali Likerta. MoĹźna sobie wymyĹlaÄ skalÄ Likerta 7-punktowÄ i wiÄcej.
Moim zdaniem powyĹźej 7 wariantĂłw normalny respondent bÄdzie miaĹ problem czy siÄ bardziej-bardziej czy bardziej-bardziej-bardziej boi.
PoniewaĹź skala Likerta jest zgrubna to uwaĹźa siÄ powszechnie Ĺźe lepszy wynik da pomiar wielokrotny. W naukach podstawowych mierzymy (np. linijkÄ ) parÄ razy, a wynik uĹredniamy co daje pomiar bardziej precyzyjny tutaj pytamy siÄ parÄ razy o to samo co ma daÄ podobny efekt (mniejszy Ĺredni bĹÄ d pomiaru). Taka seria pytaĹ nosi teĹź nazwÄ skali albo inwentarza.
Nie pytamy siÄ zatem Czy pan/pani boi siÄ COVID19? tylko zadajemy seriÄ pytaĹ o strach wzglÄdem COVID19.
I am most afraid of Corona
It makes me uncomfortable to think about Corona
My hands become clammy when I think about Corona
I am afraid of losing my life because of Corona
When I watch news and stories about Corona on social media, I become nervous or anxious.
I cannot sleep because Iâm worrying about getting Corona.
My heart races or palpitates when I think about getting Corona
albo:
BojÄ siÄ koronawirusa
CzujÄ dyskomfort, gdy myĹlÄ o koronawirusie
PocÄ mi siÄ dĹonie, gdy myĹlÄ o koronawirusie
BojÄ siÄ, Ĺźe mogÄ straciÄ Ĺźycie z powodu koronawirusa
Gdy oglÄ dam wiadomoĹci i czytam o koronawirusie w mediach spoĹecznoĹciowych, robiÄ siÄ nerwowy i niespokojny
Nie mogÄ spaÄ, poniewaĹź martwiÄ siÄ, Ĺźe ja lub moi bliscy zaraĹźÄ siÄ
DostajÄ palpitacji serca, gdy myĹlÄ o tym, Ĺźe mĂłgĹbym siÄ zaraziÄ.
OdpowiadajÄ cy ma do wyboru piÄÄ wariantĂłw odpowiedzi: zdecydowanie nie/nie/nie mam zdania/tak/zdecydowanie tak
The Fear of COVID-19 Scale: Development and Initial Validation. International Journal of Mental Health and Addiction, 1â9. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7100496/
Fear of COVID-19 Scale (FCV-19S) across countries: Measurement invariance issues https://onlinelibrary.wiley.com/doi/10.1002/nop2.855
Fear of COVID-19, psychological distress, work satisfaction and turnover intention among frontline nurses https://onlinelibrary.wiley.com/doi/full/10.1111/jonm.13168
LÄk przed koronawirusem COVID-19 i lÄk przed ĹmierciÄ â polskie adaptacje narzÄdzi https://www.termedia.pl/Fear-of-COVID-19-and-death-anxiety-Polish-adaptations-of-scales,116,44937,1,1.html
Ukryty czynnik (strach) ksztaĹtuje wartoĹci indykatorĂłw (odpowiedzi na pytania) Taki sposĂłb pomiaru ukrytego czynnika (latent w jÄzyku) okreĹla siÄ mianem refleksyjnego (co jest kalkÄ od reflexive)
Alternatywny sposĂłb definiowania ukrytego (w pewnym sensie, raczej zĹoĹźonego) czynnika nosi nazwÄ formatywnego (albo indeksu): czynnik jest sumÄ indykatorĂłw. PrzykĹadem moĹźe byÄ SES: status socjo-ekonomiczny bÄdÄ cy agregatem wyksztaĹcenia, dochodu i zawodu.
W zaĹoĹźeniu indykatory sÄ jednakowo dobrymi miarami czynnika refleksyjnego i jako takie powinny byÄ mocno skorelowane (mierzÄ to samo). Natomiast skĹadniki czynnika formatywnego nie powinny byÄ skorelowane, raczej kaĹźdy powinien mierzyÄ inny aspekt czynnika. KtoĹ moĹźe byÄ profesorem za przeproszeniem filozofii, nie mieÄ pracy i kiepskie dochody. Tylko jeden z trzech aspektĂłw podwyĹźsza mu SES; albo Ĺwietnie zarabiajÄ ca prostytutka bez maturyâŚ.
DobrÄ wiadomoĹciÄ jest, Ĺźe najprostszy sposĂłb pomiaru traktuje czynniki refleksyjne i formatywne jednakowo: wartoĹciÄ czynnika jest suma wartoĹci indykatorĂłw. JeĹźeli indykatory sÄ mierzone za pomocÄ skali Likerta suma rang po prostu. W skali strachu przed COVID ten kto siÄ najbardziej boi powinien odpowiedzieÄ 7 razy zdecydowanie tak co odpowiada sumie 35 rang (jeĹźeli rangujemy od 1 do 5). Ten ktĂłry siÄ wcale nie boi zaĹ 7.
MaĹym utrudnieniem mogÄ byÄ pytania odwrĂłcone. JeĹźeli pytamy o strach przed COVID i w kaĹźdym pytaniu jak bardzo ktoĹ siÄ boi, albo jak bardzo mu serce bije, ale w jednym z pytaĹ zapytamy nie bojÄ siÄ COVID To ranga 5 odpowiada uczuciu braku strachu. Rangi w pytaniach odwrĂłconych naleĹźy przeliczyÄ (odwrĂłciÄ): 1 zamieniÄ na 5, 2 na 4 itd⌠JeĹźeli uĹźywamy cudzych skal to w opisie powinno byÄ wskazane ktĂłre pytania sÄ odwrĂłcone.
Zalecany schemat postÄpowania jeĹźeli w ankiecie majÄ byÄ mierzone przekonania (strach, samoskutecznoĹÄ, wypalenie zawodowe, stress czy satysfakcja):
DoksztaĹcamy siÄ nieco z psychologii mimo wszystko
Robimy przeglÄ d literatury i znajdujemy skalÄ, ktĂłrÄ ktoĹ juĹź wymyĹliĹ Ĺźeby to mierzyÄ; raczej nie naleĹźy wymyĹlaÄ wĹasnych skal.
Robimy ankietÄ (w Internecie) i zbieramy dane
Wykonujemy analizÄ statystycznÄ
Banalnie proste
Celem jest ocena wielkoĹci zjawiska palenia tytoniu oraz poziom wiedzy na temat szkodliwoĹci palenia tytoniu wĹrĂłd studentĂłw RM/PO PSW oraz zweryfikowanie wpĹywu wybranych czynnikĂłw warunkujÄ cych na ten naĹĂłg.
Postawiono nastÄpujÄ ce hipotezy badawcze
jaka jest wielkoĹÄ zjawiska palenie tytoniu wĹrĂłd studentĂłw PSW?
jaka jest wiedza na temat szkodliwoĹci palenia tytoniu wĹrĂłd studentĂłw PSW?
czy palenie jest skorelowane z pĹciÄ , staĹźem pracy i miejscem pracy?
czy wiedza na temat szkodliwoĹci palenie jest skorelowana z pĹciÄ , staĹźem pracy i miejscem pracy?
czy palenie jest skorelowane z wiedzÄ na temat szkodliwoĹci palenia?
Badanie ankietowe wĹrĂłd studentĂłw RM oraz PO przeprowadzono w styczniu 2023. Ankieta zawieraĹa pytania dotyczÄ ce palenia tytoniu (pali/nie pali/paliĹ, jak dĹugo pali itd), test wiedzy na temat szkodliwoĹci palenia oraz pytania o rodzaj miejsca pracy, staĹź pracy i pĹeÄ itd.
PiÄÄ nastÄpujÄ cych pytaĹ oceniaĹo wiedzÄ ankietowanego:
W przypadku pytaĹ jednokrotnego wyboru, za wskazanie poprawnej odpowiedzi respondent otrzymywaĹ 1 punkt. W przypadku pytaĹ wielokrotnego wyboru za wskazanie prawidĹowej odpowiedzi respondent otrzymywaĹ 1 punkt, ale za wskazanie nieprawidĹowej otrzymywaĹ (minus) -1 punkt (aby nie opĹacaĹa siÄ strategia zaznaczenia wszystkich odpowiedzi). Maksymalna moĹźliwa do uzyskania liczba punktĂłw wynosiĹa 19.
HipotezÄ 1. oceniono na podstawie odsetka respondentĂłw palÄ cych
HipotezÄ 2. oceniono na podstawie odsetka respondentĂłw wykazujÄ cych siÄ dobrÄ i bardzo dobrÄ wiedzÄ na temat palenia
HipotezÄ 3â5 zweryfikowano z wykorzystaniem tablic korelacyjnych/testu chi-kwadrat oraz porĂłwnania Ĺredniego poziomu depresji w grupach za pomocÄ testĂłw Manna-Whitneya oraz Kruskalla-Wallisa
W badaniu wziÄĹo udziaĹ 110 studentĂłw. Otrzymano 110 poprawnie wypeĹnionych ankiet. Ĺrednia wartoĹÄ testu oceniajÄ cego wiedzÄ wyniosĹa 10.3636364 (odchylenie standardowe 3.9970798)
RozkĹad ankietowanych ze wzglÄdu na status wzglÄdem palenia przedstawiono na rysunku
RozkĹad ankietowanych ze wzglÄdu na pĹeÄ przedstawiono na rysunku
RozĹad ankietowanych ze wzglÄdu na staĹź pracy przedstawiono na rysunku
RozkĹad ankietowanych ze wzglÄdu na rodzaj miejsca pracy przedstawiono na rysunku
PalÄ lub paliĹo 62 respondentĂłw ( 56 %). Ĺťeby stwierdziÄ czy to jest duĹźo czy maĹo to np. moĹźna by porĂłwnaÄ z jakÄ Ĺ ĹredniÄ ogĂłlnopolskÄ .
Ĺrednia wartoĹÄ uzyskana w teĹcie wyniosĹa 10.3636364 (mediana 11); 3/4 respondentĂłw nie uzyskaĹo wiÄcej niĹź 13 (czyli 68.4 %)
Czy palenie jest skorelowane z pĹciÄ ?
K | M | |
---|---|---|
Nigdy nie paliĹem/am | 31 | 17 |
PaliĹem/Ĺam | 27 | 12 |
W dalszym ciÄ gu palÄ | 19 | 4 |
##
## Pearson's Chi-squared test
##
## data: t.sex.f
## X-squared = 2.4228, df = 2, p-value = 0.2978
Nie jest o czym Ĺwiadczy wysoka wartoĹÄ p (0.2977764)
Czy palenie jest skorelowane ze staĹźem pracy?
0-4 | 10-14 | 15 i wiÄcej | 5-9 | |
---|---|---|---|---|
Nigdy nie paliĹem/am | 14 | 4 | 24 | 6 |
PaliĹem/Ĺam | 8 | 2 | 23 | 6 |
W dalszym ciÄ gu palÄ | 6 | 2 | 11 | 4 |
##
## Pearson's Chi-squared test
##
## data: t.staz.f
## X-squared = 1.7687, df = 6, p-value = 0.9397
Nie jest o czym Ĺwiadczy wysoka wartoĹÄ p (0.9396967)
Czy palenie jest skorelowane z miejscem pracy?
Przychodnia | Szpital | |
---|---|---|
Nigdy nie paliĹem/am | 5 | 43 |
PaliĹem/Ĺam | 3 | 36 |
W dalszym ciÄ gu palÄ | 3 | 20 |
##
## Pearson's Chi-squared test
##
## data: t.praca.f
## X-squared = 0.47674, df = 2, p-value = 0.7879
Nie jest o czym Ĺwiadczy wysoka wartoĹÄ p (0.7879097)
Czy wiedza na temat palenia jest skorelowana z pĹciÄ :
pĹeÄ | Ĺrednia | n |
---|---|---|
K | 10.831169 | 77 |
M | 9.272727 | 33 |
## $p.value
## [1] 0.04883299
PorĂłwnujemy dwie grupy zatem stosujemy test Manna-Whitneya. WartoĹÄ p wynosi 0.048833 â nie ma podstaw od odrzucenia hipotezy o braku korelacji na poziomie 0,05 (ale na poziomie 0,1 juĹź byĹmy mogli przyjÄ Ä Ĺźe takowa korelacji istnieje)
Czy wiedza na temat palenia jest skorelowana z miejscem pracy:
m.pracy | Ĺrednia | n |
---|---|---|
Przychodnia | 10.36364 | 11 |
Szpital | 10.36364 | 99 |
## $p.value
## [1] 0.8026325
PorĂłwnujemy dwie grupy zatem stosujemy test Manna-Whitneya. WartoĹÄ p wynosi 0.8026325 â nie ma podstaw od odrzucenia hipotezy o braku korelacji na poziomie 0,05.
Czy wiedza na temat palenia jest skorelowana ze staĹźem:
staĹź | Ĺrednia | n |
---|---|---|
0-4 | 9.928571 | 28 |
10-14 | 9.875000 | 8 |
15 i wiÄcej | 10.793103 | 58 |
5-9 | 9.812500 | 16 |
## $p.value
## [1] 0.6771844
PorĂłwnujemy wiÄcej niĹź dwie grupy zatem stosujemy test Kruskalla-Wallisa. WartoĹÄ p wynosi 0.6771844 â nie ma podstaw od odrzucenia hipotezy o braku korelacji na poziomie 0,05.
Czy wiedza o szkodliwoĹci palenia jest skorelowana ze statusem wzglÄdem palenia? Chcemy zastosowaÄ tablicÄ korelacyjnÄ /test chi kwadrat. Musimy zatem zamieniÄ skalÄ liczbowÄ zmiennej mierzÄ cej wiedzÄ nt szkodliwoĹci palenia na nominalnÄ , np tak: 0â5 maĹa; 6â10 Ĺrednia; 11â15 duĹźa, 16â19 ogromna:
Nigdy nie paliĹem/am | PaliĹem/Ĺam | W dalszym ciÄ gu palÄ | |
---|---|---|---|
duĹźa | 22 | 16 | 14 |
maĹa | 7 | 6 | 4 |
ogromna | 2 | 3 | 2 |
Ĺredna | 17 | 14 | 3 |
##
## Pearson's Chi-squared test
##
## data: wiedza.status.t
## X-squared = 4.9954, df = 6, p-value = 0.5444
Widza i status wzg. palenia nie jest skorelowana o czym Ĺwiadczy wysoka wartoĹÄ p (0.544403)
MoĹźna to samo zweryfikowaÄ porĂłwnujÄ c Ĺrednie w grupach i stosujÄ c test Kruskalla-Wallisa
status | Ĺrednia | n |
---|---|---|
Nigdy nie paliĹem/am | 10.31250 | 48 |
PaliĹem/Ĺam | 10.07692 | 39 |
W dalszym ciÄ gu palÄ | 10.95652 | 23 |
## $p.value
## [1] 0.7787663
Wynik jest identyczny (wysoka wartoĹÄ p 0.7787663)
Ponad poĹowa studentĂłw pali lub paliĹa
Nie ma zwiÄ zku pomiÄdzy statusem wzglÄdem palenia/wiedzÄ o szkodliwoĹci palenia a pĹciÄ , miejscem pracy, staĹźem.
Celem jest ustalenie czy depresja jest istotnym problemem wĹrĂłd studentĂłw RM/PO PSW oraz zweryfikowanie wybranych czynnikĂłw warunkujÄ cych depresjÄ.
Badanie ankietowe wĹrĂłd studentĂłw RM oraz PO przeprowadzono w styczniu 2023. Ankieta zawieraĹa test samooceny depresji Becka oraz pytania o rodzaj miejsca pracy, staĹź pracy i pĹeÄ.
Test samooceny depresji Becka skĹada siÄ z 21 pytaĹ. W kaĹźdym pytaniu moĹźliwe sÄ 4 warianty odpowiedzi, odpowiadajÄ ce zwiÄkszonej intensywnoĹci objawĂłw depresji, ktĂłrym w zwiÄ zku z tym przypisuje siÄ od zera do 3 punktĂłw. Maksymalna liczba punktĂłw w teĹcie wynosi 63 a minimalna 0.
Interpretacja wynikĂłw testu Becka 0â19 brak/Ĺagodna depresja; 20â25 umiarkowana; 26â63 cieĹźka depresja.
Postawiono nastÄpujÄ ce hipotezy badawcze
depresja stanowi duĹźy problem wĹrĂłd studentĂłw PSW
problem depresji zaleĹźy od miejsca pracy
problem depresji zaleĹźy od staĹźu pracy
problem depresji zaleĹźy od pĹci
Sposoby weryfikacji:
HipotezÄ 1. oceniono na podstawie odsetka respondentĂłw wykazujÄ cych ciÄĹźkÄ postaÄ depresji;
HipotezÄ 2â4 zweryfikowano z wykorzystaniem tablic korelacyjnych/testu chi-kwadrat oraz porĂłwnania Ĺredniego poziomu depresji w grupach za pomocÄ testĂłw Manna-Whitneya oraz Kruskalla-Wallisa
W badaniu wziÄĹo udziaĹ 103 studentĂłw. Otrzymano 103 poprawnie wypeĹnionych ankiet. Ĺrednia wartoĹÄ testu Becka wyniosĹa 8.3786408 (odchylenie standardowe 8.5773488)
CiÄĹźkÄ postaÄ depresji wykazuje zaledwie 3% studentĂłw. NaleĹźy odrzuciÄ hipotezÄ Ĺźe depresja stanowi powaĹźny problem wĹrĂłd studentĂłw RM/PO PSW.
Aby mĂłc zastosowaÄ metody tablicy korelacyjnej i testu chi-kwadrat oryginalne wartoĹci liczbowe depresji zamieniono na skalÄ porzÄ dkowÄ : 0â19 brak/Ĺagodna depresja (B); 20â25 umiarkowana (Ĺ); 26â63 ciÄĹźka depresja (C).
Tablica korelacyjna i test chi-kwadrat:
K | M | |
---|---|---|
B | 64 | 29 |
C | 2 | 1 |
Ĺ | 5 | 2 |
##
## Pearson's Chi-squared test
##
## data: dep.sex.f
## X-squared = 0.028134, df = 2, p-value = 0.986
Tablica korelacyjna i test chi-kwadrat:
06 i mniej | 07-12 | 13-18 | 19 i wiÄcej | |
---|---|---|---|---|
B | 36 | 6 | 9 | 42 |
C | 1 | 0 | 1 | 1 |
Ĺ | 2 | 1 | 2 | 2 |
##
## Pearson's Chi-squared test
##
## data: dep.staz.f
## X-squared = 4.719, df = 6, p-value = 0.5803
albo jeĹźeli depresjÄ mierzymy na skali liczbowej moĹźna porĂłwnaÄ wartoĹci Ĺrednie i zastosowaÄ test Kruskalla-Wallisa
staĹź | Ĺrednia | n |
---|---|---|
06 i mniej | 8.512821 | 39 |
07-12 | 7.857143 | 7 |
13-18 | 7.666667 | 12 |
19 i wiÄcej | 8.533333 | 45 |
## $p.value
## [1] 0.678923
Wynik jest ten sam (brak zaleĹźnoĹci)
Tablica korelacyjna i test chi-kwadrat:
Przychodnia | Szpital | |
---|---|---|
B | 12 | 81 |
C | 0 | 3 |
Ĺ | 0 | 7 |
##
## Pearson's Chi-squared test
##
## data: dep.praca.f
## X-squared = 1.4605, df = 2, p-value = 0.4818
Albo jeĹźeli depresjÄ mierzymy na skali liczbowej moĹźna porĂłwnaÄ wartoĹci Ĺrednie i zastosowaÄ test Manna-Whitneya
m-pracy | Ĺrednia | n |
---|---|---|
Przychodnia | 7.833333 | 12 |
Szpital | 8.450549 | 91 |
## $p.value
## [1] 0.8528214
Wynik jest ten sam (brak zaleĹźnoĹci)
Depresja nie jest istotnym problemem wĹrĂłd studentĂłw RM/PO PSW
Nie ma zwiÄ zku pomiÄdzy depresjÄ a staĹźem, pĹciÄ i miejscem pracy
W przygotowaniu na podstawie ankiety: https://docs.google.com/forms/d/1bgNMhPEJMjiWeLfrmEAnPpns5U7Rooc-KOaeS7XlLV0/edit
Pytanie 1
Pytanie 2
Pytanie 3
Pytanie 4
Pytanie 5
Pytanie 6
Pytanie 7
Pytanie 8
Pytanie 9
Pytanie 10
Pytanie 11
Pytanie 12
Pytanie 13
Pytanie 14
Pytanie 15
Pytanie 16
Pytanie 17
Pytanie 18
Pytanie 19
Pytanie 20
Pytanie 21
Odczuwanie smutku i przygnÄbienia (1) Martwienie siÄ o przyszĹoĹÄ (2) UwaĹźasz, Ĺźe zaniedbujesz swoje obowiÄ zki? (3) JesteĹ zadowolony z siebie? (4) Czy czÄsto masz poczucie winy? (5) Czy zasĹugujesz na karÄ? (6) Zadowolenie z siebie (7) Czy czujesz siÄ gorszy od innych? (8) Czy masz myĹli samobĂłjcze? (9) CzÄsto chce Ci siÄ pĹakaÄ? (10) JesteĹ ostatnio bardziej nerwowy i rozdraĹźniony? (11) Czy zmieniĹo siÄ coĹ w Twoim zainteresowaniu innymi ludĹşmi? (12) Czy ostatnio miewasz wiÄksze problemy z podejmowaniem róşnych decyzji? (13) Czy uwaĹźasz, Ĺźe wyglÄ dasz gorzej i mniej atrakcyjnie niĹź kiedyĹ? (14) Czy masz wiÄksze trudnoĹci z wykonywaniem róşnych prac i zadaĹ? (15) Masz kĹopoty ze snem? (16) Czy mÄczysz siÄ bardziej niĹź zwykle? (17) Czy masz kĹopoty z apetytem? (18) W ciÄ gu ostatniego miesiÄ ca nie stosowaĹem diety, aby schudnÄ Ä, lecz straciĹem na wadze (19) Czy ostatnio bardziej martwisz siÄ swoim stanem zdrowia? (20) Czy masz kĹopoty z potencjÄ ? (21)
Poziom wiedzy personelu pielÄgniarskiego na temat szkodliwoĹci palenia tytoniu
PĹeÄ âĄ Kobieta ⥠MÄĹźczyzna
Wiek
Pochodzenie ⥠wieŠ⥠Miasto do 20 tys. mieszkaĹcĂłw ⥠Miasto powyĹźej 20 tyĹ mieszkaĹcĂłw
WyksztaĹcenie ⥠Ĺrednie medyczne ⥠Licencjat pielÄgniarstwa ⥠Magister pielÄgniarstwa ⥠Inne wyĹźsze
StaĹź pracy ⥠Mniej niĹź rok ⥠1-10 lat ⥠10-15 lat ⥠WiÄcej niĹź 15 lat
Miejsce pracy ⥠OddziaŠzabiegowy ⥠OddziaŠzachowawczy ⥠Przychodnia/poradnia
Czy kiedykolwiek paliĹeĹ/aĹ papierosy? ⥠PaliĹem/Ĺam ⥠W dalszym ciÄ gu palÄ âĄ Nigdy nie paliĹem/am
Od ilu lat palisz? ⥠Nie palÄ/Nie dotyczy ⥠Mniej niĹź rok ⥠1-10 lat ⥠11-15 lat ⥠WiÄcej niĹź 15 l
Czy zdarza Ci siÄ paliÄ w miejscu pracy? ⥠Tak ⥠Nie ⥠Nie dotyczy
Czy prĂłbowaĹeĹ kiedykolwiek rzuciÄ palenie? ⥠Tak, udaĹo siÄ âĄ Tak, ale wrĂłciĹem/am do naĹogu ⥠Nie ⥠Nie dotyczy
Czy palÄ c przyznajesz siÄ do uzaleĹźnienia ⥠Tak ⥠Nie ⥠Nie dotyczy
UwaĹźasz, Ĺźe bardziej szkodliwe dla zdrowia jest: ⥠Palenie czynne - dym tytoniowy wdychany bezpoĹrednio przez palacza ⥠Palenie bierne-boczny strumieĹ dymu â KaĹźda forma kontaktu z dymem jest rĂłwnie szkodliwa ⥠Nie wiem/Nie mam zdania
Czy uwaĹźasz,Ĺźe przepisy prawa powinny zabraniaÄ palenia w obecnoĹci dzieci poniĹźej 15 roku Ĺźycia? ⥠Tak ⥠Nie ⥠Nie wiem/nie mam zdania
Czy przerwa na papierosa pomaga Ci w sytuacjach stresowych? ⥠Tak ⥠Nie ⥠Nie dotyczy
Czy palenie nikotyny sprawia Ci przyjemnoĹÄ? ⥠Tak ⥠Nie ⥠Nie dotyczy
Jakie wedĹug Ciebie choroby ukĹadu oddechowego mogÄ byÄ spowodowane bezpoĹrednio przez palenie papierosĂłw?(wielokrotnego) â PrzewlekĹa obturacyjna choroba pĹuc â Astma oskrzelowa â Alergie wziewne ⥠GruĹşlica ⥠Zapalenie pĹuc â PrzewlekĹe zapalenie oskrzeli â Infekcje drĂłg oddechowych ⥠Palenie nie powoduje chorĂłb ukĹadu oddechowego ⥠Nie wiem
Jakie wedĹug Ciebie choroby kardiologiczne mogÄ byÄ spowodowane bezpoĹrednio przez palenie papierosĂłw? (wielokrotnego) â NadciĹnienie tÄtnicze krwi â ZawaĹ miÄĹnia sercowego â Udar mĂłzgu â Choroba niedokrwienna serca â MiaĹźdĹźyca tÄtnic obwodowych â Zaburzenie rytmu serca â Choroba Buergera ⥠Hipercholesterolemia ⥠TÄtniak aorty ⥠Palenie nie powoduje chorĂłb kardiologicznych
Czy palenie papierosĂłw powoduje choroby ukĹadu pokarmowego? â Tak ⥠Nie ⥠Nie wiem
Jaki wedĹug Ciebie ma wpĹyw palenie papierosĂłw na narzÄ dy zmysĹĂłw? (wielokrotnego) â UpoĹledza wÄch i smak â Powoduje podraĹźnienie spojĂłwek â ObniĹźa apetyt â Niszczy struny gĹosowe â Zmniejsza ostroĹÄ wzroku ⥠Palenie nie ma negatywnego wpĹywu na narzÄ dy zmysĹu.
Jak oceniasz swojÄ wiedzÄ na temat palenia papierosĂłw i jego wpĹywu na zdrowie czĹowieka? ⥠Bardzo dobrze ⥠Dobrze ⥠PrzeciÄtnie ⥠Śle
Czy wzorce siÄgania po tytoĹ wyniosĹaĹ/wyniosĹeĹ z domu rodzinnego ⥠Tak ⥠Nie ⥠Nie dotyczy
PrawidĹowe odpowiedzi zaznaczono â
Jak wspomniano w rozdziale 1, statystkÄ moĹźna uprawiaÄ (tj. liczyÄ statystyki w drugim tego sĹowa znaczeniu :-)) wykorzystujÄ c róşne programy. My zdecydowaliĹmy siÄ promowaÄ Jamovi, program ktĂłry naszym zdaniem jest najlepszym â z punktu widzenia wiÄkszoĹci studentĂłw Nauk o Zdrowiu â poĹÄ czeniem ceny, moĹźliwoĹci, prostoty i ĹatwoĹci nauki.
Jamovi jest oprogramowaniem rozpowszechnianym na licencji typu Open Source, a wiÄc moĹźna go uĹźywaÄ za darmo. Program jest dostÄpny ze strony https://www.jamovi.org/download.html. Klikamy, ĹciÄ gamy, uruchamiamy instalator. Program jest doĹÄ duĹźy, ale to nie jest aĹź tak wielki problem w czasach kiedy pojemnoĹci dyskĂłw w domowym komputerze zaczynajÄ siÄ od 250 gigabajtĂłw. Po zainstalowaniu uruchamiamy program, ktĂłrego ekrano startowy wyglÄ da jak na rysunku
Menu akcji umoĹźliwia wykonanie podstawowych akcji:
wczytanie danych i zapisanie danych (pierwsza pozycja menu oznaczona jako trzy poziome kreski)
podglÄ d (w sensie skontrolowania wartoĹci zmiennych) i modyfikacjÄ danych (pozycje Zmienne oraz Dane)
wykonanie obliczeĹ (pozycja Analizy)
modyfikowanie raportu (pozycja Edit)
Typowa sesja w Jamovi:
Wczytanie danych z pliku o praktycznie dowolnym formacie. JeĹźeli przykĹadowo dane sÄ wynikiem wykonania badania ankietowego z wykorzystaniem Formularzy Google to zalecamy posĹugiwanie siÄ formatem CSV.
Transformacja danych. Przekodowanie wartoĹci nominalnych na rangi. Przekodowanie wartoĹci liczbowych na nominalne. OdwrĂłcenie pytaĹ odwrĂłconych. Obliczenie sum/srednich rang dla wielu zmiennych.
Wykonanie obliczeĹ:
Analiza struktury (Eksploracja),
Analiza zaleĹźnoĹci miÄdzy zmiennÄ liczbowÄ a nominalnÄ (testy t/ANOVA),
Analiza zaleĹźnoĹci miÄdzy zmiennymi liczbowymi: wspĂłĹczynnik korelacji liniowej/macierz korelacji (Regresja) 4 Analiza zaleĹźnosci miÄdzy zmiennÄ liczbowÄ a zmiennymi liczbowymi/nominalnymi: regresja liniowa i logistyczna (Regresja)
Analiza zaleĹźnoĹci miÄdzy zmiennymi nominalnymi: tablica korelacyjna, test chi-kwadrat zgodnoĹci (CzÄstoĹci)
Wykonanie obliczeĹ jest banalnie proste i sprowadza siÄ do wybrania myszkÄ odpowiednich zmiennych oraz procedury ktĂłra ma byÄ wykonana. Wynik obliczeĹ pojawia siÄ natychmiast w oknie wynikĂłw. JeĹźeli coĹ nam nie wyszĹo moĹźna procedurÄ poprawiÄ a poprzedni wynik usunÄ Ä z okna wynikowego.
PrzykĹad nieco absurdalny, ale za to w zwartej postaci ilustrujÄ cy praktyczne sposoby transformacji danych oraz wykorzystania wszystkich procedur omawianych w podrÄczniku.
W wyniku przeprowadzenia badania ankietowego zebrano za pomocÄ Formularza Google dane dotyczÄ ce satysfkacji/zamiaru odejĹcia oraz wiedzy nt. szkodliwoĹci palenia tytoniu. Wyniki wyeksportowano do arkusza kalkulacyjnego, ktĂłrego poczÄ tek wyglÄ da jakoĹ tak:
Ankieta skĹada siÄ z 10 nastÄpujÄ cych pytaĹ:
OgĂłlnie rzecz biorÄ
c nie lubiÄ swojej pracy
(kolumna
B
),
OgĂłlnie rzecz biorÄ
c jestem zadowolony ze swojej pracy
(C
), OgĂłlnie rzecz biorÄ
c, lubiÄ tu pracowaÄ
(D
),
Jakie wedĹug Ciebie choroby ukĹadu oddechowego mogÄ
byÄ spowodowane bezpoĹrednio przez palenie papierosĂłw?
(E
),
CzÄsto powaĹźnie rozwaĹźam odejĹcie z obecnej pracy
(F
), Zamierzam rzuciÄ obecnÄ
pracÄ
(G
), ZaczÄ
Ĺem szukaÄ innej pracy
(H
), PĹeÄ
(I
),
Wiek (w latach)
(J
), oraz
StaĹź pracy
(K
).
Ponadto Formularz Googla dodaĹ automatycznie sygnaturÄ czasowÄ
jako
zawartoĹÄ pierwszej kolumny (A
).
Zmieniamy wartoĹci w pierwszym wierszu, ktĂłry powinien zawieraÄ nazwy zmiennych. Nazwy zmiennych powinny byÄ jednowyrazowe i w miarÄ krĂłtkie Ĺźeby siÄ później moĹźna nimi wygodnie posĹugiwaÄ. JednoczeĹnie nie powinny byÄ za krĂłtkie Ĺźeby od razu byĹo widaÄ jakie dane zawiera zmienna.
Jak widaÄ pytania z kolumn B
âC
mierzÄ
to
samo (satysfakcjÄ) wiÄc zmieniamy im nazwÄ na bardziej zwartÄ
s1
, s2
oraz s3
(s
od
satysfakcja). Podobnie poniewaĹź pytania z kolumn
F
âH
teĹź mierzÄ
to samo (zmiar odejĹcia), to
teĹź zmieniamy nazwy na coĹ krĂłtszego: zo1
,
zo2
, zo3
. KolumnÄ E
nazywamy
wiedza_nt_palenia
a kolumny I
, J
oraz K
odpowiednio: plec
, wiek
oraz staz
.
Teraz arkusz wyglÄ da jakoĹ tak:
Arkusz eksportujemy wybierajÄ
c format CSV. Bez problemu powinniĹmy go
wczytaÄ do Jamovi (trzy poziome kreski âOtwĂłrz
)
ReasumujÄ c:
Pytania oznaczone jako
s1
/s2
/s3
mierzÄ
satysfakcjÄ z pracy; pytania
zo1
/zo2
/zo3
mierzÄ
zamiar
odejĹcia z pracy. Pytania s1
âs3
oraz
zo1
âzo3
sÄ
pytaniami jednokrotnego
wyboru.
Pytanie oznaczone jako wiedza_nt_palenia
mierzy
wiedzÄ na temat palenia tytoniu. Jest to przykĹad wykorzystania pytania
z wielokrotnym wyborem.
Pytania plec
, wiek
, staz
mierzÄ
pĹeÄ (kobieta
/mÄĹźczyna
), wiek (lata
ukoĹczone) oraz staĹź pracy (lata przepracowane)
Pierwsza kolumna nie jest potrzebna ale jest dodawana przez aplikacjÄ Formularze Google.
Zwykle zawartoĹÄ arkusza zawierajÄ cego wyniki ankiety wymaga przekodowania. W naszym przykĹadzie naleĹźy wykonaÄ:
Zmienne s1âs3 oraz zo1âzo3 sÄ
mierzone w skali porzÄ
dkowej.
WartoĹci tych zmiennych chcemy zmieniÄ (przekodowaÄ) na rangi wg
schematu: Zdecydowanie siÄ nie zgadzam
= 1;
Nie zgadzam siÄ
= 2; Trudno powiedzieÄ
= 3
itd. Dodatkowo zauwaĹźmy Ĺźe s1 jest pytaniem odwrĂłconym. W takich
pytaniach naleĹźy przeliczyÄ rangi wg prostej formuĹy s1r = 6 - s1.
Zmienna plec
jest mierzona w skali nominalnej. Nie
musimy jest przekodowywaÄ
WartoĹÄ zmiennej wiedza_nt_palenia
naleĹźy
przekodowaÄ na liczbÄ wg schematu: za wybranie poprawnej odpowiedzi plus
jeden punkt; za wybranie bĹÄdnej odpowiedzi minus jeden punkt.
Uwaga: SposĂłb mierzenia wiedzy nt. palenia jest niepotrzebnie pokrÄcony; zamiast pytania z wielokrotnym wyborem spoĹrĂłd 8 moĹźliwoĹci/wariantĂłw proĹciej jest zastosowaÄ 8 pytaĹ Tak/Nie po czym pytania poprawne zsumowaÄ a pytania niepoprawne teĹź dodaÄ a wartoĹÄ odjÄ Ä od sumy uzyskanej dla pytaĹ poprawnych. My o tym wiemy, Ĺźe tak jest bez sensu ale pokazujemy jako przykĹad przekodowania pytania z wielokrotnym wyborem.
wiek
oraz staz
sÄ
liczbami. MogÄ
byÄ analizowane tak-jak-sÄ
(regresja/korelacja) ale moĹźna
teĹź je przekodowaÄ na wartoĹci nominalne (maĹy-Ĺredni-duĹźy staĹź) i
zastosowaÄ metody z grupy zmienna-liczbowa/zmienna nominalna (takie jak
test ANOVA czy Kruskala-Wallisa)Przekodowanie wykonujemy wybierajÄ c Dane w menu gĹĂłwnym.
Klikamy w nazwÄ zmiennÄ
, ktĂłrÄ
zamierzamy przekodowaÄ. Niech to
bÄdzie s1
. Kolumna po klikniÄciu zmieni kolor.
Wybieramy ikonÄ PrzeksztaĹcenie
. WypeĹniamy jak na
rysunku poniĹźej:
Uwaga: Jamovi nie zmieni wartoĹci zmiennej s1
tylko
utworzy nowÄ
zmiennÄ
z przekodowanymi wartoĹciami. Zmienna na podstawie
ktĂłrej jest tworzona nowa zmienna nazywa siÄ ĹşrĂłdĹowÄ
(s1
w
naszym przykĹadzie jest ĹşrĂłdĹowa.)
Wpisujemy sensownÄ
nazwÄ (na przykĹad s1p
od
przekodowana). Jak bÄdziemy uĹźywaÄ sensownych nazwa Ĺatwiej bÄdzie nam
siÄ pracowaĹo. Dobrze jest teĹź podaÄ w opisie co zawiera zmienna.
Klikamy w pole wyboru na dole (obok napisu
za pomocÄ
przeksztaĹcenia
) PowinniĹmy zobaczyÄ coĹ
takiego:
Wybieramy UtwĂłrz nowe przeksztaĹcenie
. Wpisujemy
sensownÄ
nazwÄ przeksztaĹcenia (na przykĹad Likert2R5
) oraz
formuĹÄ przeksztaĹcenia:
IF ($source=="Zdecydowanie siÄ nie zgadzam", 1,
IF ($source=="Nie zgadzam siÄ", 2,
IF ($source=="Trudno powiedzieÄ", 3,
IF ($source=="Zgadzam siÄ", 4, 5))))
FormuĹa moĹźe wydawaÄ siÄ przeraĹźajÄ ca, ale jest koncepcyjnie bardzo prosta:
IF (warunek, jeĹźeli-prawda, jeĹźeli-faĹsz)
Warunek
to fragment
$source=="Zdecydowanie siÄ nie zgadzam"
:
$source
oznacza bieĹźÄ
cÄ
wartoĹÄ zmiennej
ĹşrĂłdĹowej
==
to operator rĂłwnoĹci; jest
wiÄcej operatorĂłw, ktĂłre moĹźna wybraÄ z menu
$source=="Zdecydowanie siÄ nie zgadzam"
oznacza, Ĺźe
jeĹźeli bieĹźÄ
cÄ
wartoĹciÄ
w kolumnie ĹşrĂłdĹowej jest
Zdecydowanie siÄ nie zgadzam
to wykonaj
jeĹźeli-prawda
; w wypadku przeciwnym wykonaj
jeĹźeli-faĹsz
.
jeĹźeli-prawda
to zwykle wstawienie nowej wartoĹci;
jeĹźeli-faĹsz
to czÄsto nastÄpna formuĹa IF
albo wstawienie innej nowej wartoĹci. PrzykĹadowo jeĹźeli bieĹźÄ
cÄ
wartoĹciÄ
w kolumnie ĹşrĂłdĹowej jest
Zdecydowanie siÄ nie zgadzam
to wstaw 1
,
jeĹźeli nie jest to wstaw 0
:
IF ($source=="Zdecydowanie siÄ nie zgadzam", 1,0)
PoniewaĹź w naszym przykĹadzie mamy do przekodowania nie dwie a 5 wartoĹci musimy uĹźyÄ 4 warunkĂłw, ktĂłre sÄ zagnieĹźdĹźone jeden w drugim. MoĹźna powyĹźsze przepisaÄ, moĹźna teĹź skopiowaÄ z podrÄcznika i wkleiÄ do Jamovi.
Naciskamy Enter i gotowe. Zostaje utworzona zmienna s1p
zawierajÄ
ca zamiast napisĂłw rangi.
JeĹźeli uporaliĹmy siÄ z przekodowaniem s1
ustawiamy
kursor na s2
w okno danych. Naciskamy ikonÄ
PrzeksztaĹcenie
. Upewniamy siÄ Ĺźe zmiennÄ
ĹşrĂłdĹowÄ
jest
s2
. Zmieniamy nazwÄ nowej zmiennej na s2p
.
Klikamy w pole wyboru przeksztaĹcenia. Poprzednio byĹy tam tylko dwie
pozycje Brak
oraz UtwĂłrz nowe przeksztaĹcenie
teraz jest trzecia pozycja Likert2R5
czyli przeksztaĹcenie
ktĂłre zdefiniowaliĹmy dla zmiennej s1p. Wybieramy Likert2R5
bo zmiennÄ
s2
chcemy przekodowaÄ dokĹadnie w ten sam sposĂłb
jak s1
. Po wybraniu przeksztaĹcenia w oknie danych pojawia
siÄ nowa zmienna s2p
W podobny Ĺatwy sposĂłb przekodowujemy s3
oraz
zo1
, zo2
, zo3
Uwaga: polecenie IF
wpisujemy uĹźywajÄ
c
duĹźych liter. SĹowo $source
wpisujemy tak jak jest to
zademonstrowane ($Source
jest bĹÄdem.)
Przekodowanie pytanie z moĹźliwoĹciÄ
wielokrotnego wyboru jest rĂłwnie
proste tyle Ĺźe pisania jest wiÄcej. Zmienna
wiedza_na_temat_palenia
moĹźe zawieraÄ do oĹmiu
nastÄpujÄ
cych napisĂłw oddzielonych Ĺrednikami:
PrzewlekĹa obturacyjna choroba pĹuc
,
Astma oskrzelowa
, Alergie wziewne
,
GruĹşlica
(B), Zapalenie pĹuc
(B),
PrzewlekĹe zapalenie oskrzeli
,
Infekcje drĂłg oddechowych
,
Palenie nie powoduje chorĂłb ukĹadu oddechowego
(B).
Odpowiedzi bĹÄdne oznaczono jako (B).
W arkuszu lub oknie danych Jamovi ta zmienna wyglÄ da jakoĹ tak:
...,PrzewlekĹa obturacyjna choroba pĹuc,...
...,PrzewlekĹa obturacyjna choroba pĹuc;Astma oskrzelowa;Alergie wziewne;GruĹşlica;Zapalenie pĹuc;PrzewlekĹe zapalenie oskrzeli,...
...,Astma oskrzelowa,
...,Astma oskrzelowa;GruĹşlica;PrzewlekĹe zapalenie oskrzeli,...
...,PrzewlekĹa obturacyjna choroba pĹuc;Astma oskrzelowa;Infekcje drĂłg oddechowych,...
NaleĹźy zsumowaÄ wystÄ
pienia poprawne i wystÄ
pienia bĹÄdne. W tym celu
trzeba utworzyÄ tyle nowych zmiennych ile jest wariantĂłw odpowiedzi,
czyli w naszym przykĹadzie osiem. KaĹźda nowa zmienna jest przekodowywana
za pomocÄ
prostej formuĹy wykorzystujÄ
cÄ
funkcjÄ CONTAINS
(zawiera). PrzykĹadowo pierwsza (nazwijmy jÄ
wiedz1p
)
powinna byÄ utworzona w oparciu o nastÄpujÄ
ce przeksztaĹcenie
CONTAINS("PrzewlekĹa obturacyjna choroba pĹuc", $source)
Funkcja CONTAINS wstawi 1 jeĹźeli $source
zawiera
PrzewlekĹa obturacyjna choroba pĹuc
. OczywiĹcie nastÄpna
zmienna powinna zawieraÄ Astma oskrzelowa
:
CONTAINS("Astma oskrzelowa", $source)
I tak dalej aĹź do ostatniego wariantu odpowiedzi:
CONTAINS('Alergie wziewne', $source)
CONTAINS('GruĹşlica', $source)
CONTAINS('Zapalenie pĹuc', $source)
CONTAINS('PrzewlekĹe zapalenie oskrzeli', $source)
CONTAINS('Infekcje drĂłg oddechowych', $source)
CONTAINS('Palenie nie powoduje chorĂłb ukĹadu oddechowego', $source)
KaĹźda zmienna wiedza1
âŚwiedza8
zawiera 1
jeĹźeli ankietowany wskazaĹ dany wariant lub zero jeĹźeli nie wskazaĹ.
Ostatnia sprawa to przekodowanie liczb na wartoĹci nominalne. PrzykĹadowo chcemy podzieliÄ ankietowanych na grupy staĹźowe: maĹy (do piÄciu lat), Ĺredni (5â15 lat), duĹźy (16 i wiÄcej) staĹź pracy.
WartoĹci liczbowe staĹźu pracy zawiera zmienna staz
. Aby
jÄ
przekodowaÄ naleĹźy uĹźyÄ nastÄpujÄ
cego przeksztaĹcenia:
IF ($source < 5, "M",
IF ($source < 16, "S", "D"))
PoleceĹ IF
musi byÄ o jedno mniej niĹź mamy klas. W
naszym przykĹadzie zatem dwa. JeĹźeli staĹź
jest mniejszy od
5 wstawiony zostanie napis M
, jeĹźeli staĹź
jest
mniejszy od 16 wstawiony zostanie napis S
a w przeciwnym
wypadku zostanie wstawiony napis D
.
Gdyby ktoĹ siÄ niepokoiĹ Ĺźe 3 speĹnia jednoczeĹnie
$source < 5
oraz $source < 16
to dodamy,
Ĺźe pierwszy siÄ liczy. PrzeksztaĹcenie koĹczy dziaĹanie po speĹnieniu
pierwszego warunku i nie wykonuje dalszych porĂłwnaĹ. Dlatego liczba 3
zostanie zamieniona na M
a nie na S
.
Podobnie przekodowujemy zmiennÄ
wiek
.
Przekodowanie to byĹa w zasadzie zamiana sposobu
mierzenia. Wyliczenie to utworzenie nowej zmiennej,
zwykle w oparciu o jakÄ
Ĺ formuĹÄ matematycznÄ
. Na przykĹad odwrĂłcenie
pytanie s1p realizuje s1pr = 6 - s1p
. Satysfakcja to suma
rang z trzech pytaĹ: satysfakcja = s1pr + s2p + s3p
.
W celu wyliczanie nowych zmiennych naleĹźy wybraÄ Dane Oblicz. Pojawia
sie okno zmiennej wyliczonej zatytuĹowane
ZMIENNA WYLICZONA
Pierwszy pasek zawiera nazwÄ zmiennÄ
(domyĹlnie nazwÄ kolumny w
konwencji arkusza kalkulacyjnego, w przykĹadzie jest to litera
H
) W polu definiowania zmiennej naleĹźy wpisaÄ stosownÄ
formuĹÄ matematycznÄ
. W przypadku odwracania pytania s1p
bÄdzie to:
6 - s1p
W przypadku liczenia ĹÄ
cznej satysfakcji (przy zaĹoĹźeniu, Ĺźe
wczeĹniej utworzyliĹmy zmiennÄ
s1pr
):
SUM(s1pr, s2p, s3p)
JeĹźeli nie chcemy sumy ale np. ĹredniÄ powinniĹmy uĹźyÄ
MEAN(s1pr, s2p, s3p)
Inne funkcje matematyczne sÄ dostÄpne po kliniÄciu w pole wyboru znajdujÄ ce siÄ po lewej stronie pola definiowania zmiennej.
PowiedzieliĹmy Ĺźe miarÄ
wiedzy nt. palenia bÄdzy suma punktĂłw
uzyskanych za odpowiedzi prawidĹowe minus suma punktĂłw uzyskanych za
odpowiedzi nieprawidĹowe. Odpowiedzi prawidĹowe to w1p
,
w2p
, w3p
, w6
oraz
w7
. Odpowiedzi bĹÄdne to w4p
,
w5p
, w8p
. Zatem w polu definiowania zmiennej
wpisujemy:
SUM(w1p, w2p, w3p, w6, w7) - SUM(w4p, w5p, w8p)
Wybieramy
Analizy
âEksploracja
âStatystyki opisowe
.
W wyĹwietlonym oknie po lewej deklarujemy co ma byÄ liczone. Wynik pojawi siÄ po prawej (por rysunek)
Ustawiamy kursor na zmiennej ktĂłra nas interesuje i klikamy w
strzaĹkÄ gĂłrnÄ
. JeĹźeli chcemy podzieliÄ wartoĹci zmiennej na grupy
wedĹug jakiejĹ zmiennej nominalnej, to ustawiamy kursor na tej zmiennej
nominalnej (na przykĹad plec
) i klikamy strzaĹkÄ dolnÄ
.
MoĹźna analizowaÄ wiele zmiennych na raz. Wystarczy w tym celu ustawiÄ kursor na zmiennej i kliknÄ Ä w odpowiedniÄ strzaĹkÄ. ZawartoĹÄ okna wynikowego zostanie automagicznie uaktualniona.
PoniĹźej okien wyboru
zmiennych sÄ
zakĹadki okreĹlajÄ
ce precyzyjnie co ma byÄ obliczone oraz
jakie wykresy majÄ
zostaÄ wyrysowane. PrzykĹadowo domyĹlny wydruk nie
zawiera rozstÄpu kwartylowego. Ĺťeby go dodaÄ do wyniku naleĹźy w zakĹadce
Statystyki
zaznaczyÄ przycisk IQR
.
Wybieramy
Analizy
âCzÄstoĹci
âPrĂłby niezaleĹźne
.
Podobnie jak w przypadku analizy struktury jest wyĹwietlana lista
zmiennych oraz okna i strzaĹki pozwalajÄ
ce wygodnie wybraÄ to co ma byÄ
analizowane. Jest to tak proste Ĺźe wystarczy przyjrzeÄ siÄ przykĹadowemu
rysunkowi Ĺźeby wiedzieÄ jak postÄpowaÄ. PrzykĹadowÄ
analizÄ zaleĹźnoĹci
pomiÄdzy zmiennymi nominalnymi zamiarOklasa
oraz
staz.klasa
przedstawia rysunek.
Wybieramy
Analizy
âTesty t
âTest t dla prĂłb niezaleĹźnych
i/lub
Analizy
âANOVA
âJednoczynnikowa ANOVA
.
Zostanie wyĹwietlony znajomy interfejs. Wybieramy co trzeba. Wynik automagicznie pojawia siÄ w lewym oknie.
Wybieramy
Analizy
âRegresja
âRegresja liniowa
Interfejs podobny do poprzednio opisywanych. Wybieramy zmiennÄ zaleĹźnÄ (musi oczywiĹcie byÄ liczbowa) klikajÄ c w gĂłrnÄ strzĹkÄ. Zmienne niezaleĹźne mierzone w skali liczbowej klikajÄ c w ĹrodkowÄ strzaĹkÄ. Zmienne niezaleĹźne mierzone w skali nominalnej klikajÄ c w dolnÄ strzaĹkÄ. Wynik automagicznie pojawia siÄ w lewym oknie.
Wybieramy
Analizy
âRegresja
âRegresja logistyczna
âDwie wartoĹci
Interfejs podobny do analizy regresji. Wybieramy zmiennÄ zaleĹźnÄ klikajÄ c w gĂłrnÄ strzĹkÄ. Zmienna ta musi byÄ zmiennÄ dwuwartoĹciowÄ .
Zmienne niezaleĹźne mierzone w skali liczbowej wybieramy klikajÄ c w ĹrodkowÄ strzaĹkÄ a zmienne niezaleĹźne mierzone w skali nominalnej klikajÄ c w dolnÄ strzaĹkÄ.