sample_data
fail success
50 150
6 เมนู Frequencies
ผู้อ่านสามารถโหลดข้อมูลได้ google drive นี้
6.1 One Sample Propotion Tests
One Sample Proportion Test เป็นวิธีการทางสถิติที่ใช้ในการทดสอบว่าสัดส่วนของความสำเร็จในการเกิดขึ้นของเหตุการณ์หนึ่ง ๆ ในกลุ่มหนึ่งมีค่าเท่ากับค่าที่กำหนดหรือไม่ ในทางปฏิบัติแล้ว มักจะใช้ในการทดสอบสัดส่วนของการเป็นโรค หรือการเป็นสิ่งที่ต้องการในกลุ่มของประชากรหนึ่ง ๆ
วิธีการนี้ใช้การทดสอบสมมติฐานว่าสัดส่วนของสิ่งที่สนใจในกลุ่มนั้นมีค่าเท่ากับค่าที่ระบุ (ซึ่งเรียกว่าค่าสัดส่วนที่กำหนด) หรือไม่ โดยใช้ข้อมูลจากกลุ่มที่สนใจและสร้างสมมติฐานเกี่ยวกับค่าพารามิเตอร์ของประชากร และทดสอบสมมติฐานนั้นด้วยการใช้สถิติทดสอบที่เหมาะสม เช่น Z-test หรือ t-test ตามกรณีการทดสอบ
วิธีการนี้มักจะใช้ในการตรวจสอบว่าสัดส่วนของกลุ่มหนึ่งมีค่าเท่ากับค่าที่คาดหวังหรือไม่ เช่น การทดสอบว่าสัดส่วนของผู้ป่วยที่หายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 80% หรือไม่ หรือการทดสอบว่าสัดส่วนของผู้บริโภคที่มีความพึงพอใจในผลิตภัณฑ์หนึ่ง ๆ มีค่าเท่ากับ 70% หรือไม่ การทดสอบนี้ช่วยให้เราสามารถทำสรุปเกี่ยวกับสัดส่วนในประชากรรวมได้อย่างมั่นใจได้มากขึ้นโดยใช้ข้อมูลตัวอย่างจำนวนจำกัดที่มีอยู่ในกรณีนั้น ๆ อย่างไรก็ตาม เราต้องระมัดระวังในการใช้และการทำอ้างอิงตามผลการทดสอบนี้เนื่องจากมีข้อจำกัดและเงื่อนไขในการใช้งานที่ต้องคำนึงถึงด้วย
6.1.1 2 Outcomes: Binomial test
นั่นมาแสดงตัวอย่างการใช้ One Sample Proportion Test ในการทดสอบสมมติฐานว่าสัดส่วนของการเป็นโรคซึ่งมีการรักษาแล้วหายมีค่าเท่ากับ 0.8 ในประชากรทั่วไปหรือไม่ โดยมีข้อมูลตัวอย่างจากการสำรวจผู้ป่วย 200 คนที่ได้รับการรักษาและหายจากโรค 150 คน และต้องการทดสอบสมมติฐานด้วยระดับนัยสำคัญ
- กำหนดสมมติฐาน:
(สมมติฐานปลอม): สัดส่วนของการหายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 0.8 (สมมติฐานที่จะทดสอบ): สัดส่วนของการหายจากโรคหลังได้รับการรักษาไม่ได้มีค่าเท่ากับ 0.8
- คำนวณสถิติทดสอบ:
- สูตรสำหรับคำนวณสถิติทดสอบคือ:
- ที่
คือ สัดส่วนของการหายจากโรคในตัวอย่าง, คือ สัดส่วนที่กำหนดในสมมติฐานปลอม, และ คือ ขนาดของตัวอย่าง - จากข้อมูลที่กำหนดไว้:
, , - นำข้อมูลนี้มาคำนวณจะได้
- สูตรสำหรับคำนวณสถิติทดสอบคือ:
- ตัดสินใจ:
- ใช้ค่า
ที่คำนวณได้ มาเปรียบเทียบกับค่าคริทิคอลที่มีความสำคัญทางสถิติ ที่มีค่า สำหรับ จะได้ประมาณ 1.96 - ถ้า
ที่คำนวณได้มากกว่า 1.96 หรือน้อยกว่า -1.96 จะปฏิเสธสมมติฐานปลอม , มีข้อความว่า สัดส่วนของการหายจากโรคหลังได้รับการรักษาไม่ได้มีค่าเท่ากับ 0.8 - ถ้า
ที่คำนวณได้ไม่เกิน 1.96 และไม่น้อยกว่า -1.96 จะไม่ปฏิเสธสมมติฐานปลอม , มีข้อความว่า สัดส่วนของการหายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 0.8
- ใช้ค่า
ลองมาคำนวณสถิติทดสอบ $ Z $:
จะเห็นได้ว่าค่า
ขั้นที่ 1 นำข้อมูล one_sample_prop_test.xlsx เข้าสู่โปรแกรม Jamovi และกำหนดค่าดังนี้
ขั้นที่2 เลือกเมนู Analyses
ค่าตามภาพ จะได้ผลลัพธ์ดังนี้
6.1.2 N outcomes: goodness of fit
Goodness of Fit Test (การทดสอบความเหมาะสมของข้อมูล) เป็นวิธีการทางสถิติที่ใช้ในการตรวจสอบว่าข้อมูลที่มีอยู่สอดคล้องกับการกระจายที่กำหนดหรือไม่ โดยส่วนใหญ่จะใช้กับข้อมูลที่แบ่งออกเป็นกลุ่มหรือคลาสต่าง ๆ เพื่อดูว่าความถี่ของข้อมูลในแต่ละกลุ่มมีความสอดคล้องกับการคาดการณ์หรือไม่
การทดสอบความเหมาะสมด้วย Goodness of Fit Test มักใช้ทำนายหรือตรวจสอบว่าค่าที่เรามีอยู่มาจากการกระจายที่รู้จักหรือไม่ ตัวอย่างเช่น การทดสอบว่าความถี่ของการโหวตในการเลือกตั้งสามารถเป็นไปตามการกระจายของคาดการณ์หรือไม่ หรือการทดสอบว่าส่วนแบ่งของผู้ติดเชื้อโรคในประชากรมีความเหมาะสมกับอัตราส่วนที่คาดหวังหรือไม่
วิธีการทดสอบสมมติฐานในการทดสอบความเหมาะสมนี้ มักจะใช้ Chi-Square Test (ทดสอบความสัมพันธ์ของตารางความถี่) โดยทดสอบว่าความถี่ที่ม observed มีความแตกต่างกับความถี่ที่คาดหวังหรือไม่ การทดสอบนี้ใช้วิธีการเปรียบเทียบค่าที่มาจากการสร้างตารางความถี่จริง ๆ กับค่าที่คาดหวัง โดยใช้สถิติจากการกระจายของที่เฉพาะจำนวนระดับความอิสระที่มีในตารางนั้น ๆ การทดสอบนี้มักใช้ในการทดสอบความเหมาะสมของการเข้ากันได้กับการกระจายที่คาดหวังในการสำรวจปรากฎการณ์ในข้อมูล ถ้าค่าสถิติที่คำนวณได้มากกว่าค่าวิกฤติที่กำหนดล่วงหน้า ซึ่งมักเป็นค่าที่มีการจำกัดในการอนุมานที่ระดับนัยสำคัญที่ 5% จะทำให้ปฏิเสธสมมติฐานว่าข้อมูลไม่เหมาะสมกับการกระจายที่คาดหวัง
สมมติว่าเรามีข้อมูลตัวอย่างเกี่ยวกับการโหวตในการเลือกตั้ง โดยมีคาดการณ์ว่าสัดส่วนของการโหวตสำหรับพรรค A, B, และ C คือ 0.4, 0.3, และ 0.3 ตามลำดับ และเราได้รับข้อมูลตัวอย่างจากผู้โหวต 300 คน และพบว่าจำนวนผู้โหวตสำหรับแต่ละพรรคเป็นดังนี้:
- พรรค A: 100 คน
- พรรค B: 120 คน
- พรรค C: 80 คน
เราจะทดสอบว่าการโหวตมีความเหมาะสมกับคาดการณ์หรือไม่
- คำนวณคาดการณ์สัดส่วนของการโหวตสำหรับแต่ละพรรค:
- ทำการคำนวณค่าสถิติทดสอบ Chi-Square:
โดยที่ $ O_i $ คือจำนวนที่สังเกตเจอจริง, $ E_i $ คือจำนวนที่คาดหวัง
- คำนวณดีกรีเสรีของ Chi-Square Test:
- ดัดแปลงค่า p-value:
จากการคำนวณได้
- สรุปผล:
ถ้าค่า p-value มีค่าน้อยกว่าระดับนัยสำคัญที่กำหนด (เช่น 0.05) เราจะปฏิเสธสมมติฐานว่าข้อมูลไม่เหมาะสมกับคาดการณ์ที่กำหนดไว้ ในที่นี้เราควรจะปฏิเสธสมมติฐานว่าการโหวตไม่เหมาะสมกับคาดการณ์ที่กำหนดไว้
การคำนนวณด้วย Jamovi
ขั้นที่ 1 นำเข้าไฟล์ chi2_test.xlsx เข้าสู่ Jamovi
ขั้นที่ 2 ขั้นที่2 เลือกเมนู Analyses
6.1.3 Independent Samples Chi-Square Test of Association
เป็นการทดสอบความสัมพันธ์ระหว่างตัวแปรสองตัวที่เป็นแบบจำนวนนับ (categorical variables) โดยมีการจัดกลุ่มข้อมูลเป็นตารางความถี่ (contingency table) ซึ่งใช้วิธีการทดสอบความสัมพันธ์โดยใช้ค่าสถิติที่เรียกว่า Chi-Square (χ²)
โดยทั่วไปแล้ว Independent Samples Chi-Square Test of Association ใช้สำหรับทดสอบว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เป็นแบบจำนวนนับหรือไม่ ซึ่งตัวแปรสองตัวนี้สามารถแบ่งออกเป็นกลุ่มหรือชนิดต่าง ๆ ได้ เช่น การทดสอบความสัมพันธ์ระหว่าง:
- การสูบบุหรี่ (สูบ/ไม่สูบ) และโรคมะเร็งปอด (มี/ไม่มี)
- การลงคะแนนเพศและความคิดเห็นเกี่ยวกับประเภทของหนังสือ
- การชนิดของยา (A, B, C) และการหายขาดของโรค
การทดสอบด้วย Chi-Square Test of Association จะทำการสร้างตารางความถี่ (contingency table) ขึ้นมาจากข้อมูลตัวอย่าง แล้วทำการเปรียบเทียบความแตกต่างระหว่างค่าที่สังเกตเจอจริง ๆ กับค่าที่คาดหวัง หากมีความแตกต่างมากนัก จะสรุปได้ว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เราสนใจ
ค่าสถิติที่ได้จาก Chi-Square Test จะใช้ในการคำนวณหาค่า p-value เพื่อทำการตัดสินใจว่าจะปฏิเสธหรือยอมรับสมมติฐานที่ตั้งไว้ว่าไม่มีความสัมพันธ์ โดยระดับนัยสำคัญที่มักใช้คือ 0.05 ซึ่งหาก p-value น้อยกว่าระดับนัยสำคัญจะสรุปได้ว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เราสนใจ ในทางกลับกัน หาก p-value มากกว่าระดับนัยสำคัญจะไม่มีหรือมีความสัมพันธ์น้อยมาก หรือไม่สามารถปฏิเสธสมมติฐานนั้นได้
เราจะคำนวณค่าสถิติทดสอบ Chi-Square และค่า p-value ได้ดังนี้
- กำหนดตารางความถี่ (contingency table) จากข้อมูลที่ให้มา:
cancer
smoking Yes No
Yes 3 2
No 1 4
- คำนวณค่าคาดหวัง (expected frequencies) สำหรับแต่ละเซลล์ในตารางความถี่:
สำหรับตารางความถี่ข้างต้น:
สำหรับเซลล์ (Yes, Yes):
- คาดหวัง =
- คาดหวัง =
สำหรับเซลล์ (Yes, No):
- คาดหวัง =
- คาดหวัง =
สำหรับเซลล์ (No, Yes):
- คาดหวัง =
- คาดหวัง =
สำหรับเซลล์ (No, No):
- คาดหวัง =
- คาดหวัง =
- คำนวณค่าสถิติทดสอบ Chi-Square:
โดยที่
สำหรับตารางความถี่ข้างต้น:
สำหรับเซลล์ (Yes, Yes):
สำหรับเซลล์ (Yes, No):
สำหรับเซลล์ (No, Yes):
สำหรับเซลล์ (No, No):
ดังนั้นค่าสถิติทดสอบ Chi-Square คือ:
- คำนวณดีกรีเสรี (degrees of freedom):
โดยที่
(มีแถว 2 แถว) (มีคอลัมน์ 2 คอลัมน์)
ดังนั้น
- หาค่า p-value:
ค่า p-value มากกว่าระดับนัยสำคัญที่ 0.05 ดังนั้นเราไม่สามารถปฏิเสธสมมติฐานได้ แสดงว่าไม่มีความสัมพันธ์ทางสถิติระหว่างการสูบบุหรี่และการเกิดโรคมะเร็งปอดที่ระดับนัยสำคัญ 0.05
การคำนวณด้วย Jamovi
ขั้นที่ 1 นำข้อมูล asso_test.xlsx เข้า Jamovi และเรียงลำดับตัวแปรทั้งสองดังนี้
ขั้นที่ 2 กำหนดการคำนวณที่ต้องการ
6.1.4 Paired Samples McNemar Test
McNemar Test เป็นการทดสอบสมมติฐานว่ามีความแตกต่างในการจำแนกกลุ่มของตัวแปรตามคู่ในการทดสอบสมมติฐานของเปอร์ซอน McNemar ซึ่งมักใช้กับข้อมูลที่เป็นตัวอย่างที่จับคู่กัน เช่น การวัดผลการรักษาของโรคก่อนและหลังการให้ยาเดียวกัน หรือการวัดผลของการทดสอบที่ทำซ้ำซ้อนกัน
ขั้นตอนการดำเนิน McNemar Test มีดังนี้: 1. สร้างตารางความถี่ 2x2 ที่แสดงความสัมพันธ์ระหว่างตัวแปรตามคู่ที่จับคู่กัน โดยมีรายละเอียดดังนี้:
ไม่พบอาการ | พบอาการ | |
---|---|---|
ไม่ใช่ก่อนการรักษา | ||
ใช่ก่อนการรักษา |
- คำนวณค่า McNemar Test statistic โดยใช้สมการ:
คำนวณหา p-value จากการประมาณค่าของค่าที่ได้จากการทดสอบสมมติฐานแบบทีมีการแจกแจงปกติ (normal distribution) หรือจากการใช้การจำลองบวกเบี่ยง (simulation).
สรุปผลการทดสอบโดยพิจารณาค่า p-value ว่าเป็นค่าน้อยกว่าระดับนัยสำคัญที่กำหนดหรือไม่ (โดยทั่วไปจะใช้ระดับนัยสำคัญ 0.05) เพื่อตัดสินใจว่าจะปฏิเสธหรือยอมรับสมมติฐานว่ามีความแตกต่างในการจำแนกกลุ่มของตัวแปรตามคู่ที่จับคู่กันหรือไม่
McNemar Test มักใช้ในกรณีที่ข้อมูลมีลักษณะที่เป็นตัวอย่างที่จับคู่กัน เช่น การทดสอบการรักษาโรคก่อนและหลังการให้ยาเดียวกัน หรือการทดสอบที่มีการทำซ้ำซ้อนกัน เพื่อทดสอบว่ามีการเปลี่ยนแปลงหรือไม่ในตัวแปรที่สนใจหลังจากการกระทำใด
ตัวอย่างข้อมูลและการทำ McNemar Test
สมมติว่าเรามีข้อมูลตัวอย่างเกี่ยวกับผลการทดสอบโรคในกลุ่มของผู้ป่วย ก่อนและหลังการให้ยาเดียวกัน และต้องการทดสอบว่ามีความแตกต่างในผลการทดสอบระหว่างก่อนและหลังการให้ยาหรือไม่ ข้อมูลสามารถแสดงได้ดังนี้:
test
drug Positive Negative
before 10 5
after 7 8
ขั้นที่ 1 นำไฟล์ mcnemar.xlsx เข้าสู่ ๋Jamovi จัดการข้อมูลตามภาพ
ขั้นที่ 2 เลือกเมนู Paired Sample Mcnemar test