6  เมนู Frequencies

ผู้อ่านสามารถโหลดข้อมูลได้ google drive นี้

เมนู Frequencies

เมนู Frequencies

6.1 One Sample Propotion Tests

One Sample Proportion Test เป็นวิธีการทางสถิติที่ใช้ในการทดสอบว่าสัดส่วนของความสำเร็จในการเกิดขึ้นของเหตุการณ์หนึ่ง ๆ ในกลุ่มหนึ่งมีค่าเท่ากับค่าที่กำหนดหรือไม่ ในทางปฏิบัติแล้ว มักจะใช้ในการทดสอบสัดส่วนของการเป็นโรค หรือการเป็นสิ่งที่ต้องการในกลุ่มของประชากรหนึ่ง ๆ

วิธีการนี้ใช้การทดสอบสมมติฐานว่าสัดส่วนของสิ่งที่สนใจในกลุ่มนั้นมีค่าเท่ากับค่าที่ระบุ (ซึ่งเรียกว่าค่าสัดส่วนที่กำหนด) หรือไม่ โดยใช้ข้อมูลจากกลุ่มที่สนใจและสร้างสมมติฐานเกี่ยวกับค่าพารามิเตอร์ของประชากร และทดสอบสมมติฐานนั้นด้วยการใช้สถิติทดสอบที่เหมาะสม เช่น Z-test หรือ t-test ตามกรณีการทดสอบ

วิธีการนี้มักจะใช้ในการตรวจสอบว่าสัดส่วนของกลุ่มหนึ่งมีค่าเท่ากับค่าที่คาดหวังหรือไม่ เช่น การทดสอบว่าสัดส่วนของผู้ป่วยที่หายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 80% หรือไม่ หรือการทดสอบว่าสัดส่วนของผู้บริโภคที่มีความพึงพอใจในผลิตภัณฑ์หนึ่ง ๆ มีค่าเท่ากับ 70% หรือไม่ การทดสอบนี้ช่วยให้เราสามารถทำสรุปเกี่ยวกับสัดส่วนในประชากรรวมได้อย่างมั่นใจได้มากขึ้นโดยใช้ข้อมูลตัวอย่างจำนวนจำกัดที่มีอยู่ในกรณีนั้น ๆ อย่างไรก็ตาม เราต้องระมัดระวังในการใช้และการทำอ้างอิงตามผลการทดสอบนี้เนื่องจากมีข้อจำกัดและเงื่อนไขในการใช้งานที่ต้องคำนึงถึงด้วย

6.1.1 2 Outcomes: Binomial test

นั่นมาแสดงตัวอย่างการใช้ One Sample Proportion Test ในการทดสอบสมมติฐานว่าสัดส่วนของการเป็นโรคซึ่งมีการรักษาแล้วหายมีค่าเท่ากับ 0.8 ในประชากรทั่วไปหรือไม่ โดยมีข้อมูลตัวอย่างจากการสำรวจผู้ป่วย 200 คนที่ได้รับการรักษาและหายจากโรค 150 คน และต้องการทดสอบสมมติฐานด้วยระดับนัยสำคัญ α=0.05

  1. กำหนดสมมติฐาน:
    • H0 (สมมติฐานปลอม): สัดส่วนของการหายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 0.8
    • H1 (สมมติฐานที่จะทดสอบ): สัดส่วนของการหายจากโรคหลังได้รับการรักษาไม่ได้มีค่าเท่ากับ 0.8
  2. คำนวณสถิติทดสอบ:
    • สูตรสำหรับคำนวณสถิติทดสอบคือ:Z=(pp0)p0(1p0)n
    • ที่ p คือ สัดส่วนของการหายจากโรคในตัวอย่าง, p0 คือ สัดส่วนที่กำหนดในสมมติฐานปลอม, และ n คือ ขนาดของตัวอย่าง
    • จากข้อมูลที่กำหนดไว้: p=150200=0.75, p0=0.8, n=200
    • นำข้อมูลนี้มาคำนวณจะได้ Z
  3. ตัดสินใจ:
    • ใช้ค่า Z ที่คำนวณได้ มาเปรียบเทียบกับค่าคริทิคอลที่มีความสำคัญทางสถิติ Z_α/2 ที่มีค่า สำหรับ α=0.05 จะได้ประมาณ 1.96
    • ถ้า Z ที่คำนวณได้มากกว่า 1.96 หรือน้อยกว่า -1.96 จะปฏิเสธสมมติฐานปลอม H0, มีข้อความว่า สัดส่วนของการหายจากโรคหลังได้รับการรักษาไม่ได้มีค่าเท่ากับ 0.8
    • ถ้า Z ที่คำนวณได้ไม่เกิน 1.96 และไม่น้อยกว่า -1.96 จะไม่ปฏิเสธสมมติฐานปลอม H0, มีข้อความว่า สัดส่วนของการหายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 0.8

ลองมาคำนวณสถิติทดสอบ $ Z $:

Z=(0.750.8)0.8(10.8)2001.768

จะเห็นได้ว่าค่า Z ที่คำนวณได้ (-1.768) ไม่มากกว่า 1.96 และไม่น้อยกว่า -1.96 ดังนั้น เราจะไม่ปฏิเสธสมมติฐานปลอม H0 นั่นคือ สัดส่วนของการหายจากโรคหลังได้รับการรักษามีค่าเท่ากับ 0.8 ที่ระดับนัยสำคัญ 0.05 และสรุปได้ว่าไม่มีข้อมูลเพียงพอที่จะสนับสนุนการปฏิเสธสมมติฐานปลอมดังกล่าว.

sample_data
   fail success 
     50     150 

ขั้นที่ 1 นำข้อมูล one_sample_prop_test.xlsx เข้าสู่โปรแกรม Jamovi และกำหนดค่าดังนี้

จัดลำดับข้อมูล

จัดลำดับข้อมูล

ขั้นที่2 เลือกเมนู Analyses Frequencies 2 Outcomes Binomial test และกำหนด

ค่าตามภาพ จะได้ผลลัพธ์ดังนี้

ทางซ้าย: การกำหนดค่า ทางขวา: ผลลัพธ์

ทางซ้าย: การกำหนดค่า ทางขวา: ผลลัพธ์

6.1.2 N outcomes: χ2 goodness of fit

Goodness of Fit Test (การทดสอบความเหมาะสมของข้อมูล) เป็นวิธีการทางสถิติที่ใช้ในการตรวจสอบว่าข้อมูลที่มีอยู่สอดคล้องกับการกระจายที่กำหนดหรือไม่ โดยส่วนใหญ่จะใช้กับข้อมูลที่แบ่งออกเป็นกลุ่มหรือคลาสต่าง ๆ เพื่อดูว่าความถี่ของข้อมูลในแต่ละกลุ่มมีความสอดคล้องกับการคาดการณ์หรือไม่

การทดสอบความเหมาะสมด้วย Goodness of Fit Test มักใช้ทำนายหรือตรวจสอบว่าค่าที่เรามีอยู่มาจากการกระจายที่รู้จักหรือไม่ ตัวอย่างเช่น การทดสอบว่าความถี่ของการโหวตในการเลือกตั้งสามารถเป็นไปตามการกระจายของคาดการณ์หรือไม่ หรือการทดสอบว่าส่วนแบ่งของผู้ติดเชื้อโรคในประชากรมีความเหมาะสมกับอัตราส่วนที่คาดหวังหรือไม่

วิธีการทดสอบสมมติฐานในการทดสอบความเหมาะสมนี้ มักจะใช้ Chi-Square Test (ทดสอบความสัมพันธ์ของตารางความถี่) โดยทดสอบว่าความถี่ที่ม observed มีความแตกต่างกับความถี่ที่คาดหวังหรือไม่ การทดสอบนี้ใช้วิธีการเปรียบเทียบค่าที่มาจากการสร้างตารางความถี่จริง ๆ กับค่าที่คาดหวัง โดยใช้สถิติจากการกระจายของที่เฉพาะจำนวนระดับความอิสระที่มีในตารางนั้น ๆ การทดสอบนี้มักใช้ในการทดสอบความเหมาะสมของการเข้ากันได้กับการกระจายที่คาดหวังในการสำรวจปรากฎการณ์ในข้อมูล ถ้าค่าสถิติที่คำนวณได้มากกว่าค่าวิกฤติที่กำหนดล่วงหน้า ซึ่งมักเป็นค่าที่มีการจำกัดในการอนุมานที่ระดับนัยสำคัญที่ 5% จะทำให้ปฏิเสธสมมติฐานว่าข้อมูลไม่เหมาะสมกับการกระจายที่คาดหวัง

สมมติว่าเรามีข้อมูลตัวอย่างเกี่ยวกับการโหวตในการเลือกตั้ง โดยมีคาดการณ์ว่าสัดส่วนของการโหวตสำหรับพรรค A, B, และ C คือ 0.4, 0.3, และ 0.3 ตามลำดับ และเราได้รับข้อมูลตัวอย่างจากผู้โหวต 300 คน และพบว่าจำนวนผู้โหวตสำหรับแต่ละพรรคเป็นดังนี้:

  • พรรค A: 100 คน
  • พรรค B: 120 คน
  • พรรค C: 80 คน

เราจะทดสอบว่าการโหวตมีความเหมาะสมกับคาดการณ์หรือไม่

  1. คำนวณคาดการณ์สัดส่วนของการโหวตสำหรับแต่ละพรรค:

Expected counts=สัดส่วนที่คาดหวัง×จำนวนตัวอย่างทั้งหมด

Expected count for A=0.4×300=120

Expected count for B=0.3×300=90

Expected count for C=0.3×300=90

  1. ทำการคำนวณค่าสถิติทดสอบ Chi-Square:

χ2=(OiEi)2Ei

โดยที่ $ O_i $ คือจำนวนที่สังเกตเจอจริง, $ E_i $ คือจำนวนที่คาดหวัง

χ2=(100120)2120+(12090)290+(8090)290

χ214.444

  1. คำนวณดีกรีเสรีของ Chi-Square Test:

df=(จำนวนกลุ่ม1)=(31)=2

  1. ดัดแปลงค่า p-value:

จากการคำนวณได้ χ214.444 ที่ดีกรีเสรี df=2 ดังนั้น ค่า p-value จะได้จากการค้นหาค่าที่มากกว่า 14.444 ในการทดสอบ Chi-Square Distribution ที่มีดีกรีเสรี 2

  1. สรุปผล:

ถ้าค่า p-value มีค่าน้อยกว่าระดับนัยสำคัญที่กำหนด (เช่น 0.05) เราจะปฏิเสธสมมติฐานว่าข้อมูลไม่เหมาะสมกับคาดการณ์ที่กำหนดไว้ ในที่นี้เราควรจะปฏิเสธสมมติฐานว่าการโหวตไม่เหมาะสมกับคาดการณ์ที่กำหนดไว้

การคำนนวณด้วย Jamovi

ขั้นที่ 1 นำเข้าไฟล์ chi2_test.xlsx เข้าสู่ Jamovi

เนื่องจากข้อมูลเรียงลำดับตามตัวอักษร A B C จึงไม่ต้องเปลี่ยนแปลงข้อมูล

เนื่องจากข้อมูลเรียงลำดับตามตัวอักษร A B C จึงไม่ต้องเปลี่ยนแปลงข้อมูล

ขั้นที่ 2 ขั้นที่2 เลือกเมนู Analyses Frequencies N Outcomes χ2 test และกำหนดค่าตามภาพ จะได้ผลลัพธ์ดังนี้

ทางซ้าย: การกำหนดค่าเพื่อทดสอบ ทางขวา: ผลการทดสอบ

ทางซ้าย: การกำหนดค่าเพื่อทดสอบ ทางขวา: ผลการทดสอบ

6.1.3 Independent Samples Chi-Square Test of Association

เป็นการทดสอบความสัมพันธ์ระหว่างตัวแปรสองตัวที่เป็นแบบจำนวนนับ (categorical variables) โดยมีการจัดกลุ่มข้อมูลเป็นตารางความถี่ (contingency table) ซึ่งใช้วิธีการทดสอบความสัมพันธ์โดยใช้ค่าสถิติที่เรียกว่า Chi-Square (χ²)

โดยทั่วไปแล้ว Independent Samples Chi-Square Test of Association ใช้สำหรับทดสอบว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เป็นแบบจำนวนนับหรือไม่ ซึ่งตัวแปรสองตัวนี้สามารถแบ่งออกเป็นกลุ่มหรือชนิดต่าง ๆ ได้ เช่น การทดสอบความสัมพันธ์ระหว่าง:

  • การสูบบุหรี่ (สูบ/ไม่สูบ) และโรคมะเร็งปอด (มี/ไม่มี)
  • การลงคะแนนเพศและความคิดเห็นเกี่ยวกับประเภทของหนังสือ
  • การชนิดของยา (A, B, C) และการหายขาดของโรค

การทดสอบด้วย Chi-Square Test of Association จะทำการสร้างตารางความถี่ (contingency table) ขึ้นมาจากข้อมูลตัวอย่าง แล้วทำการเปรียบเทียบความแตกต่างระหว่างค่าที่สังเกตเจอจริง ๆ กับค่าที่คาดหวัง หากมีความแตกต่างมากนัก จะสรุปได้ว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เราสนใจ

ค่าสถิติที่ได้จาก Chi-Square Test จะใช้ในการคำนวณหาค่า p-value เพื่อทำการตัดสินใจว่าจะปฏิเสธหรือยอมรับสมมติฐานที่ตั้งไว้ว่าไม่มีความสัมพันธ์ โดยระดับนัยสำคัญที่มักใช้คือ 0.05 ซึ่งหาก p-value น้อยกว่าระดับนัยสำคัญจะสรุปได้ว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวที่เราสนใจ ในทางกลับกัน หาก p-value มากกว่าระดับนัยสำคัญจะไม่มีหรือมีความสัมพันธ์น้อยมาก หรือไม่สามารถปฏิเสธสมมติฐานนั้นได้

เราจะคำนวณค่าสถิติทดสอบ Chi-Square และค่า p-value ได้ดังนี้

  1. กำหนดตารางความถี่ (contingency table) จากข้อมูลที่ให้มา:
       cancer
smoking Yes No
    Yes   3  2
    No    1  4
  1. คำนวณค่าคาดหวัง (expected frequencies) สำหรับแต่ละเซลล์ในตารางความถี่:

Expected frequency=row total×column totalgrand total

สำหรับตารางความถี่ข้างต้น:

  • สำหรับเซลล์ (Yes, Yes):

    • คาดหวัง = (3+2)×(3+1)(3+2+1+4)=5×410=2
  • สำหรับเซลล์ (Yes, No):

    • คาดหวัง = (3+2)×(2+4)(3+2+1+4)=5×610=3
  • สำหรับเซลล์ (No, Yes):

    • คาดหวัง = (1+4)×(3+1)(3+2+1+4)=5×610=2
  • สำหรับเซลล์ (No, No):

    • คาดหวัง = (1+4)×(2+4)(3+2+1+4)=5×810=4
  1. คำนวณค่าสถิติทดสอบ Chi-Square:

χ2=(OiEi)2Ei

โดยที่ Oi คือจำนวนที่สังเกตเจอจริง, Ei คือจำนวนที่คาดหวัง

สำหรับตารางความถี่ข้างต้น:

  • สำหรับเซลล์ (Yes, Yes):

    • χ2=(32)22=12=0.5
  • สำหรับเซลล์ (Yes, No):

    • χ2=(23)23=13=0.3333
  • สำหรับเซลล์ (No, Yes):

    • χ2=(12)22=12=0.5
  • สำหรับเซลล์ (No, No):

    • χ2=(43)23=13=0.333

ดังนั้นค่าสถิติทดสอบ Chi-Square คือ:

χ2=0.5+0.333+0.5+0.333=1.667

  1. คำนวณดีกรีเสรี (degrees of freedom):

df=(r1)(c1)

โดยที่ r คือจำนวนแถวและ c คือจำนวนคอลัมน์ในตารางความถี่ สำหรับตารางความถี่ข้างต้น:

  • r=2 (มีแถว 2 แถว)

  • c=2 (มีคอลัมน์ 2 คอลัมน์)

ดังนั้น df=(21)(21)=1

  1. หาค่า p-value:

p-value=0.197

ค่า p-value มากกว่าระดับนัยสำคัญที่ 0.05 ดังนั้นเราไม่สามารถปฏิเสธสมมติฐานได้ แสดงว่าไม่มีความสัมพันธ์ทางสถิติระหว่างการสูบบุหรี่และการเกิดโรคมะเร็งปอดที่ระดับนัยสำคัญ 0.05

การคำนวณด้วย Jamovi

ขั้นที่ 1 นำข้อมูล asso_test.xlsx เข้า Jamovi และเรียงลำดับตัวแปรทั้งสองดังนี้

ขั้นที่ 2 กำหนดการคำนวณที่ต้องการ

ทางซ้าย: กำหนดค่าที่ต้องการ ทางขวา: ผลการทดสอบ

ทางซ้าย: กำหนดค่าที่ต้องการ ทางขวา: ผลการทดสอบ

6.1.4 Paired Samples McNemar Test

McNemar Test เป็นการทดสอบสมมติฐานว่ามีความแตกต่างในการจำแนกกลุ่มของตัวแปรตามคู่ในการทดสอบสมมติฐานของเปอร์ซอน McNemar ซึ่งมักใช้กับข้อมูลที่เป็นตัวอย่างที่จับคู่กัน เช่น การวัดผลการรักษาของโรคก่อนและหลังการให้ยาเดียวกัน หรือการวัดผลของการทดสอบที่ทำซ้ำซ้อนกัน

ขั้นตอนการดำเนิน McNemar Test มีดังนี้: 1. สร้างตารางความถี่ 2x2 ที่แสดงความสัมพันธ์ระหว่างตัวแปรตามคู่ที่จับคู่กัน โดยมีรายละเอียดดังนี้:

ไม่พบอาการ พบอาการ
ไม่ใช่ก่อนการรักษา a b
ใช่ก่อนการรักษา c d
  1. คำนวณค่า McNemar Test statistic โดยใช้สมการ:

χMcNemar2=(bc)2b+c

  1. คำนวณหา p-value จากการประมาณค่าของค่าที่ได้จากการทดสอบสมมติฐานแบบทีมีการแจกแจงปกติ (normal distribution) หรือจากการใช้การจำลองบวกเบี่ยง (simulation).

  2. สรุปผลการทดสอบโดยพิจารณาค่า p-value ว่าเป็นค่าน้อยกว่าระดับนัยสำคัญที่กำหนดหรือไม่ (โดยทั่วไปจะใช้ระดับนัยสำคัญ 0.05) เพื่อตัดสินใจว่าจะปฏิเสธหรือยอมรับสมมติฐานว่ามีความแตกต่างในการจำแนกกลุ่มของตัวแปรตามคู่ที่จับคู่กันหรือไม่

McNemar Test มักใช้ในกรณีที่ข้อมูลมีลักษณะที่เป็นตัวอย่างที่จับคู่กัน เช่น การทดสอบการรักษาโรคก่อนและหลังการให้ยาเดียวกัน หรือการทดสอบที่มีการทำซ้ำซ้อนกัน เพื่อทดสอบว่ามีการเปลี่ยนแปลงหรือไม่ในตัวแปรที่สนใจหลังจากการกระทำใด

ตัวอย่างข้อมูลและการทำ McNemar Test

สมมติว่าเรามีข้อมูลตัวอย่างเกี่ยวกับผลการทดสอบโรคในกลุ่มของผู้ป่วย ก่อนและหลังการให้ยาเดียวกัน และต้องการทดสอบว่ามีความแตกต่างในผลการทดสอบระหว่างก่อนและหลังการให้ยาหรือไม่ ข้อมูลสามารถแสดงได้ดังนี้:

        test
drug     Positive Negative
  before       10        5
  after         7        8

ขั้นที่ 1 นำไฟล์ mcnemar.xlsx เข้าสู่ ๋Jamovi จัดการข้อมูลตามภาพ

ขั้นที่ 2 เลือกเมนู Paired Sample Mcnemar test