Bab 8 Pengujian Hipotesis

Statistika inferensial adalah cabang statistik yang menganalisis data sampel untuk membuat kesimpulan tentang populasi, meliputi estimasi parameter dan pengujian hipotesis. Pengujian hipotesis dimulai dengan merumuskan hipotesis nol (H0) sebagai klaim awal dan hipotesis alternatif (Ha) sebagai tandingan, diikuti oleh penentuan tingkat signifikansi α, perhitungan statistik uji, dan nilai-p (p-value). Jika nilai-p lebih kecil dari α, H0 ditolak, menunjukkan bukti signifikan mendukung Ha. Metode ini sering digunakan untuk menguji rata-rata, proporsi, atau hubungan antar variabel, dengan aplikasi dalam berbagai bidang seperti riset pemasaran, pengendalian mutu, dan pengambilan keputusan berbasis data.

8.1 Hipotesis Nol dan Alternatif

H0 adalah pernyataan awal yang menyatakan tidak ada efek, perbedaan, atau hubungan antara variabel yang diuji. Biasanya, H0 dirumuskan untuk mempertahankan asumsi awal, misalnya: “Rata-rata penghasilan karyawan =Rp5 juta”. Sebaliknya, Ha adalah pernyataan tandingan yang menyatakan adanya efek, perbedaan, atau hubungan, misalnya: “Rata-rata penghasilan karyawan Rp5 juta”. Dalam pengujian hipotesis, fokus utama adalah menilai apakah data cukup kuat untuk menolak H0 dan mendukung Ha. Pengujian ini dilakukan dengan menggunakan statistik uji dan membandingkan nilai probabilitas (p-value) terhadap tingkat signifikansi (α).

8.2 Kesalahan Tipe I dan Tipe II

Dalam pengujian hipotesis, terdapat dua jenis kesalahan yang dapat terjadi:

  1. Kesalahan Tipe I (α):
    Terjadi ketika hipotesis nol (H0) ditolak padahal sebenarnya H0 benar. Kesalahan ini sering disebut false positive dan tingkat kejadiannya diwakili oleh tingkat signifikansi (α), misalnya 0,05 (5%).

  2. Kesalahan Tipe II (β):
    Terjadi ketika hipotesis nol (H0) tidak ditolak padahal sebenarnya hipotesis alternatif (Ha) benar. Kesalahan ini dikenal sebagai false negative, dan probabilitas untuk tidak melakukan kesalahan tipe II disebut kekuatan uji atau power of the test (1β).

Keputusan H0 Benar Ha Benar
Terima H0 Benar (tidak ada kesalahan) Kesalahan Tipe II (β)
Tolak H0 Kesalahan Tipe I (α) Benar (keputusan tepat)

Kesalahan ini dapat dikontrol dengan pemilihan tingkat signifikansi (α) yang sesuai dan memastikan ukuran sampel memadai untuk meningkatkan kekuatan uji (1β).

8.3 Nilai p dan Tingkat Signifikansi

Nilai-p adalah probabilitas yang menunjukkan seberapa konsisten data sampel dengan H0. Nilai ini menggambarkan kemungkinan mendapatkan hasil sampel yang ekstrem atau lebih ekstrem dari hasil yang diamati, dengan asumsi bahwa H0 benar. Semakin kecil nilai-p, semakin kuat bukti untuk menolak H0.

Tingkat Signifikansi α adalah batas probabilitas yang telah ditentukan sebelumnya untuk memutuskan apakah H0 dapat ditolak. Umumnya, α=0.05 (5%) digunakan, tetapi dalam beberapa kasus tertentu dapat menggunakan α=0.01 (1%) atau α=0.10 (10%).

Aturan Keputusan:

  • Jika pα: Tolak H0 (data memberikan bukti signifikan mendukung Ha).
  • Jika p>α: Gagal menolak H0 (data tidak cukup untuk mendukung Ha).

8.4 Uji Z

Uji Z adalah uji statistik yang digunakan untuk membandingkan nilai rata-rata sampel dengan nilai rata-rata populasi ketika varians populasi diketahui atau ukuran sampel cukup besar. Uji ini umumnya digunakan dalam analisis dua sisi, di mana tujuan utamanya adalah untuk menguji apakah suatu sampel berasal dari populasi dengan rata-rata tertentu.

8.4.1 Ketentuan Uji Z

  • Sampel memiliki distribusi normal atau ukuran sampel besar (biasanya n>30).
  • Varians atau deviasi standar populasi diketahui atau diperkirakan dengan baik.

8.4.2 Formula Uji Z

Z=ˉXμ0σn

Keterangan:

  • ˉX = Rata-rata sampel
  • μ0 = Rata-rata populasi yang diuji
  • σ = Deviasi standar populasi
  • n = Ukuran sampel

8.4.3 Langkah-langkah Uji Z

Misalkan kita ingin menguji apakah rata-rata penghasilan karyawan berbeda dari Rp5 juta, dengan ukuran sampel n=100, deviasi standar populasi σ=1 juta, dan rata-rata sampel ˉX=4.9 juta. Interpretasi Uji Z dengan contoh Data, sebagai berikut:

  1. Hipotesis:

    • H0: Rata-rata penghasilan karyawan adalah Rp5 juta μ=5.
    • Ha: Rata-rata penghasilan karyawan berbeda dari Rp5 juta μ5.
  2. Data dan Parameter:

    • Ukuran sampel (n): 100
    • Rata-rata sampel (ˉX): Rp4.9 juta
    • Rata-rata populasi (μ): Rp5 juta
    • Deviasi standar populasi (σ): Rp1 juta
  3. Statistik Uji Z: Rumus: Z=ˉXμσ/n Substitusi nilai: Z=4.951/100=0.10.1=1

  4. Tingkat Signifikansi (α):

    • Diasumsikan α=0.05 (tingkat signifikansi 5%).
  5. Nilai Kritikal: Untuk uji dua sisi, nilai kritikal Z-kritis pada α=0.05 adalah: Zkritis=±1.96

  6. Keputusan Uji:

    • Karena nilai Z=1 berada di dalam rentang 1.96 hingga 1.96, maka kita tidak dapat menolak H0.
    • Dengan kata lain, tidak terdapat bukti signifikan bahwa rata-rata penghasilan karyawan berbeda dari Rp5 juta.
  7. Nilai-p: Nilai-p dihitung berdasarkan area di bawah kurva distribusi normal standar untuk |Z|=1: p=2×P(Z>1)2×0.1587=0.3174 Karena p>α, hasilnya konsisten dengan keputusan di atas H0 tidak ditolak).

Kesimpulan:

  • Berdasarkan data sampel, tidak terdapat cukup bukti untuk menyatakan bahwa rata-rata penghasilan karyawan berbeda secara signifikan dari Rp5 juta pada tingkat signifikansi 5%.
  • Keputusan: H0 diterima.

Berikut adalah kode R untuk membuat visualisasi interaktif menggunakan Plotly. Distribusi normal ini akan menampilkan area p-value berdasarkan nilai statistik Z.

library(plotly)
## Loading required package: ggplot2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
# Parameter uji Z
z_stat <- 2.15                  # Contoh nilai Z-statistik
p_value <- 2 * (1 - pnorm(abs(z_stat))) # Nilai p untuk uji dua sisi
alpha <- 0.05                   # Tingkat signifikansi

# Distribusi normal standar
x <- seq(-4, 4, length = 500)
z_dist <- dnorm(x)

# Filter data untuk area p-value
x_p <- c(x[x <= -abs(z_stat)], x[x >= abs(z_stat)])
y_p <- c(dnorm(x[x <= -abs(z_stat)]), dnorm(x[x >= abs(z_stat)]))

# Batas kritis Z
critical_z <- qnorm(1 - alpha / 2)

# Keputusan uji hipotesis
keputusan <- ifelse(p_value < alpha, "H0 ditolak", "H0 diterima")

# Plot distribusi normal
fig <- plot_ly(x = x, y = z_dist, type = 'scatter', mode = 'lines', name = "Distribusi Z") %>%
  # Area untuk Nilai-p
  add_trace(x = c(x_p, rev(x_p)), 
            y = c(y_p, rep(0, length(y_p))), 
            fill = 'toself',
            name = "Nilai-p",
            fillcolor = 'rgba(255, 165, 0, 0.3)', 
            line = list(color = "orange")) %>%
  # Garis untuk Z-statistik
  add_segments(x = z_stat, xend = z_stat, y = 0, yend = dnorm(z_stat), 
               line = list(color = "green"), name = "Z-statistik") %>%
  add_segments(x = -z_stat, xend = -z_stat, y = 0, yend = dnorm(-z_stat), 
               line = list(color = "green"), showlegend = FALSE) %>%
  # Garis kritis
  add_segments(x = critical_z, xend = critical_z, y = 0, yend = dnorm(critical_z),
               line = list(dash = "dash", color = "red"), name = "Z-kritis") %>%
  add_segments(x = -critical_z, xend = -critical_z, y = 0, yend = dnorm(-critical_z),
               line = list(dash = "dash", color = "red"), showlegend = FALSE) %>%
  # Tambahkan anotasi untuk keputusan
  add_annotations(
    x = 0, y = max(z_dist) * 0.9,
    text = paste("Keputusan:", keputusan),
    showarrow = FALSE,
    font = list(size = 16, color = "black")
  ) %>%
  layout(
    title = "Visualisasi Uji Z dengan Nilai-p dan Keputusan",
    xaxis = list(title = "Z"),
    yaxis = list(title = "Densitas"),
    showlegend = TRUE
  )

fig
−4−202400.050.10.150.20.250.30.350.4
Distribusi ZNilai-pZ-statistikZ-kritisVisualisasi Uji Z dengan Nilai-p dan KeputusanZDensitasKeputusan: H0 ditolakKeputusan: H0 ditolak

8.5 Uji T (t-test)

Uji t adalah uji statistik yang digunakan untuk menguji perbedaan rata-rata antara dua grup atau membandingkan rata-rata sampel dengan suatu nilai tertentu ketika varians populasi tidak diketahui atau ukuran sampel kecil (biasanya n<30.

Uji t menggunakan distribusi t-student dan biasanya digunakan untuk situasi berikut:

  1. Menguji apakah rata-rata satu sampel berbeda dengan suatu nilai (sampel tunggal).
  2. Menguji apakah dua sampel independen memiliki rata-rata yang berbeda.
  3. Menguji apakah dua sampel yang berhubungan memiliki perbedaan rata-rata.

8.5.1 Jenis-jenis Uji T

  1. Uji t Satu Sampel (One-sample t-test): Menguji apakah rata-rata suatu sampel berbeda dari nilai yang diketahui (misalnya rata-rata populasi).

    t=ˉXμsn

    Keterangan:

    • ˉX: Rata-rata sampel
    • μ: Nilai rata-rata yang diuji (biasanya rata-rata populasi)
    • s: Deviasi standar sampel
    • n: Ukuran sampel
  2. Uji t Dua Sampel Independen (Two-sample t-test):

    Menguji apakah dua grup sampel independen memiliki rata-rata yang berbeda. t=¯X1¯X2s21n1+s22n2
    Keterangan:

    • ¯X1 dan ¯X2: Rata-rata sampel grup 1 dan 2
    • s21 dan s22: Varians sampel grup 1 dan 2
    • n1 dan n2: Ukuran sampel grup 1 dan 2
  3. Uji t Sampel Berpasangan (Paired sample t-test): Menguji apakah ada perbedaan rata-rata dalam dua kondisi yang berhubungan, misalnya sebelum dan sesudah suatu perlakuan pada kelompok yang sama.

    t=ˉdsd/n

    Keterangan:

    • ˉd: Rata-rata selisih
    • sd: Deviasi standar selisih
    • n: Ukuran sampel

8.5.2 Langkah-langkah Uji t

  1. Formulasi Hipotesis:

    • H0: Rata-rata μ = nilai yang diuji (misalnya rata-rata populasi atau perbedaan antara dua grup = 0).
    • Hipotesis Alternatif Ha: Rata-rata μ nilai yang diuji atau perbedaan antara dua grup ¬0.
  2. Hitung Nilai t menggunakan rumus sesuai dengan jenis uji t yang dilakukan.

  3. Bandingkan Nilai t dengan t-Tabel untuk menentukan apakah nilai t terletak di area kritis. (Atau bandingkan nilai-p dengan tingkat signifikansi α).

  4. Keputusan:

    • Jika nilai t lebih besar dari t-kritis (untuk uji dua sisi) atau nilai-p lebih kecil dari α (misalnya 0.05), maka H0 ditolak.

8.5.3 Uji t Satu Sampel

Apakah Rata-rata Penghasilan Berbeda dari Rp5 Juta?

  1. H0:μ=5, Rata-rata penghasilan karyawan sama dengan Rp5 juta.
  2. Ha:μ5, Rata-rata penghasilan karyawan berbeda dari Rp5 juta.

Uji ini two-tailed test.

# Data penghasilan karyawan (dalam juta)
penghasilan <- c(4.8, 5.2, 5.1, 5.0, 4.9, 5.3, 4.7, 5.4, 4.6, 5.5)

# Uji t: Rata-rata penghasilan dibandingkan dengan Rp5 juta
t_test_result <- t.test(penghasilan, mu = 5)  # Uji hipotesis: rata-rata = 5 juta
print(t_test_result)
## 
##  One Sample t-test
## 
## data:  penghasilan
## t = 0.52223, df = 9, p-value = 0.6141
## alternative hypothesis: true mean is not equal to 5
## 95 percent confidence interval:
##  4.833415 5.266585
## sample estimates:
## mean of x 
##      5.05
# Ekstrak hasil
t_statistic <- t_test_result$statistic       # Nilai t
p_value <- t_test_result$p.value             # P-value
confidence_interval <- t_test_result$conf.int # Confidence interval
mean_sample <- t_test_result$estimate        # Rata-rata sampel
df <- t_test_result$parameter                # Derajat kebebasan

Penjelasan Hasil:

  • Karena t= 0.5222 jauh dari nilai kritis yang signifikan (ditentukan oleh derajat kebebasan dan tingkat signifikansi), ini menunjukkan tidak ada perbedaan signifikan.
  • p-value = 0.6141 lebih besar dari 0.05, sehingga kita gagal menolak H0. Tidak ada cukup bukti untuk menyimpulkan bahwa rata-rata penghasilan berbeda dari Rp5 juta.
  • Confidence Interval (CI): Dengan tingkat kepercayaan 95%, rata-rata penghasilan karyawan diperkirakan antara 4.8334, 5.2666 juta.
  • Rata-rata Sampel: adalah 5.05 juta.
  1. Uji t Dua Sampel Independen (Two-Sample t-test)

Misalkan kita ingin menguji apakah rata-rata skor ujian antara dua grup (Grup A dan Grup B) berbeda.

# Data skor ujian
grup_A <- c(80, 85, 82, 88)
grup_B <- c(75, 70, 78, 72)

# Uji t Dua Sampel Independen
t_test_result <- t.test(grup_A, grup_B)  # Uji hipotesis: perbedaan rata-rata
print(t_test_result)
## 
##  Welch Two Sample t-test
## 
## data:  grup_A and grup_B
## t = 4.0406, df = 6, p-value = 0.006798
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   3.944202 16.055798
## sample estimates:
## mean of x mean of y 
##     83.75     73.75
  1. Uji t Sampel Berpasangan (Paired Sample t-test):

Menggunakan data sebelum dan sesudah perlakuan pada sampel yang sama.

# Data sebelum dan sesudah perlakuan
sebelum <- c(85, 88, 90, 91)
sesudah <- c(90, 92, 91, 95)

# Uji t Sampel Berpasangan
paired_t_test_result <- t.test(sebelum, sesudah, paired = TRUE)  # Uji hipotesis: rata-rata selisih = 0
print(paired_t_test_result)
## 
##  Paired t-test
## 
## data:  sebelum and sesudah
## t = -4.0415, df = 3, p-value = 0.02726
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -6.2560793 -0.7439207
## sample estimates:
## mean difference 
##            -3.5

Kesimpulan:

  • Uji t digunakan untuk menguji perbedaan rata-rata antara satu atau lebih sampel.
  • Uji t Satu Sampel digunakan untuk membandingkan rata-rata sampel dengan nilai tertentu.
  • Uji t Dua Sampel digunakan untuk menguji perbedaan rata-rata antara dua grup sampel.
  • Uji t Sampel Berpasangan digunakan untuk menguji perbedaan rata-rata dalam dua kondisi yang berhubungan.