11 Clifford, Sheagley, and Piston (2021)

11.1 文獻回顧與研究問題

政治學界的調查實驗研究多採取 post-only design,即僅在處置結束後測量結果變數。有論者認為採取 repeated measures designs 可能會改變處置效果,因為受試者在短時間內被一再問到相同的問題會起疑。真的是這樣嗎?這個觀點其實缺乏實證證據支持。

11.1.1 政治學的實驗設計

四種實驗設計的比較。

Figure 11.1: 四種實驗設計的比較。

如圖 11.1,實驗設計可以分成兩大類:between-subjects design 與 within-subjects design,而前者又能分成 post-only、pre-post 與 quasi-pre-post 三種。Post-only design 是政治學界最常用的實驗設計,並且簡單。不過問題在於 post-only design 較不精確,如果樣本小或實驗的 conditions 複雜起來,那會更嚴重。總而言之,post-only design 需要更大的樣本。新增更多控制變數能增加檢定力,但效果有限。

作者認為可以改採 repeated measures designs,即在研究中測量多次結果變數。例如 pre-post design 就是其一,與 post-only 的區別只在實驗操弄前有測量結果變數,如圖 11.1。另一種實驗設計為 quasi-pre-post design,近似於 post-only design,差別在前測測量的是與依變數高度相關的變數。Within-subject design 則都不同於這幾種,每一個受試者會接受處置,不過時序不同;conjoint design 也算一種 within-subject design,但概念都不同於前幾種,而是讓受試者不斷進行選擇作業,選項具有隨機抽出的特質。

Repeated measures 可能造成的問題分成三種:

  1. Demand effects:受試者會讓自己的行為更接近研究者的期望,而重複測量可能會讓研究者的假設被受試者參透,進而改變處置效果。

  2. Consistency Pressures:受試者會想要讓自己的回應不隨時間改變。

  3. Interaction between Testing and the Treatment:重複測量依變項會讓處置的效果減弱。

而作者在 APSR、AJPS、JoP、PoliBehav 與 PoliPsy 五本期刊中,從 2015 年至 2020 年 4 月間的 457 篇文章中隨機抽出 55 篇文章,當中有 41 篇文章進行了 67 個實驗,各種實驗設計被使用的頻率如圖 11.2

各種實驗設計的使用頻率。

Figure 11.2: 各種實驗設計的使用頻率。

11.1.2 研究問題

  • Repeated measures 能否增加精確度(降低標準誤)卻不影響處置效果?

11.2 如何回答研究問題

作者進行了六個實驗,實驗概要如圖 11.3

六個實驗。

Figure 11.3: 六個實驗。

透過 internal meta-analysis 發現,repeated measures designs 在統計上不會顯著地影響處置效果;但是,pre-post design 卻可以有效地降低估計的標準誤,而 quasi-design 有時也能提高精確度。

此外,panel design 的效果微乎其微,反而在同波調查採用 pre-post design 就能有效提高精確度;以 study 6 而言,consistency pressures 是存在的,但受試者似乎會忘記自己在 pre-test 的回答。另外,計算 MDE 也可以發現,pre-post design 的 MDE 相比起 post-only design 更小。

11.3 評價

11.3.1 研究貢獻

作者透過實證,發現傳統上認為 repeated measures 會造成處置效果改變上的說法(但並未有足夠多的證據)並不正確,且 repeated measures 還能增加精確度,這意味著 MDE 更低,即不需要那麼多的樣本就能識別處置效果。並且,長久以來透過控制變數來提高精確度的作法,其實效果也不如改用 repeated measures。此外,文獻的 pre-post design 多為 panel design,但其實並不需要那麼費工,即使在同一波調查,就能顯著地提高精確度。

11.3.2 研究限制

  1. 作者所從事的六場實驗,主要都是複製前人或大幅參照前人的研究的實驗,但並未解釋為何選取這些實驗主題與實驗典範。研究的內部效度很強,但外部效度或許值得近一步探討。

  2. SI 沒有附那 55 篇隨機選取的文章的資料,當中就有 41 篇使用調查實驗的比例讓人吃驚。

參考文獻

Clifford, Scott, Geoffrey Sheagley, and Spencer Piston. 2021. “Increasing Precision Without Altering Treatment Effects: Repeated Measures Designs in Survey Experiments.” American Political Science Review 115 (3): 1048–65. https://doi.org/10.1017/S0003055421000241.