第 5 章 Panel

參考資料:

  • Principles of Econometrics with R, Constantin Colonescu: Chapter 15

  • Panel Data Econometrics in R: The plm Package, Yves Croissant and Giovanni Millo.

5.1 效應評估模型

提高啤酒稅(BeerTax)是否有助減低車禍死亡率(mrall)?

mrall=mrallBeerTax+βBeerTax

資料:美國56洲,1982-1988年資料

00.511.522.50.10.150.20.250.30.350.4
1988198719861985198419831982beertaxI(mrall * 1000)

5.2 遺漏變數偏誤

每個州的飲酒文化不同,愛喝酒的州自然「車禍死亡率」高,如果愛喝酒的州的「啤酒稅」也高,那比較「啤酒稅」高低的州,其「死亡率」帶有比較「愛喝酒程度」高低的意含。

「州愛喝酒程度」並不會真的有這個變數,這時有以下解決方法:

  • 找替代變數(即proxies)來當控制變數。

  • 找工具變數保留BeerTax中不與mrallBeerTax相關的部份。

  • 依遺漏變數變動面向特質,去除mrallBeerTax中受遺漏變數影響的部份。

5.3 訊息拆解

W代表「州愛喝酒程度」。上面的論述表示:

  • WmrallBeerTax有關

  • WBeerTax有關

我們可使用WmrallBeerTax進行訊息拆解。

拆解後的結果如何?

mrallBT=E(mrallBT|W)+(mrallBTE(mrallBT|W))

5.4 固定效果模型

透過訊息拆解我們可以把效應模型寫成:

mrall=(mrallBTE(mrallBT|W))+E(mrallBT|W)+βBeerTax

其中令 mrallBT,WmrallBTE(mrallBT|W) 故效應結構可以寫成: mrall=mrallBT,W+E(mrallBT|W)+βBeerTax

mrallBT,W 為「去除」W影響的「非啤酒稅造成的車禍死亡因素」:

  • 它與W無關。

  • 若兩筆資料有相同飲酒文化,即W相同,他們的E(mrallBT|W)會相同。

「假設」一個地方的飲酒文化「不隨時間改變」,即同一州在不同時點的W相同。


我們使用下標i代表第i個州,下標t代表第t期資料,令 E(mrallBT,it|Wi)=αi 故我們的效應模型可以寫成: mrallit=mrallBT,W,it+αi+βBeerTaxit 其中αi為第i個州的固定效果:

  • 只有下標i,因為資料若來自相同州,其內含的效果是固定相同的。

回顧:

我們由一開始的效應模型: mrallit=mrallBT,it+βBeerTaxit 擔心BeerTaxmrallBT有關,原因是W從中作祟。要對付它,我們把它從mrallBT分離出來,再加上對它認知,認為W在同一州內是固定值,故分離出來的部份可以寫成αi,也就是說: mrallBT,it=mrallBT,W,it+αi 因此效應式可以寫成: mrallit=mrallBT,W,it+αi+βBeerTaxit 此時

  • BeerTaxmrallBT,W無關
  • BeerTaxα有關

mrallit=mrallBT,W,it+αi+βBeerTaxit 這條效應迴歸式要能做估計使用只有當我們有αi資料可進行複迴歸估計時。實際上是,我們「沒有αi資料」但知道「αi在同一州內固定」。

5.5 差分最小平方法

考慮「同一州」,兩個時點t=0,1的效應式: mralli0=mrallBT,W,i0+αi+βBeerTaxi0mralli1=mrallBT,W,i1+αi+βBeerTaxi1

考慮如下的迴歸模型:

mralli1mralli0=β0+β1(BeerTaxi1BearTaxi0)+ϵi

請問ϵ代表什麼?又OLS下ˆβ1會是β的一致性估計嗎?

OLS的母體迴歸線代表 E(mralli1mralli0|BeerTaxi1BeerTaxi0)=E(mrallBT,W,i1mrallBT,W,i0|BeerTaxi1BeerTaxi0)+β(BeerTaxi1BeerTaxi0) 其中mrallBT,W,itBeerTaxit已無關連,故 E(mrallBT,W,i1mrallBT,W,i0|BeerTaxi1BeerTaxi0)=E(mrallBT,W,i1mrallBT,W,i0) 因此 β0=E(mrallBT,W,i1mrallBT,W,i0)β1(BeerTaxi1BeerTaxi0)=β(BeerTaxi1BeerTaxi0)ϵi=(mrallBT,W,i1mrallBT,W,i0)E(mrallBT,W,i1mrallBT,W,i0)


回顧: mrallit=mrallBT,W,it+αi+βBeerTaxit 是無法用來估計效應的迴歸模型,阻礙來源是αi。差分在這裡拿掉了這層阻礙而得到 mralli1mralli0=β(BeerTaxi1BearTaxi0)+(mrallBT,W,i1mrallBT,W,i0)

5.6 組內差異最小平方法

回顧我們的效應結構: mrallit=mrallBT,W,it+αi+βBeerTaxit

如果t超過兩期,考慮用組內平均為差分比較的點。

x1,x2,...,xn為同一群組資料,他們與組內平均的差分即代表各自組內差異,即x1ˉx,x2ˉx,...,xnˉx其中ˉx=ni=1xi/n

¯mralli=Tt=1mrallit/T¯BeerTaxi=Tt=1BeerTaxit/T¯mrallBT,W,i=Tt=1mrallBT,W,it/T

mrallit¯mralli=β(BeerTaxit¯BeerTaxi)+(mrallBT,W,it¯mrallBT,W,i)

固定效果模型下,我們可以以最小平方法估計下面的迴歸式: mrallit¯mralli=β0+β1(BeerTaxit¯BeerTaxi)+ϵit 其中ˆβ1即為β的一致性估計

另外,在數學上我們可以證明組內差異最小平方法,和以下使用虛擬變數為複迴歸控制變數的ˆβ1相同: mrallit=Nk=1αiDki+β1BeerTaxit+ϵit 其中虛擬變數Dk=1若資料來自第k個州,故組內差異最小平方估計又稱為虛擬變數最小平方估計(Least Square Dummy Variable estimation, LSDV)。

0.10.20.30.40.50.60.70.80.140.160.180.20.220.240.26
2316965beertaxI(mrall * 1000)

5.7 常見的固定效果模型

固定效果泛指效應殘差效果(即這裡的mrallBT,it)可以再進一步分離出「在一群資料中固定不變」的部份(即這裡的αi=E(mrallBT,it|Wi)),我們使用下標來呈現固定效果的固定不變面向(即這裡的αi)。

在追踪資料中,常見的固定效果面向有以下兩個面向:

  • Identity fixed effect: αi

  • Time fixed effect: δt

如: mrallBT,it=mrallBT,Wi,Zt+αi+δt 其中

  • Wi為造成效應係數估計偏誤的變數,它在i面向固定不變。

  • Zt為造成效應係數估計偏誤的變數,它在t面向固定不變。

範例:Zt為全美國的景氣狀況。

迴歸模型忽略「全美國景氣狀況」會造成效應係數估計偏誤的經濟故事是什麼?

固定效果下的效應結構模型: mrallit=mrallBT,W,Z,it+αi+δt+βBeerTaxit 對應的迴歸模型: mrallit=αi+δt+β1BeerTaxit+ϵit

  • 迴歸模型通常不寫常數項(β0),常見固定效果寫法已包含了常數項。(在某些狀況為了方便說明,才會把β0分離出來——有沒有寫β0都可以。)
  • 這裡因為常數項是隱含的,所以ϵit的定義和之前一樣: ϵit=mrallBT,W,Z,itE(mrallBT,W,Z,it|BT,W,Z)

5.8 認定問題

效應變數變動面向

假設每一州的啤酒稅在樣本期間都「不隨」時間改變,考慮以下的固定效果效應模型: mrallit=mrallBT,W,it+αi+βBeerTaxi

使用組內差異最小平方法估計會有什麼問題?

LSDV虛擬變數個數

LSDV法下的迴歸模型: mrallit=Nk=1αkDki+β1BeerTaxit+ϵit

考慮這個迴歸模型: mrallit=β0+Nk=1αkDki+β1BeerTaxit+ϵit 它多了常數項,在OLS估計時會有什麼問題?


固定效果下的效應結構模型: mrallit=mrallBT,W,Z,it+αi+δt+βBeerTaxit 對應的迴歸模型: mrallit=αi+δt+β1BeerTaxit+ϵit (1) 使用組內差異最小平方法要如何demean去除固定效果?
(2) 使用LSDV估計,若使用以下的迴歸模型表示,它會有什麼問題? mrallit=Nk=1αkDki+Tj=1δjBjt+β1BeerTaxit+ϵit

5.9 廣義的固定效果模型

接下來我們以固定效果只在identity(i)及time(t)面向固定來總結。

效應結構模型:

mrallit=mrallBT,it+βBeerTaxit

mrallBT,it⊥̸

複迴歸控制

先思考造成(5.1)的變數有哪些——統計上稱這些變數為混淆變數(confounder)。Confounder中有資料的(令為Z)可進一步用來擴充模型成為:

mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}

其中: mrall_{-BT,-Z}=mrall_{-BT}-\mathbb{E}(mrall_{-BT}|Z)

固定效果模型

Confounder中沒有資料但在某些面向固定的,假設分成以下兩類:

  • W_i:在同個identity下固定。
  • V_t:在同個time下固定。

則擴充效應模型成為:

\begin{eqnarray} mrall_{it}=mrall_{-BT,-(Z,W,V),it}+\beta^*BeerTax_{it}+\\ \alpha_i+\delta_t+\gamma'Z_{it} \tag{5.2} \end{eqnarray}

其中: mrall_{-BT,-(Z,W,V),it}=mrall_{-BT,it}-\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t) 且假設
  • \mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)=\alpha_i+\delta_t+\gamma'Z_{it}
  • mrall_{-BT,-(Z,W,V),it}\perp BeerTax_{it}

(5.2)是相當廣義的固定效果效應模型——有兩個面向的固定效果及控制變數。

  1. (5.2)所對應的迴歸模型長怎麼樣?
  2. 使用組內差異最小平方法要如何估計?
  3. 使用LSDV最小平方法要如何估計?

5.10 異質變異

考慮如下的固定效果迴歸模型: mrall_{it}=\alpha_{i}+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\epsilon_{it}\begin{eqnarray} \overrightarrow{\epsilon}_{i}=\left[\begin{array}{c} \epsilon_{i1}\\ \epsilon_{i2}\\ \vdots\\ \epsilon_{iT} \end{array}\right] \end{eqnarray}

\begin{eqnarray} \textbf{e}=\left[\begin{array}{c} \overrightarrow{\epsilon}_{1}\\ \overrightarrow{\epsilon}_{2}\\ \vdots\\ \vdots\\ \overrightarrow{\epsilon}_{N} \end{array}\right] \end{eqnarray}

\begin{eqnarray} \mathbb{E}(\textbf{ee}'|X)=\mathbb{E}\left[\begin{array}{ccccc} \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{2}'|X) & \cdots & \cdots & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{N}'|X)\\ \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{2}'|X) & & & \vdots\\ \vdots & & \ddots & & \vdots\\ \vdots & & & \ddots & \vdots\\ \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{2}'|X) & & & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{N}'|X) \end{array}\right] \end{eqnarray}

其中X代表資料訊息,這裡包含資料來自的i,tBeerTax_{it},Z_{it}值。

\mathbb{E}(\textbf{ee}'|X)會長什麼樣?

5.11 隨機效果模型

回顧效應模型: mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}

隨機效果模型(Random Effect model)的設定:

  • 使用迴歸模型:
    \begin{eqnarray} mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} \tag{5.3} \end{eqnarray}

  • 假設\nu_{it}具有某種結構。
  • 含常數項,\beta_0=\mathbb{E}(mrall_{-BT,-Z,it}),所以 \nu_{it}=mrall_{-BT,-Z,it}-\mathbb{E}(mrall_{-BT,-Z,it})
  • 我們可訊息拆解出\nu_{it}的固定效果項: \nu_{it}=\alpha_i+(\nu_{it}-\mathbb{E}(\nu_{it}|W_i)) 其中\alpha_i=\mathbb{E}(\nu_{it}|W_i)

  • \epsilon_{it}=v_{it}-\mathbb{E}(v_{it}|W_i),則:
    \nu_{it}=\alpha_i+\epsilon_{it}


要有什麼假設才能保證(5.3)式迴歸模型\beta_1最小平方估計式為\beta^*的一致性估計式?


假設

  • var(\alpha_i|X)=\sigma_{\alpha}^2
  • var(\epsilon_{it}|X)=\sigma^2
  • cov(\epsilon_{it},\epsilon_{is}|X)=0

\textbf{v}=\left[\begin{array}{c} \nu_{11}\\ \vdots\\ \nu_{1T}\\ \nu_{21}\\ \vdots\\ \nu_{2T}\\ \vdots\\ \nu_{NT} \end{array}\right]

請問\mathbb{E}(\textbf{vv}'|X)會長怎麼樣?


隨機效果模型與GLS

給定迴歸模型: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} 及其\mathbb{E}(\textbf{vv}'|X)=\Omega

此迴歸模型的GLS估計要怎麼做?


隨機效果模型帶有高度誤差項假設,故不建議使用。

5.12 Hausman檢定

固定效果模型(FE)

表示使用組內差異最小平法方去估算以下迴歸模型中的\beta_1: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\alpha_i+\epsilon_{it}

隨機效果模型(RE)

表示使用GLS去估算以下迴歸模型中的\beta_1: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}

  • 其中\nu_{it}=\alpha_i+\epsilon_{it}

假設

  • RE下「關於variance、covariance的假設」都成立。
  • \epsilon_{it} \perp BeerTax_{it} | \alpha_i,Z_{it}

考慮以下的虛無假設

\textbf{H0}: \alpha_i \perp BeerTax_{it} |Z_{it}

在虛無假設下,隨機效果模型(RE)與固定效果模型(FE)的估算方式,何者有一致性?