第 5 章 Panel
參考資料:
Principles of Econometrics with R, Constantin Colonescu: Chapter 15
Panel Data Econometrics in R: The plm Package, Yves Croissant and Giovanni Millo.
5.1 效應評估模型
提高啤酒稅(BeerTax)是否有助減低車禍死亡率(mrall)?
mrall=mrall−BeerTax+β∗BeerTax
資料:美國56洲,1982-1988年資料
5.2 遺漏變數偏誤
每個州的飲酒文化不同,愛喝酒的州自然「車禍死亡率」高,如果愛喝酒的州的「啤酒稅」也高,那比較「啤酒稅」高低的州,其「死亡率」帶有比較「愛喝酒程度」高低的意含。
「州愛喝酒程度」並不會真的有這個變數,這時有以下解決方法:
找替代變數(即proxies)來當控制變數。
找工具變數保留BeerTax中不與mrall−BeerTax相關的部份。
- 依遺漏變數變動面向特質,去除mrall−BeerTax中受遺漏變數影響的部份。
5.3 訊息拆解
令W代表「州愛喝酒程度」。上面的論述表示:
W與mrall−BeerTax有關
W與BeerTax有關
我們可使用W對mrall−BeerTax進行訊息拆解。
拆解後的結果如何?
mrall−BT=E(mrall−BT|W)+(mrall−BT−E(mrall−BT|W))
5.4 固定效果模型
透過訊息拆解我們可以把效應模型寫成:
mrall=(mrall−BT−E(mrall−BT|W))+E(mrall−BT|W)+β∗BeerTax
其中令 mrall−BT,−W≡mrall−BT−E(mrall−BT|W) 故效應結構可以寫成: mrall=mrall−BT,−W+E(mrall−BT|W)+β∗BeerTax
mrall−BT,−W 為「去除」W影響的「非啤酒稅造成的車禍死亡因素」:
它與W無關。
- 若兩筆資料有相同飲酒文化,即W相同,他們的E(mrall−BT|W)會相同。
「假設」一個地方的飲酒文化「不隨時間改變」,即同一州在不同時點的W相同。
我們使用下標i代表第i個州,下標t代表第t期資料,令
E(mrall−BT,it|Wi)=αi
故我們的效應模型可以寫成:
mrallit=mrall−BT,−W,it+αi+β∗BeerTaxit
其中αi為第i個州的固定效果:
- 只有下標i,因為資料若來自相同州,其內含的效果是固定相同的。
回顧:
我們由一開始的效應模型: mrallit=mrall−BT,it+β∗BeerTaxit 擔心BeerTax與mrall−BT有關,原因是W從中作祟。要對付它,我們把它從mrall−BT分離出來,再加上對它認知,認為W在同一州內是固定值,故分離出來的部份可以寫成αi,也就是說: mrall−BT,it=mrall−BT,−W,it+αi 因此效應式可以寫成: mrallit=mrall−BT,−W,it+αi+β∗BeerTaxit 此時
- BeerTax與mrall−BT,−W無關
- BeerTax與α有關
mrallit=mrall−BT,−W,it+αi+β∗BeerTaxit 這條效應迴歸式要能做估計使用只有當我們有αi資料可進行複迴歸估計時。實際上是,我們「沒有αi資料」但知道「αi在同一州內固定」。
5.5 差分最小平方法
考慮「同一州」,兩個時點t=0,1的效應式: mralli0=mrall−BT,−W,i0+αi+β∗BeerTaxi0mralli1=mrall−BT,−W,i1+αi+β∗BeerTaxi1
考慮如下的迴歸模型:
mralli1−mralli0=β0+β1(BeerTaxi1−BearTaxi0)+ϵi
請問ϵ代表什麼?又OLS下ˆβ1會是β∗的一致性估計嗎?
OLS的母體迴歸線代表 E(mralli1−mralli0|BeerTaxi1−BeerTaxi0)=E(mrall−BT,−W,i1−mrall−BT,−W,i0|BeerTaxi1−BeerTaxi0)+β∗(BeerTaxi1−BeerTaxi0) 其中mrall−BT,−W,it與BeerTaxit已無關連,故 E(mrall−BT,−W,i1−mrall−BT,−W,i0|BeerTaxi1−BeerTaxi0)=E(mrall−BT,−W,i1−mrall−BT,−W,i0) 因此 β0=E(mrall−BT,−W,i1−mrall−BT,−W,i0)β1(BeerTaxi1−BeerTaxi0)=β∗(BeerTaxi1−BeerTaxi0)ϵi=(mrall−BT,−W,i1−mrall−BT,−W,i0)−E(mrall−BT,−W,i1−mrall−BT,−W,i0)
回顧: mrallit=mrall−BT,−W,it+αi+β∗BeerTaxit 是無法用來估計效應的迴歸模型,阻礙來源是αi。差分在這裡拿掉了這層阻礙而得到 mralli1−mralli0=β∗(BeerTaxi1−BearTaxi0)+(mrall−BT,−W,i1−mrall−BT,−W,i0)
5.6 組內差異最小平方法
回顧我們的效應結構: mrallit=mrall−BT,−W,it+αi+β∗BeerTaxit
如果t超過兩期,考慮用組內平均為差分比較的點。
若x1,x2,...,xn為同一群組資料,他們與組內平均的差分即代表各自組內差異,即x1−ˉx,x2−ˉx,...,xn−ˉx其中ˉx=∑ni=1xi/n。
令 ¯mralli=T∑t=1mrallit/T¯BeerTaxi=T∑t=1BeerTaxit/T¯mrall−BT,−W,i=T∑t=1mrall−BT,−W,it/T
則
mrallit−¯mralli=β∗(BeerTaxit−¯BeerTaxi)+(mrall−BT,−W,it−¯mrall−BT,−W,i)
固定效果模型下,我們可以以最小平方法估計下面的迴歸式: mrallit−¯mralli=β0+β1(BeerTaxit−¯BeerTaxi)+ϵit 其中ˆβ1即為β∗的一致性估計
另外,在數學上我們可以證明組內差異最小平方法,和以下使用虛擬變數為複迴歸控制變數的ˆβ1相同: mrallit=N∑k=1αiDki+β1BeerTaxit+ϵit 其中虛擬變數Dk=1若資料來自第k個州,故組內差異最小平方估計又稱為虛擬變數最小平方估計(Least Square Dummy Variable estimation, LSDV)。
5.7 常見的固定效果模型
固定效果泛指效應殘差效果(即這裡的mrall−BT,it)可以再進一步分離出「在一群資料中固定不變」的部份(即這裡的αi=E(mrall−BT,it|Wi)),我們使用下標來呈現固定效果的固定不變面向(即這裡的αi)。
在追踪資料中,常見的固定效果面向有以下兩個面向:
Identity fixed effect: αi
Time fixed effect: δt
如: mrall−BT,it=mrall−BT,−Wi,−Zt+αi+δt 其中
Wi為造成效應係數估計偏誤的變數,它在i面向固定不變。
Zt為造成效應係數估計偏誤的變數,它在t面向固定不變。
範例:Zt為全美國的景氣狀況。
迴歸模型忽略「全美國景氣狀況」會造成效應係數估計偏誤的經濟故事是什麼?
固定效果下的效應結構模型: mrallit=mrall−BT,−W,−Z,it+αi+δt+β∗BeerTaxit 對應的迴歸模型: mrallit=αi+δt+β1BeerTaxit+ϵit
- 迴歸模型通常不寫常數項(β0),常見固定效果寫法已包含了常數項。(在某些狀況為了方便說明,才會把β0分離出來——有沒有寫β0都可以。)
- 這裡因為常數項是隱含的,所以ϵit的定義和之前一樣: ϵit=mrall−BT,−W,−Z,it−E(mrall−BT,−W,−Z,it|BT,W,Z)
5.8 認定問題
效應變數變動面向
假設每一州的啤酒稅在樣本期間都「不隨」時間改變,考慮以下的固定效果效應模型: mrallit=mrall−BT,−W,it+αi+β∗BeerTaxi使用組內差異最小平方法估計會有什麼問題?
LSDV虛擬變數個數
LSDV法下的迴歸模型: mrallit=N∑k=1αkDki+β1BeerTaxit+ϵit
考慮這個迴歸模型: mrallit=β0+N∑k=1αkDki+β1BeerTaxit+ϵit 它多了常數項,在OLS估計時會有什麼問題?
固定效果下的效應結構模型:
mrallit=mrall−BT,−W,−Z,it+αi+δt+β∗BeerTaxit
對應的迴歸模型:
mrallit=αi+δt+β1BeerTaxit+ϵit
(1) 使用組內差異最小平方法要如何demean去除固定效果?
(2) 使用LSDV估計,若使用以下的迴歸模型表示,它會有什麼問題?
mrallit=N∑k=1αkDki+T∑j=1δjBjt+β1BeerTaxit+ϵit
5.9 廣義的固定效果模型
接下來我們以固定效果只在identity(i)及time(t)面向固定來總結。
效應結構模型:
mrallit=mrall−BT,it+β∗BeerTaxit
但 mrall−BT,it⊥̸
複迴歸控制
先思考造成(5.1)的變數有哪些——統計上稱這些變數為混淆變數(confounder)。Confounder中有資料的(令為Z)可進一步用來擴充模型成為:
mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}
其中: mrall_{-BT,-Z}=mrall_{-BT}-\mathbb{E}(mrall_{-BT}|Z)
固定效果模型
Confounder中沒有資料但在某些面向固定的,假設分成以下兩類:
- W_i:在同個identity下固定。
- V_t:在同個time下固定。
則擴充效應模型成為:
\begin{eqnarray} mrall_{it}=mrall_{-BT,-(Z,W,V),it}+\beta^*BeerTax_{it}+\\ \alpha_i+\delta_t+\gamma'Z_{it} \tag{5.2} \end{eqnarray}
其中: mrall_{-BT,-(Z,W,V),it}=mrall_{-BT,it}-\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t) 且假設- \mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)=\alpha_i+\delta_t+\gamma'Z_{it}
- mrall_{-BT,-(Z,W,V),it}\perp BeerTax_{it}
(5.2)是相當廣義的固定效果效應模型——有兩個面向的固定效果及控制變數。
- (5.2)所對應的迴歸模型長怎麼樣?
- 使用組內差異最小平方法要如何估計?
- 使用LSDV最小平方法要如何估計?
5.10 異質變異
考慮如下的固定效果迴歸模型: mrall_{it}=\alpha_{i}+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\epsilon_{it} 令 \begin{eqnarray} \overrightarrow{\epsilon}_{i}=\left[\begin{array}{c} \epsilon_{i1}\\ \epsilon_{i2}\\ \vdots\\ \epsilon_{iT} \end{array}\right] \end{eqnarray}
\begin{eqnarray} \textbf{e}=\left[\begin{array}{c} \overrightarrow{\epsilon}_{1}\\ \overrightarrow{\epsilon}_{2}\\ \vdots\\ \vdots\\ \overrightarrow{\epsilon}_{N} \end{array}\right] \end{eqnarray}
\begin{eqnarray} \mathbb{E}(\textbf{ee}'|X)=\mathbb{E}\left[\begin{array}{ccccc} \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{2}'|X) & \cdots & \cdots & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{N}'|X)\\ \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{2}'|X) & & & \vdots\\ \vdots & & \ddots & & \vdots\\ \vdots & & & \ddots & \vdots\\ \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{2}'|X) & & & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{N}'|X) \end{array}\right] \end{eqnarray}
其中X代表資料訊息,這裡包含資料來自的i,t及BeerTax_{it},Z_{it}值。
\mathbb{E}(\textbf{ee}'|X)會長什麼樣?
5.11 隨機效果模型
回顧效應模型: mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}隨機效果模型(Random Effect model)的設定:
使用迴歸模型:
\begin{eqnarray} mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} \tag{5.3} \end{eqnarray}- 假設\nu_{it}具有某種結構。
- 含常數項,\beta_0=\mathbb{E}(mrall_{-BT,-Z,it}),所以
\nu_{it}=mrall_{-BT,-Z,it}-\mathbb{E}(mrall_{-BT,-Z,it})
我們可訊息拆解出\nu_{it}的固定效果項: \nu_{it}=\alpha_i+(\nu_{it}-\mathbb{E}(\nu_{it}|W_i)) 其中\alpha_i=\mathbb{E}(\nu_{it}|W_i)
令\epsilon_{it}=v_{it}-\mathbb{E}(v_{it}|W_i),則:
\nu_{it}=\alpha_i+\epsilon_{it}
要有什麼假設才能保證(5.3)式迴歸模型\beta_1最小平方估計式為\beta^*的一致性估計式?
假設
- var(\alpha_i|X)=\sigma_{\alpha}^2
- var(\epsilon_{it}|X)=\sigma^2
- cov(\epsilon_{it},\epsilon_{is}|X)=0
令 \textbf{v}=\left[\begin{array}{c} \nu_{11}\\ \vdots\\ \nu_{1T}\\ \nu_{21}\\ \vdots\\ \nu_{2T}\\ \vdots\\ \nu_{NT} \end{array}\right]
請問\mathbb{E}(\textbf{vv}'|X)會長怎麼樣?
隨機效果模型與GLS
給定迴歸模型: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} 及其\mathbb{E}(\textbf{vv}'|X)=\Omega。
此迴歸模型的GLS估計要怎麼做?
隨機效果模型帶有高度誤差項假設,故不建議使用。
5.12 Hausman檢定
固定效果模型(FE)
表示使用組內差異最小平法方去估算以下迴歸模型中的\beta_1: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\alpha_i+\epsilon_{it}
隨機效果模型(RE)
表示使用GLS去估算以下迴歸模型中的\beta_1: mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}
- 其中\nu_{it}=\alpha_i+\epsilon_{it}
假設
- RE下「關於variance、covariance的假設」都成立。
- \epsilon_{it} \perp BeerTax_{it} | \alpha_i,Z_{it}
考慮以下的虛無假設
\textbf{H0}: \alpha_i \perp BeerTax_{it} |Z_{it}
在虛無假設下,隨機效果模型(RE)與固定效果模型(FE)的估算方式,何者有一致性?