第 5 章 Panel
參考資料:
Principles of Econometrics with R, Constantin Colonescu: Chapter 15
Panel Data Econometrics in R: The plm Package, Yves Croissant and Giovanni Millo.
5.1 效應評估模型
提高啤酒稅(BeerTax)是否有助減低車禍死亡率(mrall)?
\[mrall=mrall_{-BeerTax}+\beta^*BeerTax\]
資料:美國56洲,1982-1988年資料
5.2 遺漏變數偏誤
每個州的飲酒文化不同,愛喝酒的州自然「車禍死亡率」高,如果愛喝酒的州的「啤酒稅」也高,那比較「啤酒稅」高低的州,其「死亡率」帶有比較「愛喝酒程度」高低的意含。
「州愛喝酒程度」並不會真的有這個變數,這時有以下解決方法:
找替代變數(即proxies)來當控制變數。
找工具變數保留BeerTax中不與\(mrall_{-BeerTax}\)相關的部份。
- 依遺漏變數變動面向特質,去除\(mrall_{-BeerTax}\)中受遺漏變數影響的部份。
5.3 訊息拆解
令\(W\)代表「州愛喝酒程度」。上面的論述表示:
\(W\)與\(mrall_{-BeerTax}\)有關
\(W\)與\(BeerTax\)有關
我們可使用\(W\)對\(mrall_{-BeerTax}\)進行訊息拆解。
拆解後的結果如何?
\[mrall_{-BT}=\mathbb{E}(mrall_{-BT}|W)+(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))\]
5.4 固定效果模型
透過訊息拆解我們可以把效應模型寫成:
\[mrall=(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))+\mathbb{E}(mrall_{-BT}|W) + \beta^*BeerTax \]
其中令 \[mrall_{-BT,-W}\equiv mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W)\] 故效應結構可以寫成: \[mrall=mrall_{-BT,-W}+\mathbb{E}(mrall_{-BT}|W)+\beta^*BeerTax\]
\[mrall_{-BT,-W}\] 為「去除」\(W\)影響的「非啤酒稅造成的車禍死亡因素」:
它與\(W\)無關。
- 若兩筆資料有相同飲酒文化,即\(W\)相同,他們的\(\mathbb{E}(mrall_{-BT}|W)\)會相同。
「假設」一個地方的飲酒文化「不隨時間改變」,即同一州在不同時點的\(W\)相同。
我們使用下標\(i\)代表第\(i\)個州,下標\(t\)代表第\(t\)期資料,令
\[\mathbb{E}(mrall_{-BT,it}|W_i)=\alpha_i\]
故我們的效應模型可以寫成:
\[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\]
其中\(\alpha_i\)為第\(i\)個州的固定效果:
- 只有下標\(i\),因為資料若來自相同州,其內含的效果是固定相同的。
回顧:
我們由一開始的效應模型: \[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\] 擔心\(BeerTax\)與\(mrall_{-BT}\)有關,原因是\(W\)從中作祟。要對付它,我們把它從\(mrall_{-BT}\)分離出來,再加上對它認知,認為\(W\)在同一州內是固定值,故分離出來的部份可以寫成\(\alpha_i\),也就是說: \[mrall_{-BT,it}=mrall_{-BT,-W,it}+\alpha_i\] 因此效應式可以寫成: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 此時
- \(BeerTax\)與\(mrall_{-BT,-W}\)無關
- \(BeerTax\)與\(\alpha\)有關
\[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 這條效應迴歸式要能做估計使用只有當我們有\(\alpha_i\)資料可進行複迴歸估計時。實際上是,我們「沒有\(\alpha_i\)資料」但知道「\(\alpha_i\)在同一州內固定」。
5.5 差分最小平方法
考慮「同一州」,兩個時點t=0,1的效應式: \[\begin{align*} mrall_{i0} & =mrall_{-BT,-W,i0} +\alpha_i+ \beta^*BeerTax_{i0}\\ mrall_{i1} & =mrall_{-BT,-W,i1} +\alpha_i+ \beta^*BeerTax_{i1} \end{align*}\]
考慮如下的迴歸模型:
\[mrall_{i1}-mrall_{i0}=\beta_0+\beta_1 (BeerTax_{i1}-BearTax_{i0})+\epsilon_i\]
請問\(\epsilon\)代表什麼?又OLS下\(\hat{\beta}_1\)會是\(\beta^*\)的一致性估計嗎?
OLS的母體迴歸線代表 \[\begin{align*} \mathbb{E}(mrall_{i1}-mrall_{i0} & |BeerTax_{i1}-BeerTax_{i0}) =\\ & \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})\\ & +\beta^*(BeerTax_{i1}-BeerTax_{i0}) \end{align*}\] 其中\(mrall_{-BT,-W,it}\)與\(BeerTax_{it}\)已無關連,故 \[\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})=\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\] 因此 \[\begin{eqnarray} \beta_0 =\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\\ \beta_1 (BeerTax_{i1}-BeerTax_{i0}) =\beta^*(BeerTax_{i1}-BeerTax_{i0})\\ \epsilon_i = (mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})-\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}) \end{eqnarray}\]
回顧: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 是無法用來估計效應的迴歸模型,阻礙來源是\(\alpha_i\)。差分在這裡拿掉了這層阻礙而得到 \[mrall_{i1}-mrall_{i0}=\beta^* (BeerTax_{i1}-BearTax_{i0})+(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\]
5.6 組內差異最小平方法
回顧我們的效應結構: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\]
如果\(t\)超過兩期,考慮用組內平均為差分比較的點。
若\(x_1,x_2,...,x_n\)為同一群組資料,他們與組內平均的差分即代表各自組內差異,即\(x_1-\bar{x},x_2-\bar{x},...,x_n-\bar{x}\)其中\(\bar{x}=\sum_{i=1}^n x_i/n\)。
令 \[\bar{mrall}_i=\sum_{t=1}^T mrall_{it}/T \\ \bar{BeerTax}_i=\sum_{t=1}^T BeerTax_{it}/T\\ \bar{mrall}_{-BT,-W,i}=\sum_{t=1}^T mrall_{-BT,-W,it}/T\]
則
\[mrall_{it}-\bar{mrall}_i=\beta^*\left( BeerTax_{it}-\bar{BeerTax}_i\right)+(mrall_{-BT,-W,it}-\bar{mrall}_{-BT,-W,i})\]
固定效果模型下,我們可以以最小平方法估計下面的迴歸式: \[mrall_{it}-\bar{mrall}_i=\beta_0+\beta_1\left( BeerTax_{it}-\bar{BeerTax}_i\right)+\epsilon_{it}\] 其中\(\hat{\beta}_1\)即為\(\beta^*\)的一致性估計
另外,在數學上我們可以證明組內差異最小平方法,和以下使用虛擬變數為複迴歸控制變數的\(\hat{\beta}_1\)相同: \[mrall_{it}=\sum_{k=1}^N \alpha_i Dk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 其中虛擬變數\(Dk=1\)若資料來自第\(k\)個州,故組內差異最小平方估計又稱為虛擬變數最小平方估計(Least Square Dummy Variable estimation, LSDV)。
5.7 常見的固定效果模型
固定效果泛指效應殘差效果(即這裡的\(mrall_{-BT,it}\))可以再進一步分離出「在一群資料中固定不變」的部份(即這裡的\(\alpha_i=\mathbb{E}(mrall_{-BT,it}|W_i)\)),我們使用下標來呈現固定效果的固定不變面向(即這裡的\(\alpha_i\))。
在追踪資料中,常見的固定效果面向有以下兩個面向:
Identity fixed effect: \(\alpha_i\)
Time fixed effect: \(\delta_t\)
如: \[mrall_{-BT,it}=mrall_{-BT,-W_i,-Z_t}+\alpha_i+\delta_t\] 其中
\(W_i\)為造成效應係數估計偏誤的變數,它在\(i\)面向固定不變。
\(Z_t\)為造成效應係數估計偏誤的變數,它在\(t\)面向固定不變。
範例:\(Z_t\)為全美國的景氣狀況。
迴歸模型忽略「全美國景氣狀況」會造成效應係數估計偏誤的經濟故事是什麼?
固定效果下的效應結構模型: \[mrall_{it}=mrall_{-BT,-W,-Z,it}+\alpha_i+\delta_t+\beta^*BeerTax_{it}\] 對應的迴歸模型: \[mrall_{it}=\alpha_i+\delta_t+\beta_1 BeerTax_{it}+\epsilon_{it}\]
- 迴歸模型通常不寫常數項(\(\beta_0\)),常見固定效果寫法已包含了常數項。(在某些狀況為了方便說明,才會把\(\beta_0\)分離出來——有沒有寫\(\beta_0\)都可以。)
- 這裡因為常數項是隱含的,所以\(\epsilon_{it}\)的定義和之前一樣: \[\epsilon_{it}=mrall_{-BT,-W,-Z,it}-\mathbb{E}(mrall_{-BT,-W,-Z,it}|BT,W,Z)\]
5.8 認定問題
效應變數變動面向
假設每一州的啤酒稅在樣本期間都「不隨」時間改變,考慮以下的固定效果效應模型: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^* BeerTax_{i}\]使用組內差異最小平方法估計會有什麼問題?
LSDV虛擬變數個數
LSDV法下的迴歸模型: \[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\]
考慮這個迴歸模型: \[mrall_{it}=\beta_0+\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 它多了常數項,在OLS估計時會有什麼問題?
固定效果下的效應結構模型:
\[mrall_{it}=mrall_{-BT,-W,-Z,it}+\alpha_i+\delta_t+\beta^*BeerTax_{it}\]
對應的迴歸模型:
\[mrall_{it}=\alpha_i+\delta_t+\beta_1 BeerTax_{it}+\epsilon_{it}\]
(1) 使用組內差異最小平方法要如何demean去除固定效果?
(2) 使用LSDV估計,若使用以下的迴歸模型表示,它會有什麼問題?
\[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\sum_{j=1}^T \delta_jBj_{t}+ \beta_1 BeerTax_{it}+\epsilon_{it}\]
5.9 廣義的固定效果模型
接下來我們以固定效果只在identity(\(i\))及time(\(t\))面向固定來總結。
效應結構模型:
\[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\]
但 \[\begin{equation} mrall_{-BT,it}\not\perp BeerTax_{it} \tag{5.1} \end{equation}\]
複迴歸控制
先思考造成(5.1)的變數有哪些——統計上稱這些變數為混淆變數(confounder)。Confounder中有資料的(令為\(Z\))可進一步用來擴充模型成為:
\[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]
其中: \[mrall_{-BT,-Z}=mrall_{-BT}-\mathbb{E}(mrall_{-BT}|Z)\]
固定效果模型
Confounder中沒有資料但在某些面向固定的,假設分成以下兩類:
- \(W_i\):在同個identity下固定。
- \(V_t\):在同個time下固定。
則擴充效應模型成為:
\[\begin{eqnarray} mrall_{it}=mrall_{-BT,-(Z,W,V),it}+\beta^*BeerTax_{it}+\\ \alpha_i+\delta_t+\gamma'Z_{it} \tag{5.2} \end{eqnarray}\]
其中: \[mrall_{-BT,-(Z,W,V),it}=mrall_{-BT,it}-\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)\] 且假設- \(\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)=\alpha_i+\delta_t+\gamma'Z_{it}\)
- \(mrall_{-BT,-(Z,W,V),it}\perp BeerTax_{it}\)
(5.2)是相當廣義的固定效果效應模型——有兩個面向的固定效果及控制變數。
- (5.2)所對應的迴歸模型長怎麼樣?
- 使用組內差異最小平方法要如何估計?
- 使用LSDV最小平方法要如何估計?
5.10 異質變異
考慮如下的固定效果迴歸模型: \[mrall_{it}=\alpha_{i}+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\epsilon_{it}\] 令 \[\begin{eqnarray} \overrightarrow{\epsilon}_{i}=\left[\begin{array}{c} \epsilon_{i1}\\ \epsilon_{i2}\\ \vdots\\ \epsilon_{iT} \end{array}\right] \end{eqnarray}\]
\[\begin{eqnarray} \textbf{e}=\left[\begin{array}{c} \overrightarrow{\epsilon}_{1}\\ \overrightarrow{\epsilon}_{2}\\ \vdots\\ \vdots\\ \overrightarrow{\epsilon}_{N} \end{array}\right] \end{eqnarray}\]
\[\begin{eqnarray} \mathbb{E}(\textbf{ee}'|X)=\mathbb{E}\left[\begin{array}{ccccc} \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{2}'|X) & \cdots & \cdots & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{N}'|X)\\ \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{2}'|X) & & & \vdots\\ \vdots & & \ddots & & \vdots\\ \vdots & & & \ddots & \vdots\\ \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{2}'|X) & & & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{N}'|X) \end{array}\right] \end{eqnarray}\]
其中\(X\)代表資料訊息,這裡包含資料來自的\(i,t\)及\(BeerTax_{it},Z_{it}\)值。
\(\mathbb{E}(\textbf{ee}'|X)\)會長什麼樣?
5.11 隨機效果模型
回顧效應模型: \[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]隨機效果模型(Random Effect model)的設定:
使用迴歸模型:
\[\begin{eqnarray} mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} \tag{5.3} \end{eqnarray}\]- 假設\(\nu_{it}\)具有某種結構。
- 含常數項,\(\beta_0=\mathbb{E}(mrall_{-BT,-Z,it})\),所以
\[\nu_{it}=mrall_{-BT,-Z,it}-\mathbb{E}(mrall_{-BT,-Z,it})\]
我們可訊息拆解出\(\nu_{it}\)的固定效果項: \[\nu_{it}=\alpha_i+(\nu_{it}-\mathbb{E}(\nu_{it}|W_i))\] 其中\(\alpha_i=\mathbb{E}(\nu_{it}|W_i)\)
令\(\epsilon_{it}=v_{it}-\mathbb{E}(v_{it}|W_i)\),則:
\[\nu_{it}=\alpha_i+\epsilon_{it}\]
要有什麼假設才能保證(5.3)式迴歸模型\(\beta_1\)最小平方估計式為\(\beta^*\)的一致性估計式?
假設
- \(var(\alpha_i|X)=\sigma_{\alpha}^2\)
- \(var(\epsilon_{it}|X)=\sigma^2\)
- \(cov(\epsilon_{it},\epsilon_{is}|X)=0\)
令 \[\textbf{v}=\left[\begin{array}{c} \nu_{11}\\ \vdots\\ \nu_{1T}\\ \nu_{21}\\ \vdots\\ \nu_{2T}\\ \vdots\\ \nu_{NT} \end{array}\right]\]
請問\(\mathbb{E}(\textbf{vv}'|X)\)會長怎麼樣?
隨機效果模型與GLS
給定迴歸模型: \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\] 及其\(\mathbb{E}(\textbf{vv}'|X)=\Omega\)。
此迴歸模型的GLS估計要怎麼做?
隨機效果模型帶有高度誤差項假設,故不建議使用。
5.12 Hausman檢定
固定效果模型(FE)
表示使用組內差異最小平法方去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\alpha_i+\epsilon_{it}\]
隨機效果模型(RE)
表示使用GLS去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\]
- 其中\(\nu_{it}=\alpha_i+\epsilon_{it}\)
假設
- RE下「關於variance、covariance的假設」都成立。
- \(\epsilon_{it} \perp BeerTax_{it} | \alpha_i,Z_{it}\)
考慮以下的虛無假設
\(\textbf{H0}\): \(\alpha_i \perp BeerTax_{it} |Z_{it}\)
在虛無假設下,隨機效果模型(RE)與固定效果模型(FE)的估算方式,何者有一致性?