第 5 章 Panel

參考資料：

Principles of Econometrics with R, Constantin Colonescu: Chapter 15
Panel Data Econometrics in R: The plm Package, Yves Croissant and Giovanni Millo.

5.1 效應評估模型

提高啤酒稅（BeerTax）是否有助減低車禍死亡率（mrall）？

\[mrall=mrall_{-BeerTax}+\beta^*BeerTax\]

資料：美國56洲，1982-1988年資料

5.2 遺漏變數偏誤

每個州的飲酒文化不同，愛喝酒的州自然「車禍死亡率」高，如果愛喝酒的州的「啤酒稅」也高，那比較「啤酒稅」高低的州，其「死亡率」帶有比較「愛喝酒程度」高低的意含。

「州愛喝酒程度」並不會真的有這個變數，這時有以下解決方法：

找替代變數（即proxies）來當控制變數。
找工具變數保留BeerTax中不與\(mrall_{-BeerTax}\)相關的部份。
依遺漏變數變動面向特質，去除\(mrall_{-BeerTax}\)中受遺漏變數影響的部份。

5.3 訊息拆解

令\(W\)代表「州愛喝酒程度」。上面的論述表示：

\(W\)與\(mrall_{-BeerTax}\)有關
\(W\)與\(BeerTax\)有關

我們可使用\(W\)對\(mrall_{-BeerTax}\)進行訊息拆解。

拆解後的結果如何？

\[mrall_{-BT}=\mathbb{E}(mrall_{-BT}|W)+(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))\]

5.4 固定效果模型

透過訊息拆解我們可以把效應模型寫成：

\[mrall=(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))+\mathbb{E}(mrall_{-BT}|W) + \beta^*BeerTax \]

其中令 \[mrall_{-BT,-W}\equiv mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W)\] 故效應結構可以寫成： \[mrall=mrall_{-BT,-W}+\mathbb{E}(mrall_{-BT}|W)+\beta^*BeerTax\]

\[mrall_{-BT,-W}\] 為「去除」\(W\)影響的「非啤酒稅造成的車禍死亡因素」：

它與\(W\)無關。
若兩筆資料有相同飲酒文化，即\(W\)相同，他們的\(\mathbb{E}(mrall_{-BT}|W)\)會相同。

「假設」一個地方的飲酒文化「不隨時間改變」，即同一州在不同時點的\(W\)相同。

我們使用下標\(i\)代表第\(i\)個州，下標\(t\)代表第\(t\)期資料，令 \[\mathbb{E}(mrall_{-BT,it}|W_i)=\alpha_i\] 故我們的效應模型可以寫成： \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 其中\(\alpha_i\)為第\(i\)個州的固定效果：

只有下標\(i\)，因為資料若來自相同州，其內含的效果是固定相同的。

回顧：

我們由一開始的效應模型： \[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\] 擔心\(BeerTax\)與\(mrall_{-BT}\)有關，原因是\(W\)從中作祟。要對付它，我們把它從\(mrall_{-BT}\)分離出來，再加上對它認知，認為\(W\)在同一州內是固定值，故分離出來的部份可以寫成\(\alpha_i\)，也就是說： \[mrall_{-BT,it}=mrall_{-BT,-W,it}+\alpha_i\] 因此效應式可以寫成： \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 此時

\(BeerTax\)與\(mrall_{-BT,-W}\)無關
\(BeerTax\)與\(\alpha\)有關

\[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 這條效應迴歸式要能做估計使用只有當我們有\(\alpha_i\)資料可進行複迴歸估計時。實際上是，我們「沒有\(\alpha_i\)資料」但知道「\(\alpha_i\)在同一州內固定」。

5.5 差分最小平方法

考慮「同一州」，兩個時點t=0,1的效應式： \[\begin{align*} mrall_{i0} & =mrall_{-BT,-W,i0} +\alpha_i+ \beta^*BeerTax_{i0}\\ mrall_{i1} & =mrall_{-BT,-W,i1} +\alpha_i+ \beta^*BeerTax_{i1} \end{align*}\]

考慮如下的迴歸模型：

\[mrall_{i1}-mrall_{i0}=\beta_0+\beta_1 (BeerTax_{i1}-BearTax_{i0})+\epsilon_i\]

請問\(\epsilon\)代表什麼？又OLS下\(\hat{\beta}_1\)會是\(\beta^*\)的一致性估計嗎？

OLS的母體迴歸線代表 \[\begin{align*} \mathbb{E}(mrall_{i1}-mrall_{i0} & |BeerTax_{i1}-BeerTax_{i0}) =\\ & \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})\\ & +\beta^*(BeerTax_{i1}-BeerTax_{i0}) \end{align*}\] 其中\(mrall_{-BT,-W,it}\)與\(BeerTax_{it}\)已無關連，故 \[\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})=\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\] 因此 \[\begin{eqnarray} \beta_0 =\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\\ \beta_1 (BeerTax_{i1}-BeerTax_{i0}) =\beta^*(BeerTax_{i1}-BeerTax_{i0})\\ \epsilon_i = (mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})-\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}) \end{eqnarray}\]

回顧： \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 是無法用來估計效應的迴歸模型，阻礙來源是\(\alpha_i\)。差分在這裡拿掉了這層阻礙而得到 \[mrall_{i1}-mrall_{i0}=\beta^* (BeerTax_{i1}-BearTax_{i0})+(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\]

5.6 組內差異最小平方法

回顧我們的效應結構： \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\]

如果\(t\)超過兩期，考慮用組內平均為差分比較的點。

若\(x_1,x_2,...,x_n\)為同一群組資料，他們與組內平均的差分即代表各自組內差異，即\(x_1-\bar{x},x_2-\bar{x},...,x_n-\bar{x}\)其中\(\bar{x}=\sum_{i=1}^n x_i/n\)。

令 \[\bar{mrall}_i=\sum_{t=1}^T mrall_{it}/T \\ \bar{BeerTax}_i=\sum_{t=1}^T BeerTax_{it}/T\\ \bar{mrall}_{-BT,-W,i}=\sum_{t=1}^T mrall_{-BT,-W,it}/T\]

則

\[mrall_{it}-\bar{mrall}_i=\beta^*\left( BeerTax_{it}-\bar{BeerTax}_i\right)+(mrall_{-BT,-W,it}-\bar{mrall}_{-BT,-W,i})\]

固定效果模型下，我們可以以最小平方法估計下面的迴歸式： \[mrall_{it}-\bar{mrall}_i=\beta_0+\beta_1\left( BeerTax_{it}-\bar{BeerTax}_i\right)+\epsilon_{it}\] 其中\(\hat{\beta}_1\)即為\(\beta^*\)的一致性估計

另外，在數學上我們可以證明組內差異最小平方法，和以下使用虛擬變數為複迴歸控制變數的\(\hat{\beta}_1\)相同： \[mrall_{it}=\sum_{k=1}^N \alpha_i Dk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 其中虛擬變數\(Dk=1\)若資料來自第\(k\)個州，故組內差異最小平方估計又稱為虛擬變數最小平方估計(Least Square Dummy Variable estimation, LSDV)。

5.7 常見的固定效果模型

固定效果泛指效應殘差效果（即這裡的\(mrall_{-BT,it}\)）可以再進一步分離出「在一群資料中固定不變」的部份（即這裡的\(\alpha_i=\mathbb{E}(mrall_{-BT,it}|W_i)\)），我們使用下標來呈現固定效果的固定不變面向（即這裡的\(\alpha_i\)）。

在追踪資料中，常見的固定效果面向有以下兩個面向：

Identity fixed effect: \(\alpha_i\)
Time fixed effect: \(\delta_t\)

如： \[mrall_{-BT,it}=mrall_{-BT,-W_i,-Z_t}+\alpha_i+\delta_t\] 其中

\(W_i\)為造成效應係數估計偏誤的變數，它在\(i\)面向固定不變。
\(Z_t\)為造成效應係數估計偏誤的變數，它在\(t\)面向固定不變。

範例：\(Z_t\)為全美國的景氣狀況。

迴歸模型忽略「全美國景氣狀況」會造成效應係數估計偏誤的經濟故事是什麼？

迴歸模型通常不寫常數項(\(\beta_0\))，常見固定效果寫法已包含了常數項。（在某些狀況為了方便說明，才會把\(\beta_0\)分離出來——有沒有寫\(\beta_0\)都可以。）
這裡因為常數項是隱含的，所以\(\epsilon_{it}\)的定義和之前一樣： \[\epsilon_{it}=mrall_{-BT,-W,-Z,it}-\mathbb{E}(mrall_{-BT,-W,-Z,it}|BT,W,Z)\]

5.8 認定問題

效應變數變動面向

假設每一州的啤酒稅在樣本期間都「不隨」時間改變，考慮以下的固定效果效應模型： \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^* BeerTax_{i}\]

使用組內差異最小平方法估計會有什麼問題？

LSDV虛擬變數個數

LSDV法下的迴歸模型： \[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\]

考慮這個迴歸模型： \[mrall_{it}=\beta_0+\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 它多了常數項，在OLS估計時會有什麼問題？

固定效果下的效應結構模型： \[mrall_{it}=mrall_{-BT,-W,-Z,it}+\alpha_i+\delta_t+\beta^*BeerTax_{it}\] 對應的迴歸模型： \[mrall_{it}=\alpha_i+\delta_t+\beta_1 BeerTax_{it}+\epsilon_{it}\] (1) 使用組內差異最小平方法要如何demean去除固定效果？
(2) 使用LSDV估計，若使用以下的迴歸模型表示，它會有什麼問題？ \[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\sum_{j=1}^T \delta_jBj_{t}+ \beta_1 BeerTax_{it}+\epsilon_{it}\]

5.9 廣義的固定效果模型

接下來我們以固定效果只在identity(\(i\))及time(\(t\))面向固定來總結。

效應結構模型：

\[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\]

但 \[\begin{equation} mrall_{-BT,it}\not\perp BeerTax_{it} \tag{5.1} \end{equation}\]

複迴歸控制

先思考造成(5.1)的變數有哪些——統計上稱這些變數為混淆變數(confounder)。Confounder中有資料的（令為\(Z\)）可進一步用來擴充模型成為：

\[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]

其中： \[mrall_{-BT,-Z}=mrall_{-BT}-\mathbb{E}(mrall_{-BT}|Z)\]

固定效果模型

Confounder中沒有資料但在某些面向固定的，假設分成以下兩類：

\(W_i\)：在同個identity下固定。
\(V_t\)：在同個time下固定。

則擴充效應模型成為：

\[\begin{eqnarray} mrall_{it}=mrall_{-BT,-(Z,W,V),it}+\beta^*BeerTax_{it}+\\ \alpha_i+\delta_t+\gamma'Z_{it} \tag{5.2} \end{eqnarray}\]

其中： \[mrall_{-BT,-(Z,W,V),it}=mrall_{-BT,it}-\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)\] 且假設

\(\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)=\alpha_i+\delta_t+\gamma'Z_{it}\)
\(mrall_{-BT,-(Z,W,V),it}\perp BeerTax_{it}\)

(5.2)是相當廣義的固定效果效應模型——有兩個面向的固定效果及控制變數。

(5.2)所對應的迴歸模型長怎麼樣？
使用組內差異最小平方法要如何估計？
使用LSDV最小平方法要如何估計？

5.10 異質變異

考慮如下的固定效果迴歸模型： \[mrall_{it}=\alpha_{i}+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\epsilon_{it}\] 令 \[\begin{eqnarray} \overrightarrow{\epsilon}_{i}=\left[\begin{array}{c} \epsilon_{i1}\\ \epsilon_{i2}\\ \vdots\\ \epsilon_{iT} \end{array}\right] \end{eqnarray}\]

\[\begin{eqnarray} \textbf{e}=\left[\begin{array}{c} \overrightarrow{\epsilon}_{1}\\ \overrightarrow{\epsilon}_{2}\\ \vdots\\ \vdots\\ \overrightarrow{\epsilon}_{N} \end{array}\right] \end{eqnarray}\]

\[\begin{eqnarray} \mathbb{E}(\textbf{ee}'|X)=\mathbb{E}\left[\begin{array}{ccccc} \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{2}'|X) & \cdots & \cdots & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{N}'|X)\\ \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{2}'|X) & & & \vdots\\ \vdots & & \ddots & & \vdots\\ \vdots & & & \ddots & \vdots\\ \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{2}'|X) & & & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{N}'|X) \end{array}\right] \end{eqnarray}\]

其中\(X\)代表資料訊息，這裡包含資料來自的\(i,t\)及\(BeerTax_{it},Z_{it}\)值。

\(\mathbb{E}(\textbf{ee}'|X)\)會長什麼樣？

5.11 隨機效果模型

回顧效應模型： \[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]

隨機效果模型(Random Effect model)的設定：

使用迴歸模型：
\[\begin{eqnarray} mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} \tag{5.3} \end{eqnarray}\]
假設\(\nu_{it}\)具有某種結構。

含常數項，\(\beta_0=\mathbb{E}(mrall_{-BT,-Z,it})\)，所以 \[\nu_{it}=mrall_{-BT,-Z,it}-\mathbb{E}(mrall_{-BT,-Z,it})\]
我們可訊息拆解出\(\nu_{it}\)的固定效果項： \[\nu_{it}=\alpha_i+(\nu_{it}-\mathbb{E}(\nu_{it}|W_i))\] 其中\(\alpha_i=\mathbb{E}(\nu_{it}|W_i)\)
令\(\epsilon_{it}=v_{it}-\mathbb{E}(v_{it}|W_i)\)，則：
\[\nu_{it}=\alpha_i+\epsilon_{it}\]

要有什麼假設才能保證(5.3)式迴歸模型\(\beta_1\)最小平方估計式為\(\beta^*\)的一致性估計式？

假設

\(var(\alpha_i|X)=\sigma_{\alpha}^2\)
\(var(\epsilon_{it}|X)=\sigma^2\)
\(cov(\epsilon_{it},\epsilon_{is}|X)=0\)

令 \[\textbf{v}=\left[\begin{array}{c} \nu_{11}\\ \vdots\\ \nu_{1T}\\ \nu_{21}\\ \vdots\\ \nu_{2T}\\ \vdots\\ \nu_{NT} \end{array}\right]\]

請問\(\mathbb{E}(\textbf{vv}'|X)\)會長怎麼樣？

隨機效果模型與GLS

給定迴歸模型： \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\] 及其\(\mathbb{E}(\textbf{vv}'|X)=\Omega\)。

此迴歸模型的GLS估計要怎麼做？

隨機效果模型帶有高度誤差項假設，故不建議使用。

5.12 Hausman檢定

固定效果模型(FE)

表示使用組內差異最小平法方去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\alpha_i+\epsilon_{it}\]

隨機效果模型(RE)

表示使用GLS去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\]

其中\(\nu_{it}=\alpha_i+\epsilon_{it}\)

假設

RE下「關於variance、covariance的假設」都成立。
\(\epsilon_{it} \perp BeerTax_{it} | \alpha_i,Z_{it}\)

考慮以下的虛無假設

\(\textbf{H0}\): \(\alpha_i \perp BeerTax_{it} |Z_{it}\)

在虛無假設下，隨機效果模型（RE）與固定效果模型（FE）的估算方式，何者有一致性？