第 5 章 Panel

參考資料:

  • Principles of Econometrics with R, Constantin Colonescu: Chapter 15

  • Panel Data Econometrics in R: The plm Package, Yves Croissant and Giovanni Millo.

5.1 效應評估模型

提高啤酒稅(BeerTax)是否有助減低車禍死亡率(mrall)?

\[mrall=mrall_{-BeerTax}+\beta^*BeerTax\]

資料:美國56洲,1982-1988年資料

5.2 遺漏變數偏誤

每個州的飲酒文化不同,愛喝酒的州自然「車禍死亡率」高,如果愛喝酒的州的「啤酒稅」也高,那比較「啤酒稅」高低的州,其「死亡率」帶有比較「愛喝酒程度」高低的意含。

「州愛喝酒程度」並不會真的有這個變數,這時有以下解決方法:

  • 找替代變數(即proxies)來當控制變數。

  • 找工具變數保留BeerTax中不與\(mrall_{-BeerTax}\)相關的部份。

  • 依遺漏變數變動面向特質,去除\(mrall_{-BeerTax}\)中受遺漏變數影響的部份。

5.3 訊息拆解

\(W\)代表「州愛喝酒程度」。上面的論述表示:

  • \(W\)\(mrall_{-BeerTax}\)有關

  • \(W\)\(BeerTax\)有關

我們可使用\(W\)\(mrall_{-BeerTax}\)進行訊息拆解。

拆解後的結果如何?

\[mrall_{-BT}=\mathbb{E}(mrall_{-BT}|W)+(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))\]

5.4 固定效果模型

透過訊息拆解我們可以把效應模型寫成:

\[mrall=(mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W))+\mathbb{E}(mrall_{-BT}|W) + \beta^*BeerTax \]

其中令 \[mrall_{-BT,-W}\equiv mrall_{-BT}-\mathbb{E}(mrall_{-BT}|W)\] 故效應結構可以寫成: \[mrall=mrall_{-BT,-W}+\mathbb{E}(mrall_{-BT}|W)+\beta^*BeerTax\]

\[mrall_{-BT,-W}\] 為「去除」\(W\)影響的「非啤酒稅造成的車禍死亡因素」:

  • 它與\(W\)無關。

  • 若兩筆資料有相同飲酒文化,即\(W\)相同,他們的\(\mathbb{E}(mrall_{-BT}|W)\)會相同。

「假設」一個地方的飲酒文化「不隨時間改變」,即同一州在不同時點的\(W\)相同。


我們使用下標\(i\)代表第\(i\)個州,下標\(t\)代表第\(t\)期資料,令 \[\mathbb{E}(mrall_{-BT,it}|W_i)=\alpha_i\] 故我們的效應模型可以寫成: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 其中\(\alpha_i\)為第\(i\)個州的固定效果:

  • 只有下標\(i\),因為資料若來自相同州,其內含的效果是固定相同的。

回顧:

我們由一開始的效應模型: \[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\] 擔心\(BeerTax\)\(mrall_{-BT}\)有關,原因是\(W\)從中作祟。要對付它,我們把它從\(mrall_{-BT}\)分離出來,再加上對它認知,認為\(W\)在同一州內是固定值,故分離出來的部份可以寫成\(\alpha_i\),也就是說: \[mrall_{-BT,it}=mrall_{-BT,-W,it}+\alpha_i\] 因此效應式可以寫成: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 此時

  • \(BeerTax\)\(mrall_{-BT,-W}\)無關
  • \(BeerTax\)\(\alpha\)有關

\[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 這條效應迴歸式要能做估計使用只有當我們有\(\alpha_i\)資料可進行複迴歸估計時。實際上是,我們「沒有\(\alpha_i\)資料」但知道「\(\alpha_i\)在同一州內固定」。

5.5 差分最小平方法

考慮「同一州」,兩個時點t=0,1的效應式: \[\begin{align*} mrall_{i0} & =mrall_{-BT,-W,i0} +\alpha_i+ \beta^*BeerTax_{i0}\\ mrall_{i1} & =mrall_{-BT,-W,i1} +\alpha_i+ \beta^*BeerTax_{i1} \end{align*}\]

考慮如下的迴歸模型:

\[mrall_{i1}-mrall_{i0}=\beta_0+\beta_1 (BeerTax_{i1}-BearTax_{i0})+\epsilon_i\]

請問\(\epsilon\)代表什麼?又OLS下\(\hat{\beta}_1\)會是\(\beta^*\)的一致性估計嗎?

OLS的母體迴歸線代表 \[\begin{align*} \mathbb{E}(mrall_{i1}-mrall_{i0} & |BeerTax_{i1}-BeerTax_{i0}) =\\ & \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})\\ & +\beta^*(BeerTax_{i1}-BeerTax_{i0}) \end{align*}\] 其中\(mrall_{-BT,-W,it}\)\(BeerTax_{it}\)已無關連,故 \[\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}|BeerTax_{i1}-BeerTax_{i0})=\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\] 因此 \[\begin{eqnarray} \beta_0 =\mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\\ \beta_1 (BeerTax_{i1}-BeerTax_{i0}) =\beta^*(BeerTax_{i1}-BeerTax_{i0})\\ \epsilon_i = (mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})-\\ \mathbb{E}(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0}) \end{eqnarray}\]


回顧: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\] 是無法用來估計效應的迴歸模型,阻礙來源是\(\alpha_i\)。差分在這裡拿掉了這層阻礙而得到 \[mrall_{i1}-mrall_{i0}=\beta^* (BeerTax_{i1}-BearTax_{i0})+(mrall_{-BT,-W,i1}-mrall_{-BT,-W,i0})\]

5.6 組內差異最小平方法

回顧我們的效應結構: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^*BeerTax_{it}\]

如果\(t\)超過兩期,考慮用組內平均為差分比較的點。

\(x_1,x_2,...,x_n\)為同一群組資料,他們與組內平均的差分即代表各自組內差異,即\(x_1-\bar{x},x_2-\bar{x},...,x_n-\bar{x}\)其中\(\bar{x}=\sum_{i=1}^n x_i/n\)

\[\bar{mrall}_i=\sum_{t=1}^T mrall_{it}/T \\ \bar{BeerTax}_i=\sum_{t=1}^T BeerTax_{it}/T\\ \bar{mrall}_{-BT,-W,i}=\sum_{t=1}^T mrall_{-BT,-W,it}/T\]

\[mrall_{it}-\bar{mrall}_i=\beta^*\left( BeerTax_{it}-\bar{BeerTax}_i\right)+(mrall_{-BT,-W,it}-\bar{mrall}_{-BT,-W,i})\]

固定效果模型下,我們可以以最小平方法估計下面的迴歸式: \[mrall_{it}-\bar{mrall}_i=\beta_0+\beta_1\left( BeerTax_{it}-\bar{BeerTax}_i\right)+\epsilon_{it}\] 其中\(\hat{\beta}_1\)即為\(\beta^*\)的一致性估計

另外,在數學上我們可以證明組內差異最小平方法,和以下使用虛擬變數為複迴歸控制變數的\(\hat{\beta}_1\)相同: \[mrall_{it}=\sum_{k=1}^N \alpha_i Dk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 其中虛擬變數\(Dk=1\)若資料來自第\(k\)個州,故組內差異最小平方估計又稱為虛擬變數最小平方估計(Least Square Dummy Variable estimation, LSDV)。

5.7 常見的固定效果模型

固定效果泛指效應殘差效果(即這裡的\(mrall_{-BT,it}\))可以再進一步分離出「在一群資料中固定不變」的部份(即這裡的\(\alpha_i=\mathbb{E}(mrall_{-BT,it}|W_i)\)),我們使用下標來呈現固定效果的固定不變面向(即這裡的\(\alpha_i\))。

在追踪資料中,常見的固定效果面向有以下兩個面向:

  • Identity fixed effect: \(\alpha_i\)

  • Time fixed effect: \(\delta_t\)

如: \[mrall_{-BT,it}=mrall_{-BT,-W_i,-Z_t}+\alpha_i+\delta_t\] 其中

  • \(W_i\)為造成效應係數估計偏誤的變數,它在\(i\)面向固定不變。

  • \(Z_t\)為造成效應係數估計偏誤的變數,它在\(t\)面向固定不變。

範例:\(Z_t\)為全美國的景氣狀況。

迴歸模型忽略「全美國景氣狀況」會造成效應係數估計偏誤的經濟故事是什麼?

固定效果下的效應結構模型: \[mrall_{it}=mrall_{-BT,-W,-Z,it}+\alpha_i+\delta_t+\beta^*BeerTax_{it}\] 對應的迴歸模型: \[mrall_{it}=\alpha_i+\delta_t+\beta_1 BeerTax_{it}+\epsilon_{it}\]

  • 迴歸模型通常不寫常數項(\(\beta_0\)),常見固定效果寫法已包含了常數項。(在某些狀況為了方便說明,才會把\(\beta_0\)分離出來——有沒有寫\(\beta_0\)都可以。)
  • 這裡因為常數項是隱含的,所以\(\epsilon_{it}\)的定義和之前一樣: \[\epsilon_{it}=mrall_{-BT,-W,-Z,it}-\mathbb{E}(mrall_{-BT,-W,-Z,it}|BT,W,Z)\]

5.8 認定問題

效應變數變動面向

假設每一州的啤酒稅在樣本期間都「不隨」時間改變,考慮以下的固定效果效應模型: \[mrall_{it}=mrall_{-BT,-W,it}+\alpha_i+\beta^* BeerTax_{i}\]

使用組內差異最小平方法估計會有什麼問題?

LSDV虛擬變數個數

LSDV法下的迴歸模型: \[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\]

考慮這個迴歸模型: \[mrall_{it}=\beta_0+\sum_{k=1}^N\alpha_kDk_i+\beta_1 BeerTax_{it}+\epsilon_{it}\] 它多了常數項,在OLS估計時會有什麼問題?


固定效果下的效應結構模型: \[mrall_{it}=mrall_{-BT,-W,-Z,it}+\alpha_i+\delta_t+\beta^*BeerTax_{it}\] 對應的迴歸模型: \[mrall_{it}=\alpha_i+\delta_t+\beta_1 BeerTax_{it}+\epsilon_{it}\] (1) 使用組內差異最小平方法要如何demean去除固定效果?
(2) 使用LSDV估計,若使用以下的迴歸模型表示,它會有什麼問題? \[mrall_{it}=\sum_{k=1}^N\alpha_kDk_i+\sum_{j=1}^T \delta_jBj_{t}+ \beta_1 BeerTax_{it}+\epsilon_{it}\]

5.9 廣義的固定效果模型

接下來我們以固定效果只在identity(\(i\))及time(\(t\))面向固定來總結。

效應結構模型:

\[mrall_{it}=mrall_{-BT,it}+\beta^*BeerTax_{it}\]

\[\begin{equation} mrall_{-BT,it}\not\perp BeerTax_{it} \tag{5.1} \end{equation}\]

複迴歸控制

先思考造成(5.1)的變數有哪些——統計上稱這些變數為混淆變數(confounder)。Confounder中有資料的(令為\(Z\))可進一步用來擴充模型成為:

\[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]

其中: \[mrall_{-BT,-Z}=mrall_{-BT}-\mathbb{E}(mrall_{-BT}|Z)\]

固定效果模型

Confounder中沒有資料但在某些面向固定的,假設分成以下兩類:

  • \(W_i\):在同個identity下固定。
  • \(V_t\):在同個time下固定。

則擴充效應模型成為:

\[\begin{eqnarray} mrall_{it}=mrall_{-BT,-(Z,W,V),it}+\beta^*BeerTax_{it}+\\ \alpha_i+\delta_t+\gamma'Z_{it} \tag{5.2} \end{eqnarray}\]

其中: \[mrall_{-BT,-(Z,W,V),it}=mrall_{-BT,it}-\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)\] 且假設
  • \(\mathbb{E}(mrall_{-BT,it}|Z_{it},W_i,V_t)=\alpha_i+\delta_t+\gamma'Z_{it}\)
  • \(mrall_{-BT,-(Z,W,V),it}\perp BeerTax_{it}\)

(5.2)是相當廣義的固定效果效應模型——有兩個面向的固定效果及控制變數。

  1. (5.2)所對應的迴歸模型長怎麼樣?
  2. 使用組內差異最小平方法要如何估計?
  3. 使用LSDV最小平方法要如何估計?

5.10 異質變異

考慮如下的固定效果迴歸模型: \[mrall_{it}=\alpha_{i}+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\epsilon_{it}\]\[\begin{eqnarray} \overrightarrow{\epsilon}_{i}=\left[\begin{array}{c} \epsilon_{i1}\\ \epsilon_{i2}\\ \vdots\\ \epsilon_{iT} \end{array}\right] \end{eqnarray}\]

\[\begin{eqnarray} \textbf{e}=\left[\begin{array}{c} \overrightarrow{\epsilon}_{1}\\ \overrightarrow{\epsilon}_{2}\\ \vdots\\ \vdots\\ \overrightarrow{\epsilon}_{N} \end{array}\right] \end{eqnarray}\]

\[\begin{eqnarray} \mathbb{E}(\textbf{ee}'|X)=\mathbb{E}\left[\begin{array}{ccccc} \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{2}'|X) & \cdots & \cdots & \mathbb{E}(\overrightarrow{\epsilon}_{1}\overrightarrow{\epsilon}_{N}'|X)\\ \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{2}\overrightarrow{\epsilon}_{2}'|X) & & & \vdots\\ \vdots & & \ddots & & \vdots\\ \vdots & & & \ddots & \vdots\\ \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{1}'|X) & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{2}'|X) & & & \mathbb{E}(\overrightarrow{\epsilon}_{N}\overrightarrow{\epsilon}_{N}'|X) \end{array}\right] \end{eqnarray}\]

其中\(X\)代表資料訊息,這裡包含資料來自的\(i,t\)\(BeerTax_{it},Z_{it}\)值。

\(\mathbb{E}(\textbf{ee}'|X)\)會長什麼樣?

5.11 隨機效果模型

回顧效應模型: \[mrall_{it}=mrall_{-BT,-Z,it}+\beta^*BeerTax_{it}+\gamma'Z_{it}\]

隨機效果模型(Random Effect model)的設定:

  • 使用迴歸模型:
    \[\begin{eqnarray} mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it} \tag{5.3} \end{eqnarray}\]

  • 假設\(\nu_{it}\)具有某種結構。
  • 含常數項,\(\beta_0=\mathbb{E}(mrall_{-BT,-Z,it})\),所以 \[\nu_{it}=mrall_{-BT,-Z,it}-\mathbb{E}(mrall_{-BT,-Z,it})\]
  • 我們可訊息拆解出\(\nu_{it}\)的固定效果項: \[\nu_{it}=\alpha_i+(\nu_{it}-\mathbb{E}(\nu_{it}|W_i))\] 其中\(\alpha_i=\mathbb{E}(\nu_{it}|W_i)\)

  • \(\epsilon_{it}=v_{it}-\mathbb{E}(v_{it}|W_i)\),則:
    \[\nu_{it}=\alpha_i+\epsilon_{it}\]


要有什麼假設才能保證(5.3)式迴歸模型\(\beta_1\)最小平方估計式為\(\beta^*\)的一致性估計式?


假設

  • \(var(\alpha_i|X)=\sigma_{\alpha}^2\)
  • \(var(\epsilon_{it}|X)=\sigma^2\)
  • \(cov(\epsilon_{it},\epsilon_{is}|X)=0\)

\[\textbf{v}=\left[\begin{array}{c} \nu_{11}\\ \vdots\\ \nu_{1T}\\ \nu_{21}\\ \vdots\\ \nu_{2T}\\ \vdots\\ \nu_{NT} \end{array}\right]\]

請問\(\mathbb{E}(\textbf{vv}'|X)\)會長怎麼樣?


隨機效果模型與GLS

給定迴歸模型: \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\] 及其\(\mathbb{E}(\textbf{vv}'|X)=\Omega\)

此迴歸模型的GLS估計要怎麼做?


隨機效果模型帶有高度誤差項假設,故不建議使用。

5.12 Hausman檢定

固定效果模型(FE)

表示使用組內差異最小平法方去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\alpha_i+\epsilon_{it}\]

隨機效果模型(RE)

表示使用GLS去估算以下迴歸模型中的\(\beta_1\): \[mrall_{it}=\beta_0+\beta_{1}BeerTax_{it}+\gamma'Z_{it}+\nu_{it}\]

  • 其中\(\nu_{it}=\alpha_i+\epsilon_{it}\)

假設

  • RE下「關於variance、covariance的假設」都成立。
  • \(\epsilon_{it} \perp BeerTax_{it} | \alpha_i,Z_{it}\)

考慮以下的虛無假設

\(\textbf{H0}\): \(\alpha_i \perp BeerTax_{it} |Z_{it}\)

在虛無假設下,隨機效果模型(RE)與固定效果模型(FE)的估算方式,何者有一致性?