10 Modelos espaciales de datos de panel

Tomado de Millo, Piras, and others (2012).

Librerías usadas

  • rgdal
  • spdep
  • ggplot2
  • splm

Los modelos de datos de panel espacial capturan interacciones espaciales entre unidades espaciales y a lo largo del tiempo. Los primeros se consideran estáticos y los segundos como dinámicos. Partimos de un modelo de panel estático general que incluye un rezago espacial de la variable dependiente y perturbaciones espaciales autorregresivas:

\[ y = \lambda (I_T\otimes W_N)y + X\beta+u \tag{10.1} \] donde \(y\) es un vector de \(NT\times 1\) observaciones, \(X\) es una matriz de \(NT\times k\) observaciones de las covariables, \(I_T\) es una matriz identidada de dimensión \(T\), \(W_N\) es la matriz conocida de pesos espaciales \(N\times N\) cuya diagonal es igual a cero, y \(\lambda\) es el parámetro espacial. El término de error es la suma de dos términos:

\[ u = (\iota_T\otimes I_N)\mu+\varepsilon \tag{10.2} \]

donde \(\iota_T\) es un vector de unos de dimensión \(T\times 1\), \(I_N\) una matriz identidad \(N\times N\), \(\mu\) es un vector de efectos inidividuales específicos constantes (no espacialmente correlacionados), y \(\varepsilon\) es un vector de innovaciones con autocorrelación espacial que siguen un proceso espacial autorregresivo de la forma:

\[ \varepsilon = \rho (I_T\otimes W_N)\varepsilon+\nu \tag{10.3} \] con \(\rho(|rho|<1)\) como el parámtros de autorregresivo espacial, \(W_N\) es la matriz de pesos espaciales, \(\nu_{it}\sim IID(0,\sigma_\nu^2)\) y \(\varepsilon_{it} \sim IID(0,\sigma_\varepsilon^2)\).

Como en la literatura clásica sobre datos de panel, los efectos individuales pueden tratarse como fijos o aleatorios. En un modelo de efectos aleatorios, se asume implícitamente que los efectos individuales no observados no están correlacionados con las otras variables explicativas del modelo. En este caso, \(\mu_i \sim IID(0,\sigma_\mu^2)\) y el término de error se pueden reescribir como:

\[ \varepsilon = (I_T\otimes B_N^{-1})\nu \tag{10.4} \] donde \(B_N = (I_N-\rho W_N)\). Como consecuencia, el término de error ahora es:

\[ u = (\iota_T\otimes I_N)\mu+(I_T\otimes B_N^{-1})\nu \tag{10.5} \] y la matriz de varianza-covarianza para \(\varepsilon\) es

\[ \Omega_u = \sigma_\mu^2(\iota_T\iota_T^{\intercal}\otimes I_N) + \sigma_\nu^2[I_T\otimes (B_N^TB_N)^{-1}] \tag{10.6} \] Al derivar varias pruebas de multiplicador de Lagrange (LM), Baltagi, Song, and Koh (2003) consideran un modelo de regresión de datos de panel que es un caso especial del modelo presentado anteriormente en el sentido de que no incluye un rezago espacial de la variable dependiente.

En J. P. Elhorst (2003) y J. Elhorst (2009) se define una taxonomía para los modelos de datos de panel espacial tanto bajo los supuestos de efectos fijos como aleatorios. Siguiendo la distinción típica hecha en los modelos transversales, Elhorst define las versiones de datos de panel de efectos fijos y aleatorios de los modelos de error espacial y retardo espacial. Sin embargo, no considera un modelo que incluya tanto el rezago espacial de la variable dependiente como un término de error autocorrelacionado espacialmente. Por lo tanto, los modelos revisados en Elhorst también pueden verse como un caso especial de esta especificación más general.

Una segunda especificación para las perturbaciones se considera en Kapoor, Kelejian, and Prucha (2007). Asumen que la correlación espacial se aplica tanto a los efectos individuales como a los componentes de error restantes. Aunque los dos procesos de generación de datos parecen similares, implican diferentes mecanismos espaciales de spillover regidos por una estructura diferente de la matriz de covarianza de varianza implícita. En este caso, el término de perturbación sigue un proceso autorregresivo espacial de primer orden de la forma:

\[ u = \rho(I_T\otimes W_N)u+\varepsilon \tag{10.7} \] donde \(W_N\) es la matriz de pesos espaciales y \(\rho\) es el correspondiente parámetro de pesos espaciales autorregresivo. Para permitir que las innovaciones estén correlacionadas en el tiempo, el vector de innovaciones de la ecuación (10.7) sigue una estructura de error:

\[ \varepsilon = (\iota_T\otimes I_N)\mu+\nu \tag{10.8} \] donde \(\mu\) es el vector de efectos transversales (cross-sectional), \(\nu\) es un vector de innovaciones que varían en ambos: unidades transversales y en periodos de tiempo, \(\iota_T\) es un vector de unos y \(I_N\) una matriz identidad \(N\times N\).

Al derivar una prueba de Hausman para un modelo de datos de panel espacial de Cliff y Ord, Mutl and Pfaffermayr (2011) consideran el modelo presentado anteriormente y discuten la estimación de variables instrumentales bajo las especificaciones de efectos fijos y aleatorios.

Bajo el supuesto de efectos aleatorios de que los efectos individuales son independientes de los regresores del modelo, se puede reescribir la Ecuación (10.7) como

\[ u = [I_T\otimes (I_N-\rho W_N)^{-1}]\varepsilon \tag{10.9} \] se tiene que la matriz de varianza-covarianza de \(u\) es

\[ \Omega_u =[I_T\otimes (I_N-\rho W_N)^{-1}]\Omega_\varepsilon[I_T\otimes (I_N-\rho W_N^{\intercal})^{-1}] \tag{10.10} \] donde \(\Omega_\varepsilon=\sigma_\nu^2Q_0+\sigma_1^2Q_1\), con \(\sigma_1^2=\sigma_\nu^2+T\sigma_\mu^2\), \(Q_0=\left(I_T-\frac{J_T}{T} \right)\otimes I_N\), \(Q_1 = \frac{J_T}{T}\otimes I_N\) y \(J_T=\iota\iota_T^{\intercal}\), es la matriz de varianza-covarianza típica de un modelo de componente de error unidireccional adaptado a un orden diferente de los datos.

A partir de la discusión anterior, estos dos modelos de panel difieren en términos de sus matrices de varianza. La matriz de varianza de la Ecuación (10.6) es más complicada que la de la Ecuación (10.10) y, por lo tanto, su inversa es más difícil de calcular.

Para la primera especificación, splm implementa la estimación de máxima verosimilitud de los modelos de efectos fijos y aleatorios.

Para la segunda especificación (más simple), splm implementa la estimación de variables instrumentales y de máxima verosimilitud bajo el supuesto de efectos aleatorios y fijos, su especificación del error se estima mediante momentos generalizados.

10.1 Máxima verosimilitud

Nuestra variable dependiente es el MSF, tomado de Guachamin (2020).

Composition of MSF vulnerability index

Figure 10.1: Composition of MSF vulnerability index

library(splm)
uu0 <- "https://github.com/vmoprojs/DataLectures/raw/master/W1.dta"
WEC <- as.matrix(haven::read_dta(uu0))
uu <- "https://github.com/vmoprojs/DataLectures/raw/master/latam_splm.csv"
datos <- data.frame(read.csv(uu,sep = ";"))

El modelo completo que se explora se presenta a continuación:

\[ y = \lambda (I_T\otimes W_N)y + X\beta+\underbrace{(\iota_T\otimes I_N)\mu+\underbrace{\rho (I_T\otimes W_N)\varepsilon+\nu}_{\varepsilon}}_{u} \]

10.1.1 Modelo de efectos aleatorios

fm <- "LnMSF~ LnEconomicGlobalization + LnTradeBalance +  LnSocialGlobalization + CurrentaccountbalanceofGDP_L1 + GDPperCapita_1 +   LnRealEffectiveExchange + LnExternalDebt_1 +  LnGINI + TB1YR_1 + DummyOutputgapChina"

sararremod <- spml(formula = formula(fm), data = datos, index = NULL, listw = WEC, model = "random", lag = TRUE, spatial.error = "b")

summary(sararremod)
## ML panel with spatial lag, random effects, spatial error correlation 
## 
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw), 
##     w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
## 
## Residuals:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -0.548   0.525   0.887   0.836   1.179   2.255 
## 
## Error variance parameters:
##      Estimate Std. Error t-value Pr(>|t|)  
## phi  0.477548   0.241536  1.9771  0.04803 *
## rho -0.020606   0.042511 -0.4847  0.62788  
## 
## Spatial autoregressive coefficient:
##        Estimate Std. Error t-value  Pr(>|t|)    
## lambda 0.082771   0.016426  5.0389 4.682e-07 ***
## 
## Coefficients:
##                                  Estimate  Std. Error t-value  Pr(>|t|)    
## (Intercept)                    0.00052218  1.14597240  0.0005 0.9996364    
## LnEconomicGlobalization       -0.75587520  0.15572026 -4.8541 1.210e-06 ***
## LnTradeBalance                -0.51811866  0.10368617 -4.9970 5.823e-07 ***
## LnSocialGlobalization          0.28782777  0.13513510  2.1299 0.0331777 *  
## CurrentaccountbalanceofGDP_L1  0.02033891  0.00564672  3.6019 0.0003159 ***
## GDPperCapita_1                 0.31528016  0.09029049  3.4918 0.0004797 ***
## LnRealEffectiveExchange       -0.14486652  0.08385969 -1.7275 0.0840802 .  
## LnExternalDebt_1               0.43908841  0.14586881  3.0102 0.0026111 ** 
## LnGINI                         1.39371731  0.27219971  5.1202 3.052e-07 ***
## TB1YR_1                       -0.03987526  0.01385053 -2.8790 0.0039898 ** 
## DummyOutputgapChina            0.07820235  0.03827443  2.0432 0.0410326 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

se obtiene el modelo

\[ y = \lambda (I_T\otimes W_N)y + X\beta+\underbrace{(\iota_T\otimes I_N)\mu+\underbrace{\rho (I_T\otimes W_N)\varepsilon+\nu}_{\varepsilon}}_{u} \]

\[ y = 0.082771 (I_T\otimes W_N)y + X\beta+(\iota_T\otimes I_N)\mu-0.020606 (I_T\otimes W_N)\varepsilon+\nu \] \[ \phi = \frac{\sigma_\mu^2}{\sigma_\varepsilon^2} = 0.477548 \]

Si usamos spatial.error = "kkp" y lag = FALSE obtenemos el modelo SEM de datos espaciales como Kapoor, Kelejian, and Prucha (2007):

\[ y = X\beta+\underbrace{(\iota_T\otimes I_N)\mu+\underbrace{\rho (I_T\otimes W_N)\varepsilon+\nu}_{\varepsilon}}_{u} \]

semremod <- spml(formula = formula(fm), data = datos, index = NULL, listw = WEC, model = "random", lag = FALSE, spatial.error = "kkp")

summary(semremod)
## ML panel with , spatial RE (KKP), spatial error correlation 
## 
## Call:
## spreml(formula = formula, data = data, index = index, w = listw2mat(listw), 
##     w2 = listw2mat(listw2), lag = lag, errors = errors, cl = cl)
## 
## Residuals:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -1.47395 -0.33189 -0.00176 -0.01444  0.32757  1.52733 
## 
## Error variance parameters:
##     Estimate Std. Error t-value  Pr(>|t|)    
## phi 0.378058   0.201839  1.8731   0.06106 .  
## rho 0.087219   0.011737  7.4311 1.077e-13 ***
## 
## Coefficients:
##                                 Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept)                    2.2832953  1.3106164  1.7422  0.081482 .  
## LnEconomicGlobalization       -0.8161897  0.1559833 -5.2325 1.672e-07 ***
## LnTradeBalance                -0.5495630  0.1072669 -5.1233 3.002e-07 ***
## LnSocialGlobalization          0.1505313  0.1532006  0.9826  0.325816    
## CurrentaccountbalanceofGDP_L1  0.0178446  0.0057036  3.1286  0.001756 ** 
## GDPperCapita_1                 0.4316484  0.1125210  3.8362  0.000125 ***
## LnRealEffectiveExchange       -0.1636409  0.0899574 -1.8191  0.068897 .  
## LnExternalDebt_1               0.4595130  0.1730752  2.6550  0.007931 ** 
## LnGINI                         1.2541139  0.2932451  4.2767 1.897e-05 ***
## TB1YR_1                       -0.0494661  0.0295312 -1.6750  0.093925 .  
## DummyOutputgapChina            0.1718051  0.0797401  2.1546  0.031196 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

10.1.2 Modelo de efectos fijos

El modelo de retardo espacial de efectos fijos se puede escribir en forma apilada como

\[ y = \lambda (I_T\otimes W_N)y +(\iota_T\otimes I_N)\mu+X\beta+\varepsilon \tag{10.11} \] donde \(\lambda\) es el coeficiente de autocorrelación espacial, \(W_N\) es la matriz de pesos espaciales, \(\iota_T\) es un vector columna de unos de dimensión \(T\), \(I_N\) es una matriz identidad \(N\times N\) y \(\varepsilon_i \sim N(0,\sigma_\varepsilon^2)\).

La estimación del modelo espacial en datos de panel se realiza usando model = "within.

sararfemod <- spml(formula = formula(fm), data = datos, index = NULL,listw = WEC, lag = TRUE, spatial.error= "b", model = "within",effect = "individual",method = "eigen")

summary(sararfemod)
## Spatial panel fixed effects sarar model
##  
## 
## Call:
## spml(formula = formula(fm), data = datos, index = NULL, listw = WEC, 
##     model = "within", effect = "individual", lag = TRUE, spatial.error = "b", 
##     method = "eigen")
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -1.21103 -0.23159  0.02948  0.25240  1.26510 
## 
## Spatial error parameter:
##      Estimate Std. Error t-value Pr(>|t|)
## rho -0.027101   0.039185 -0.6916   0.4892
## 
## Spatial autoregressive coefficient:
##        Estimate Std. Error t-value  Pr(>|t|)    
## lambda 0.085725   0.016153  5.3071 1.114e-07 ***
## 
## Coefficients:
##                                 Estimate Std. Error t-value  Pr(>|t|)    
## LnEconomicGlobalization       -0.7859579  0.1574532 -4.9917 5.985e-07 ***
## LnTradeBalance                -0.5857763  0.1337387 -4.3800 1.187e-05 ***
## LnSocialGlobalization          0.3661624  0.1432881  2.5554 0.0106057 *  
## CurrentaccountbalanceofGDP_L1  0.0204869  0.0055714  3.6771 0.0002359 ***
## GDPperCapita_1                 0.3166411  0.0966053  3.2777 0.0010466 ** 
## LnRealEffectiveExchange       -0.1504661  0.0866396 -1.7367 0.0824418 .  
## LnExternalDebt_1               0.4141390  0.1552434  2.6677 0.0076378 ** 
## LnGINI                         1.3533687  0.2888352  4.6856 2.791e-06 ***
## TB1YR_1                       -0.0393311  0.0139347 -2.8225 0.0047647 ** 
## DummyOutputgapChina            0.0758874  0.0392712  1.9324 0.0533107 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

de donde tenemos el modelo

\[ y = 0.085725 (I_T\otimes W_N)y +(\iota_T\otimes I_N)\mu+X\beta+\varepsilon \] Como se sabe, la tranformación within elimina los efectos individuales. Por lo tanto, desde un punto de vista empírico, también hace que las dos especificaciones (los efectos individuales son/no son espacialmente autocorrelacionados) sean indistinguibles. Por lo tanto, el argumento spatial.error puede tomar de manera equivalente los valores b o kkp, lo que lleva a la estimación de la misma especificación.

Para estimar un modelo con solo efectos fijos individuales:

sarfemod <- spml(formula = formula(fm), data = datos, index = NULL, listw = WEC,
                 model = "within", effect = "individual", method = "eigen")
summary(sarfemod)
## Spatial panel fixed effects error model
##  
## 
## Call:
## spml(formula = formula(fm), data = datos, index = NULL, listw = WEC, 
##     model = "within", effect = "individual", method = "eigen")
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -1.330981 -0.260631 -0.002235  0.280748  1.218552 
## 
## Spatial error parameter:
##     Estimate Std. Error t-value  Pr(>|t|)    
## rho 0.086271   0.010863  7.9417 1.994e-15 ***
## 
## Coefficients:
##                                 Estimate Std. Error t-value  Pr(>|t|)    
## LnEconomicGlobalization       -0.8595527  0.1593898 -5.3928 6.938e-08 ***
## LnTradeBalance                -0.6967712  0.1348232 -5.1680 2.366e-07 ***
## LnSocialGlobalization          0.2388833  0.1619063  1.4754  0.140094    
## CurrentaccountbalanceofGDP_L1  0.0179239  0.0056211  3.1887  0.001429 ** 
## GDPperCapita_1                 0.4498922  0.1113071  4.0419 5.302e-05 ***
## LnRealEffectiveExchange       -0.2016655  0.0964397 -2.0911  0.036519 *  
## LnExternalDebt_1               0.4601042  0.1707201  2.6951  0.007037 ** 
## LnGINI                         1.2765868  0.3095912  4.1235 3.732e-05 ***
## TB1YR_1                       -0.0507832  0.0288182 -1.7622  0.078037 .  
## DummyOutputgapChina            0.1684910  0.0779714  2.1609  0.030701 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

donde rho es el coeficiente de la variable dependiente espacialmente rezagada. Los efectos fijos se puede extraer:

eff <- effects(sarfemod)
eff
## 
## Intercept:
##             Estimate Std. Error t-value Pr(>|t|)  
## (Intercept)   2.7567     1.2442  2.2157  0.02671 *
## 
## 
## Spatial fixed effects:
##     Estimate Std. Error t-value Pr(>|t|)
## 1  -0.250342   1.206882 -0.2074   0.8357
## 2   0.534334   1.294405  0.4128   0.6798
## 3  -0.471606   1.240824 -0.3801   0.7039
## 4   0.095587   1.283971  0.0744   0.9407
## 5  -0.207139   1.242118 -0.1668   0.8676
## 6  -0.026423   1.256938 -0.0210   0.9832
## 7  -0.030575   1.289477 -0.0237   0.9811
## 8   0.088459   1.246061  0.0710   0.9434
## 9  -0.069912   1.197488 -0.0584   0.9534
## 10  0.337616   1.213512  0.2782   0.7808

se puede estimar un modelo de error espacial con efectos fijos de período de tiempo como:

fm1 <- "LnMSF ~ LnEconomicGlobalization + LnTradeBalance+  LnSocialGlobalization + CurrentaccountbalanceofGDP_L1 + GDPperCapita_1+LnRealEffectiveExchange + LnExternalDebt_1+LnGINI"


semfemod <- spml(formula = formula(fm1) ,data = datos, listw = WEC,model = "within", effect = "time", method = "eigen",index = c("COUNTRY","YEAR"))
## Warning: Function eigen_setup moved to the spatialreg package
## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package

## Warning: Function do_ldet moved to the spatialreg package
summary(semfemod)
## Spatial panel fixed effects error model
##  
## 
## Call:
## spml(formula = formula(fm1), data = datos, index = c("COUNTRY", 
##     "YEAR"), listw = WEC, model = "within", effect = "time", 
##     method = "eigen")
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -1.427853 -0.252904  0.026236  0.264640  1.465532 
## 
## Spatial error parameter:
##      Estimate Std. Error t-value  Pr(>|t|)    
## rho -0.385595   0.038808  -9.936 < 2.2e-16 ***
## 
## Coefficients:
##                                Estimate Std. Error t-value  Pr(>|t|)    
## LnEconomicGlobalization       -0.588236   0.123186 -4.7752 1.796e-06 ***
## LnTradeBalance                -0.343658   0.048617 -7.0687 1.564e-12 ***
## LnSocialGlobalization          0.067598   0.131619  0.5136 0.6075402    
## CurrentaccountbalanceofGDP_L1  0.020532   0.006372  3.2222 0.0012722 ** 
## GDPperCapita_1                 0.367313   0.130435  2.8161 0.0048615 ** 
## LnRealEffectiveExchange       -0.171405   0.067051 -2.5563 0.0105781 *  
## LnExternalDebt_1               0.180848   0.200328  0.9028 0.3666524    
## LnGINI                         0.854476   0.223095  3.8301 0.0001281 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
effects(semfemod)
## 
## Intercept:
##             Estimate Std. Error t-value Pr(>|t|)   
## (Intercept)  2.60282    0.91977  2.8299 0.004657 **
## 
## 
## Time period fixed effects:
##     Estimate Std. Error t-value Pr(>|t|)
## 1  -0.286455   0.898641 -0.3188   0.7499
## 2  -0.213750   0.901782 -0.2370   0.8126
## 3  -0.105552   0.907298 -0.1163   0.9074
## 4   0.176452   0.910564  0.1938   0.8463
## 5   0.471990   0.908780  0.5194   0.6035
## 6   0.435783   0.903733  0.4822   0.6297
## 7   0.242675   0.903087  0.2687   0.7881
## 8   0.230626   0.903330  0.2553   0.7985
## 9  -0.137246   0.900075 -0.1525   0.8788
## 10 -0.198743   0.898374 -0.2212   0.8249
## 11  0.027439   0.898353  0.0305   0.9756
## 12  0.064447   0.901591  0.0715   0.9430
## 13  0.204758   0.896881  0.2283   0.8194
## 14  0.042675   0.904942  0.0472   0.9624
## 15 -0.126912   0.904899 -0.1403   0.8885
## 16 -0.092130   0.915457 -0.1006   0.9198
## 17 -0.169677   0.921639 -0.1841   0.8539
## 18  0.014530   0.929504  0.0156   0.9875
## 19 -0.030269   0.933859 -0.0324   0.9741
## 20 -0.254134   0.941666 -0.2699   0.7873
## 21  0.282699   0.945717  0.2989   0.7650
## 22  0.320839   0.947599  0.3386   0.7349
## 23  0.444042   0.949821  0.4675   0.6401
## 24  0.539540   0.947139  0.5697   0.5689
## 25  0.389591   0.947298  0.4113   0.6809
## 26  0.329591   0.946657  0.3482   0.7277
## 27 -0.053702   0.947032 -0.0567   0.9548
## 28 -0.167406   0.950660 -0.1761   0.8602
## 29 -0.353792   0.948970 -0.3728   0.7093
## 30 -0.419933   0.948628 -0.4427   0.6580
## 31 -0.192796   0.947194 -0.2035   0.8387
## 32  0.206172   0.941198  0.2191   0.8266
## 33 -0.318386   0.941530 -0.3382   0.7352
## 34 -0.567972   0.940973 -0.6036   0.5461
## 35 -0.390024   0.937455 -0.4160   0.6774
## 36 -0.423864   0.938268 -0.4518   0.6514
## 37  0.078891   0.940548  0.0839   0.9332

10.2 LM test

Baltagi, Song, and Koh (2003) derivan pruebas conjuntas, marginales y condicionales para todas las combinaciones de efectos aleatorios y correlación espacial para la especificación del modelo presentada en la parte inicial. En particular, las hipótesis bajo consideración son:

  1. \(H_0^a\): \(\lambda = \sigma_\mu^2=0\) bajo la alternativa de que al menos un componente no es cero.

  2. \(H_0^b\): \(\sigma_\mu^2=0\) (asumiendo \(\lambda=0\)), bajo la alternativa de una cola de que el componente de la varianza es mayor que cero.

  3. \(H_0^c\): \(\lambda=0\) asumiendo que no hay efectos aleatorios (\(\sigma_\mu^2=0\)), bajo la alternativa de dos colas de que el coeficiente de autocorrelación espacial es diferente de cero.

  4. \(H_0^d\): \(\lambda=0\) asumiendo la posibilidad de efectos aleatorios (\(\sigma_\mu^2\) puede ser o no cero), bajo la alternativa de dos colas de que el coeficiente de autocorrelación espacial es diferente de cero.

  5. \(H_0^e\): \(\sigma_\mu^2=0\) asumiendo la posible existencia de autocorrelación espacial (\(\lambda\) puede o no ser cero), y la alternativa de una cola de que el componente de varianza es mayor que cero.

La función bsktest realiza las prubeas conjuntas, marginales y condicionales para todas las combinaciones de efectos aleatorios y correlación espacial. Se tiene los siguientes:

  1. LM1: \(H_0^b\) es sin efectos aleatorios asumiendo que no hay autocorrelación espacial.

  2. LM2: \(H_0^c\) es sin autocorrelación espacial asumiendo que no efectos aleatorios.

  3. LMJOINT: \(H_0^a\)

  4. CLMlambda: \(H_0^d\).

  5. CLMmu: \(H_0^e\).

test1 <- bsktest(x = formula(fm), data = datos, listw = WEC,test = "LM1")
test1
## 
##  Baltagi, Song and Koh SLM1 marginal test
## 
## data:  LnMSF ~ LnEconomicGlobalization + LnTradeBalance + LnSocialGlobalization +     CurrentaccountbalanceofGDP_L1 + GDPperCapita_1 + LnRealEffectiveExchange +     LnExternalDebt_1 + LnGINI + TB1YR_1 + DummyOutputgapChina
## LM1 = 13.756, p-value < 2.2e-16
## alternative hypothesis: Random effects

Del test1 podemos concluir que hay efectos aleatorios.

test2 <- bsktest(x = formula(fm), data = datos, listw = mat2listw(WEC), test = "LM2")
test2
## 
##  Baltagi, Song and Koh LM2 marginal test
## 
## data:  LnMSF ~ LnEconomicGlobalization + LnTradeBalance + LnSocialGlobalization +     CurrentaccountbalanceofGDP_L1 + GDPperCapita_1 + LnRealEffectiveExchange +     LnExternalDebt_1 + LnGINI + TB1YR_1 + DummyOutputgapChina
## LM2 = 5.9207, p-value = 3.206e-09
## alternative hypothesis: Spatial autocorrelation

Del test2 podemos concluir que hay autocorrelación espacial.

Las pruebas condicionales \(LM_\lambda\) y \(LM_\mu\) son quizás las más útiles porque prueban un efecto y son robustas frente a la otra.

bsktest(x = formula(fm), data = datos, listw = mat2listw(WEC),test = "CLMlambda")
## 
##  Baltagi, Song and Koh LM*-lambda conditional LM test (assuming sigma^2_mu >= 0)
## 
## data:  LnMSF ~ LnEconomicGlobalization + LnTradeBalance + LnSocialGlobalization +     CurrentaccountbalanceofGDP_L1 + GDPperCapita_1 + LnRealEffectiveExchange +     LnExternalDebt_1 + LnGINI + TB1YR_1 + DummyOutputgapChina
## LM*-lambda = 6.9658, p-value = 3.267e-12
## alternative hypothesis: Spatial autocorrelation

Asumiendo la posibilidad de efectos aleatorios, si hay autocorrelación espacial.

10.3 Test de Hausman espacial

La prueba de Hausman (Hausman (1978)) compara estimadores de efectos fijos y aleatorios y prueba si los datos apoyan o no el supuesto de efectos aleatorios. Mutl and Pfaffermayr (2011) muestran cómo extender este procedimiento a un marco espacial. El estadístico de la prueba de Hausman toma la forma

\[ H = NT(\hat{\theta}_{FGLS}-\hat{\theta}_W)^T(\hat{\Sigma}_W-\hat{\Sigma}_{FGLS})^{-1}(\hat{\theta}_{FGLS}-\hat{\theta}_W) \] donde \(\hat{\theta}_{FGLS}\) es el estimador de mínimos cuadrados generalizados espacial y \(\hat{\theta}_W\) es el estimador within, \(\hat{\Sigma}_{FGLS}\) y \(\hat{\Sigma}_W\) son sus correspendientes estimaciones de matrices de varianza-covarianza. \(H\) se distribuye asintóticamente \(\chi^2\) con \(k\) grados de libertad donde \(k\) es el número de covariables del modelo.

test1 <- sphtest(x = formula(fm), data = datos, listw = mat2listw(WEC),spatial.model = "error", method = "ML")
test1
## 
##  Hausman test for spatial models
## 
## data:  x
## chisq = 3.4676, df = 10, p-value = 0.9682
## alternative hypothesis: one model is inconsistent

El siguiente ejemplo muestra que si los dos modelos se estiman por separado, los dos objetos de la clase splm se pueden dar como argumentos a la función.

test21 <- sphtest(x = sararfemod, x2 = sararremod)
test21
## 
##  Hausman test for spatial models
## 
## data:  formula(fm)
## chisq = 11.963, df = 10, p-value = 0.2875
## alternative hypothesis: one model is inconsistent

Comparando los modelos sararfemod y sararremod el test nos indica que ambos son consistentes.

test22 <- sphtest(x = semfemod, x2 = sararremod)
test22
## 
##  Hausman test for spatial models
## 
## data:  formula(fm1)
## chisq = 16.141, df = 8, p-value = 0.04041
## alternative hypothesis: one model is inconsistent

Comparando los modelos semfemod y sararremod el test nos indica que un modelo no es consistente.

10.4 Referencias

Allers, Maarten A, and J Paul Elhorst. 2005. “Tax Mimicking and Yardstick Competition Among Local Governments in the Netherlands.” International Tax and Public Finance 12 (4): 493–513.
Anselin, L. 1988. “Spatial Econometrics: Methods and Models.” Boston, MA.
Anselin, Luc, and Anil K Bera. 1998. “Spatial Dependence in Linear Regression Models with an Introduction to Spatial Econometrics.” Statistics Textbooks and Monographs 155: 237–90.
Anselin, Luc, and Serge Rey. 1991. “Properties of Tests for Spatial Dependence in Linear Regression Models.” Geographical Analysis 23 (2): 112–31.
Anselin, Luc, Ibnu Syabri, and Youngihn Kho. 2010. “GeoDa: An Introduction to Spatial Data Analysis.” In Handbook of Applied Spatial Analysis, 73–89. Springer.
Attali, Jacques. 1995. Ruidos: Ensayo Sobre La Economı́a Polı́tica de La música. Siglo xxi.
Baddeley, Adrian, and others. 2008. “Analysing Spatial Point Patterns in r.” In. Citeseer.
Baddeley, Adrian, and Rolf Turner. 2005. spatstat: An R Package for Analyzing Spatial Point Patterns.” Journal of Statistical Software 12 (6): 1–42. http://www.jstatsoft.org/v12/i06/.
Baltagi, Badi H, Seuck Heun Song, and Won Koh. 2003. “Testing Panel Data Regression Models with Spatial Error Correlation.” Journal of Econometrics 117 (1): 123–50.
Besag, Julian. 1974. “Spatial Interaction and the Statistical Analysis of Lattice Systems.” Journal of the Royal Statistical Society: Series B (Methodological) 36 (2): 192–225.
———. 1975. “Statistical Analysis of Non-Lattice Data.” Journal of the Royal Statistical Society: Series D (The Statistician) 24 (3): 179–95.
Bevilacqua, Moreno, and Víctor Morales-Oñate. 2018. GeoModels: Analysis of Spatio (Temporal/Bivariate) Gaussian and Non Gaussian Random Fields. https://vmoprojs.github.io/GeoModels-page/.
Bivand, Roger S, Edzer J Pebesma, Virgilio Gomez-Rubio, and Edzer Jan Pebesma. 2013. Applied Spatial Data Analysis with r. Vol. 2. Springer.
Bivand, Roger S, Edzer J Pebesma, Virgilio Gómez-Rubio, and Edzer Jan Pebesma. 2008. Applied Spatial Data Analysis with r. Vol. 747248717. Springer.
Bivand, Roger, and Gianfranco Piras. 2015. “Comparing Implementations of Estimation Methods for Spatial Econometrics.” Journal of Statistical Software 63 (18): 1–36. https://www.jstatsoft.org/v63/i18/.
Chen, Yanguang. 2015. “A New Methodology of Spatial Cross-Correlation Analysis.” PloS One 10 (5): e0126158.
Cressie, Noel. 2015. Statistics for Spatial Data. John Wiley & Sons.
Elhorst, J. 2009. “Spatial Panel Data Models.’’handbook of Applied Spatial Analysis. MM Fischer and a. Getis, Eds.” Berlin, Heidelberg, New York: Springer.
Elhorst, J Paul. 2003. “Specification and Estimation of Spatial Panel Data Models.” International Regional Science Review 26 (3): 244–68.
Hausman, Jerry A. 1978. “Specification Tests in Econometrics.” Econometrica: Journal of the Econometric Society, 1251–71.
Herring, John, and others. 2011. “Opengis Implementation Standard for Geographic Information-Simple Feature Access-Part 1: Common Architecture [Corrigendum].”
Kapoor, Mudit, Harry H Kelejian, and Ingmar R Prucha. 2007. “Panel Data Models with Spatially Correlated Error Components.” Journal of Econometrics 140 (1): 97–130.
Kopczewska, Katarzyna. 2020. Applied Spatial Statistics and Econometrics: Data Analysis in r. Routledge.
Lele, S, and K Ord. 1986. “Besag’s Pseudo-Likelihood: Some Optimality Results.” Technical Report; Preprints.
LeSage, James P, and R Kelley Pace. 2014. “Interpreting Spatial Econometric Models.” Handbook of Regional Science 3: 1535.
LeSage, James, and Robert Kelley Pace. 2009. Introduction to Spatial Econometrics. Chapman; Hall/CRC.
Lovelace, Robin, Jakub Nowosad, and Jannes Muenchow. 2019. Geocomputation with r. CRC Press.
Millo, Giovanni, Gianfranco Piras, and others. 2012. “Splm: Spatial Panel Data Models in r.” Journal of Statistical Software 47 (1): 1–38.
Monmonier, Mark. 2018. How to Lie with Maps. University of Chicago Press.
Moran, Patrick AP. 1950. “Notes on Continuous Stochastic Phenomena.” Biometrika 37 (1/2): 17–23.
Mutl, Jan, and Michael Pfaffermayr. 2011. “The Hausman Test in a Cliff and Ord Panel Model.” The Econometrics Journal 14 (1): 48–76.
Paelinck, Jean HP, Leo Hendrik Klaassen, Jean-Pierre Ancot, and ACP Verster. 1979. Spatial Econometrics. Vol. 1. Saxon House.
Pebesma, Edzer. 2021. “Map Overlay and Spatial Aggregation in Sp.”
Sarkar, Deepayan. 2008. Lattice: Multivariate Data Visualization with r. New York: Springer. http://lmdvr.r-forge.r-project.org.
Whittle, Peter. 1954. “On Stationary Processes in the Plane.” Biometrika, 434–49.
Yamagata, Yoshiki, and Hajime Seya. 2019. Spatial Analysis Using Big Data: Methods and Urban Applications. Academic Press.