11 Regresión Ponderada Geográficamente

Librerías usadas

  • spdep
  • ggplot2
  • lmtest
  • RColorBrewer
  • classInt
  • spatialreg

La suposición de coeficientes que varían espacialmente está asociada con la creencia de que existen grupos homogéneos en el espacio en los que los valores de los parámetros del modelo son constantes.

Todos ellos presuponen la existencia de segmentos (clusters) en la muestra, dentro de los cuales la varianza es menor y los parámetros del modelo son estables (los mismos efectos para cada observación).

Uno de los modelos más populares en este enfoque es la regresión ponderada geográficamente (GWR). Sus ventajas más importantes son:

  • flexibilidad (puede ajustar el modelo individual incluso a pequeños clusters de puntos, aunque esto tiene algunas consecuencias negativas),
  • falta de necesidad de definir de antemano la pertenencia de los segmentos (el propio modelo elige el número óptimo de vecinos más cercanos) y
  • la simplicidad de la forma funcional: todas las ecuaciones son lineales; es decir, la interpretación de cada uno de los efectos es posible y sencilla.

GWR es una adaptación del modelo de regresión local en econometría espacial, formulado por primera vez en el famoso trabajo de Brunsdon, Fotheringham, and Charlton (1996). La idea de la regresión local es estimar el valor en un punto determinado en función de sus alrededores inmediatos (vecinos más próximos).

Los vecinos más próximos se determinan en función de la distancia desde el punto en el que se realiza la estimación. Mientras que en el enfoque clásico la distancia entre puntos se determina en función de los valores de las variables explicativas (matriz \(X\)), en la regresión ponderada geográfica se puede aplicar un enfoque más intuitivo y se calcula la distancia entre la ubicación de dos puntos en el espacio geográfico. El modelo GWR se puede escribir como:

\[ y_i = \beta_0(u_i,v_i)+\sum_{i=1}^px_{ik}\beta_k(u_i,v_i) \]

donde: - \(i\) es la observación \(i=\{1,\ldots,N\}\), - \(k\) es el número de la variable en el conjunto \(k=\{1,\ldots,P\}\), - \(y_i\) es el valor de la variable dependiente en la observación \(i\), - \(u_i,v_i\) son las coordenadas geográficas de la observación, - \(\beta_k(u_i,v_i)\) es el valor del efecto de la variable \(k\) para coordenadas dadas.