ARMA Automático

Introducción

  • El método ARIMA (o Box-Jenkins) requiere que la persona que realiza el pronóstico sea altamente capacitada para seleccionar el modelo adecuado.

  • El ARMA Automático de NCSS automatiza el proceso de pronosticación ARIMA haciendo que el programa seleccione el mejor modelo.

Método (Paso 1)

El programa de ARMA Automático utiliza metodología de diferentes autores para encontrar y estimar un modelo de pronóstico adecuado. El método puede ser definido como sigue:

  1. Se elimina del modelo cualquier tendencia determinista (Pandit y Wu (1983)).

Método (Paso 2)

  1. Se ajusta un conjunto de modelos que van incrementando en complejidad. Estos son ARIMA(1,0,0), ARIMA(2,0,1), ARIMA(4,0,3), ARIMA(6,0,5), y así sucesivamente, incrementando tanto \(p\) como \(q\) en dos por cada paso.
  • El modelo más complejo probado se especifica en la caja Maximum Order.
  • Se calcula la suma de los cuadrados de los residuos para cada modelo y se anota la mínima.

Método (Paso 3)

  1. Utilizando la mínima suma de los cuadrados de los residuos como criterio, los modelos se ordenan desde el más simple hasta el más complejo.
  • El primer modelo que esté dentro del porcentaje de mínima suma de cuadrados (definido por el usuario) es seleccionado y utilizado.

Método (Paso 4)

  1. Una vez que este modelo es determinado se realiza un último intento de encontrar un modelo de orden menor que este dentro del porcentaje mínimo especificado.
  • Supongamos que los pasos anteriores nos llevaron a un modelo ARIMA(4,3). Este último paso ajustaría un modelo ARIMA(3, 0, 2) y revisaría si la suma de los cuadrados de los residuos esta dentro del porcentaje especificado. Si lo está, se utiliza el ARIMA(3,0,2), en caso contrario se queda con el ARIMA(4,3).

Método (Observación)

Como este procedimiento debe ajustar un gran número de modelos, muchos de los cuales son de orden grande, se utiliza un algoritmo no tan optimo (pero mucho más rápido).

Se utiliza la técnica de mínimos cuadrados modificada Yule-Walker descrita en Marple (1987), sección 10.4.

Este método es velóz y nos da estimaciones razonables de la suma de cuadrados de los residuos.

Estructura de los datos

Los datos se ingresan en una sola columna o variable.

Valores Nulos

Cuando la serie de tiempo contiene valores nulos (NA’s), estos son remplazados u omitidos. El valor de remplazo es el promedio de los valores más cercanos al valor nulo (por arriba y por abajo) o bien el valor no nulo más cercano por arriba.

Figure 1: Valores Nulos

Ejemplo

  • Utilizamos datos de contaminación del aire capturados por el gobierno de la ciudad de méxico. Disponibles en:

https://datos.cdmx.gob.mx/dataset/indice-de-calidad-del-aire

  • Descargamos los 5 archivos disponibles correspondientes a los periodos: 2018, 2019, 2020, 2021 y 2022.

Figure 2: Aire Cdmx

Filtrando Datos

  • Cada archivo contiene datos de las medidas de los contaminantes principales. Un registro por hora.

  • Nos concentramos en el contaminante ‘Ozono’. Calculamos el promedio de \(O_3\) en el valle de México:

\[O_{3}Prom = \frac{NorOeste + NorEste + SurEste + SurOeste + Centro}{5}\]

Gráfica Interactiva con Dygraphs

Promedio Mensual

  • Filtramos promedios mensuales para cada año (2018-2022) para los datos que ocuparemos para el ARMA Automático

ARMA Automático en NCSS