Este estudio muestra el comportamiento de los casos de COVID-10 en Nuevo León , México. De Abril 9 del 2020 al 14 de Mayo del 2020.
Fecha | Mes | Infectados | Factor de Contagio |
---|---|---|---|
2020-04-09 | Abril | 176 | 1.017046 |
2020-04-10 | Abril | 179 | 1.072626 |
2020-04-11 | Abril | 192 | 1.052083 |
2020-04-12 | Abril | 202 | 1.029703 |
2020-04-13 | Abril | 208 | 1.038461 |
2020-04-14 | Abril | 216 | 1.064815 |
2020-04-15 | Abril | 230 | 1.047826 |
2020-04-16 | Abril | 241 | 1.020747 |
2020-04-17 | Abril | 246 | 1.048780 |
2020-04-18 | Abril | 258 | 1.050388 |
2020-04-19 | Abril | 271 | 1.044280 |
2020-04-20 | Abril | 283 | 1.063604 |
2020-04-21 | Abril | 301 | 1.172757 |
2020-04-22 | Abril | 353 | 1.405099 |
2020-04-23 | Abril | 496 | 1.080645 |
2020-04-24 | Abril | 536 | 1.126866 |
2020-04-25 | Abril | 604 | 1.014901 |
2020-04-26 | Abril | 613 | 1.037520 |
2020-04-27 | Abril | 636 | 1.015723 |
2020-04-28 | Abril | 646 | 1.027864 |
2020-04-29 | Abril | 664 | 1.033133 |
2020-04-30 | Abril | 686 | 1.074344 |
2020-05-01 | Mayo | 737 | 1.048847 |
2020-05-02 | Mayo | 773 | 1.033635 |
2020-05-03 | Mayo | 799 | 1.036295 |
2020-05-04 | Mayo | 828 | 1.026570 |
2020-05-05 | Mayo | 850 | 1.069412 |
2020-05-06 | Mayo | 909 | 1.058306 |
2020-05-07 | Mayo | 962 | 1.025988 |
2020-05-08 | Mayo | 987 | 1.028369 |
2020-05-09 | Mayo | 1015 | 1.047291 |
2020-05-10 | Mayo | 1063 | 1.011289 |
2020-05-11 | Mayo | 1075 | 1.033488 |
2020-05-12 | Mayo | 1111 | 1.064806 |
2020-05-13 | Mayo | 1183 | 1.054945 |
2020-05-14 | Mayo | 1248 | 0.000000 |
La información utilizada fue la siguiente:
Para poder obtener las predicciones se utilizó un modelo de predicción arima(0,3,2) el cual se sustenta con los siguientes supuestos:
Tipo | Descripcion | Prueba_Estadistica | hipotesis |
---|---|---|---|
Estacionariedad | Estacionariedad en media | Regresión lineal(anova) | Ho: Es estacionaria en media , Ha: No es estacionaria en media |
Estacionariedad | Estacionariedad en varianza | Prueba de Dickey-Fuller | Ho: Es estacionaria en varianza , Ha: No es estacionaria en varianza |
Ruido Blanco | Media de los residuales = 0 | _ | Son ind si la media de los residuales entre su varianza es menor a 2 |
Ruido Blanco | Varianza de lso residuales constante | Gráfico de dispersión | La varianza de los residuales es constante si no hay algun patrón en el gráfico |
Ruido Blanco | Independencia en los residuales | Prueba de Box | Ho: los residuales se distribuyen de forma independiente, Ha: Los datos no son independientes |
Ruido Blanco | Distribución de los residuales normales | Prueba de Shapiro Wilks | Ho: Los datos son normales, Ha: Los datos no son normales |
NOTA: EN TODAS LAS PRUEBAS SE UTILIZÓ UNA CONFIANZA DEL 95% (PVALOR=.05)
** **
#MEDIA ESTACIONARIEDAD
correccion<-diff(diff(diff(TS)))
#plot(Costo)
x<-seq(1,length(correccion))
tendencia<-lm(correccion~x)
anova(tendencia)
Analysis of Variance Table
Response: correccion
Df Sum Sq Mean Sq F value Pr(>F)
x 1 0 0.04 0 0.9971
Residuals 31 90578 2921.88
Augmented Dickey-Fuller Test
data: Serie_tiempo
Dickey-Fuller = -4.2143, Lag order = 3, p-value = 0.01373
alternative hypothesis: stationary
Por lo tanto , los dos supuestos se cumplen, asi que se procede a obtener el mejor arima.
#Checar (ARIMA,ARMA,AR,MA)
Serie_tiempo<-ts(correccion,start=1,frequency = 1)
best.aic<-Inf
best.order<-c(0,0,0)
ycorregida<-Serie_tiempo
#ar(ycorregida) El mejor ar es de orden 3
for(i in 0:5)#para i de 0 a el mejor ar
{
for(j in 0:5)
{
fit.AIC<-AIC(arima(ycorregida,order=c(i,0,j)))
if(fit.AIC<best.aic)
{
best.order<-c(i,3,j)
best.arma<-arima(ycorregida,order=best.order)#Guarda los parametros
best.aic<-fit.AIC
}
}
}
best.order
[1] 1 3 2
Supuesto de media 0:
#1. media 0
i=0
j=2
#Como el modelo es el modelo ya diferenciado, no se le agrega el numero de en medio , quedando como orden(c(0,0,2))
elegido<-arima(Serie_tiempo,order=c(i,0,j))
resi<-residuals(elegido)
mean(resi)/var(resi)
[1] -0.0007522648
Supuesto de varianza Constante
#3.PROBAR INDEPENDENCIA
#acf(resi)
#pacf(resi)
#Estan por debajo de la linea por lo tanto son independientes
#Hipotesis nula:los residuales se distribuyen de forma independiente,
#Hipotesis alternativa:Los datos no son independientes
#Box.test(n1, lag = 1, type = c("Box-Pierce", "Ljung-Box"), fitdf = 0)
Box.test(resi, type = c("Box-Pierce"))
Box-Pierce test
data: resi
X-squared = 0.00067065, df = 1, p-value = 0.9793
Supuesto de varianza Constante
Shapiro-Wilk normality test
data: resi
W = 0.87707, p-value = 0.001426