Metoda i dane

Do prognozowania zostaną wykorzystane biblioteki forecast oraz fpp2. Plik MZM.csv zawiera dane miesięczne dotyczące liczby zwiedzających w podziale na ogółem oraz gości krajowych i zagranicznych. Przy czym podział na krajowych/zagranicznych jest mocno umowny–wg wyjaśnień pracownika MZM zwiedzający jest pytany przy zakupie biletu na tę okoliczność. Dane zostały udostępnione autorowi przez biuro MZM w kwietniu 2019 roku.

## ── Attaching packages ────────────────────────────────────────────── fpp2 2.4 ──
## ✓ fma       2.4     ✓ expsmooth 2.3
## 
## [1] FALSE

Wstępna analiza szaregu czasowego

Wykres przedstawi it…

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Na podstawie wykresu można przyjąć, że szereg cechuje wyraźna sezonowość, trata

Statystyki opisowe

Średni liczba zwiedzających w miesiącu wynosi 11372.8235294…

Liniowy model trendu

## Koniec zbioru uczÄ…cego 2018 9
## PoczÄ…tek zbioru testowego 2018 10
## 
## Call:
## tslm(formula = zl ~ trend + season)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3469.1  -367.6    51.2   463.4  3055.6 
## 
## Coefficients:
##             Estimate Std. Error t value             Pr(>|t|)    
## (Intercept)  1683.03     767.17   2.194               0.0356 *  
## trend          33.35      16.37   2.038               0.0499 *  
## season2     -1028.60     991.95  -1.037               0.3075    
## season3       796.79     992.35   0.803               0.4279    
## season4      4499.19     993.02   4.531 0.000077270239387358 ***
## season5     14903.58     993.97  14.994 0.000000000000000503 ***
## season6     20416.98     995.18  20.516 < 0.0000000000000002 ***
## season7     25557.63     996.66  25.643 < 0.0000000000000002 ***
## season8     27772.02     998.41  27.816 < 0.0000000000000002 ***
## season9     15402.67    1000.42  15.396 0.000000000000000238 ***
## season10     6597.86    1072.40   6.152 0.000000698734744919 ***
## season11       35.17    1073.28   0.033               0.9741    
## season12      144.48    1074.40   0.134               0.8939    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1403 on 32 degrees of freedom
## Multiple R-squared:  0.9873, Adjusted R-squared:  0.9826 
## F-statistic: 208.1 on 12 and 32 DF,  p-value: < 0.00000000000000022
##                                  ME     RMSE      MAE        MPE     MAPE
## Training set 0.00000000000007576964 1182.803 781.9556 -0.6769317 8.978797
##                   MASE        ACF1
## Training set 0.6756175 -0.03083328

## 
##  Breusch-Godfrey test for serial correlation of order up to 16
## 
## data:  Residuals from Linear regression model
## LM test = 16.466, df = 16, p-value = 0.4209

Wnioski nt dopasowania

Analiza reszt

## 
##  Box-Ljung test
## 
## data:  res_lm
## X-squared = 0.045698, df = 1, p-value = 0.8307

Wnioski nt analizy reszt…

Prognoza

##                                      ME     RMSE       MAE         MPE
## Training set     0.00000000000007576964 1182.803  781.9556  -0.6769317
## Test set     -1701.13480392157180176582 2005.795 1701.1348 -79.1555960
##                   MAPE      MASE        ACF1 Theil's U
## Training set  8.978797 0.6756175 -0.03083328        NA
## Test set     79.155596 1.4697976 -0.04238377 0.7825343

Podsumowanie