Rozdział 5 Kointegracja i model korekty błędem
5.1 Testowanie pierwiastka jednostkowego
Klasyczne modele regresji liniowej, a zwłaszcza oparte na nich wnioskowanie (testy istotności, przedziały ufności i predykcji oraz prognozowanie), wymagają, aby procesy generujące dane były stacjonarne. Dane finansowe są jednak często generowane przez niestacjonarne procesy o charakterze zintegrowanym (zbliżone do błądzenia losowego). Zalecaną praktyką jest sprawdzenie, czy obserwowane szeregi czasowe wskazują na istnienie pierwiastka jednostkowego.
Jednym z głównych powodów, dla których testuje się pierwiastki jednostkowe, jest ryzyko korelacji pozornych (spurious correlations). Korelacja pozorna występuje wtedy, gdy dwie niestacjonarne zmienne wydają się silnie powiązane na wykresie i jest pomiędzy nimi wysoka korelacja (a tym samym wysoki współczynnik \(R^2\)), zaś klasyczny model liniowy dopasowany do danych wykazuje istotność parametrów, mimo że w rzeczywistości nie istnieje między nimi żaden sensowny związek ekonomiczny ani statystyczny. Wynika to z tego, że zmienne niestacjonarne często wykazują trend (wspólny wzrost w czasie, „trend stochastyczny”), co samo w sobie generuje wysoką korelację.
Dopasowywanie klasycznych modeli regresji do szeregów czasowych wykazujących niestacjonarność mogą więc prowadzić do błędnych wniosków. Dlatego stosuje się testy takie jak ADF (Augmented Dickey–Fuller, rozszerzony test Dickeya-Fullera), PP (test Phillipsa–Perrona) czy test KPSS, aby określić, czy zmienna zawiera pierwiastek jednostkowy. W testach ADF i PP hipoteza zerowa zakłada niestacjonarność (obecność pierwiastka jednostkowego), natomiast w KPSS odwrotnie — stacjonarność. Poziom integracji zmiennej (np. I(0) lub I(1)) determinuje dalsze narzędzia analityczne, m.in. badanie kointegracji.
5.2 Kointegracja
Kointegracja opisuje sytuację, w której dwie (lub więcej) zmienne niestacjonarne rzędu I(1) są połączone długookresową relacją równowagi. Choć każda z nich osobno podlega trendom lub losowym wahaniom, pewna liniowa kombinacja tych zmiennych może być stacjonarna — tę kombinację nazywa się wektorem kointegrującym.
Intuicyjnie: zmienne mogą „odchylać się” od równowagi w krótkim okresie, ale w długim okresie powracają do określonego stanu równowagi.
Kointegrację zwykle identyfikuje się metodą Engle’a-Grangera.
5.2.1 Dwustopniowa metoda Engle’a-Grangera
Metoda Engle’a-Grangera jest najpopularniejszym sposobem testowania kointegracji między dwoma zmiennymi. Składa się z dwóch kroków:
Krok 1: Estymacja długookresowej relacji
Dopasowujemy model liniowy prostą metodą najmniejszych kwadratów.
\(y_t = \alpha + \beta x_t + u_t\)
Jeżeli zmienne \(y_t\) i \(x_t\) są zintegrowane \(I(1)\), i istnieje między nimi długookresowy rzeczywisty związek, należy się spodziewać, że reszty (\(u_t\)) będą wykazywać się stacjonarnością (to znaczy ich struktura będzie wskazywać, że zostały wygenerowane przez proces stacjonarny \(I(0)\)).
Krok 2: Testowanie reszt
Testujemy reszty z pierwszego kroku pod kątem pierwiastka jednostkowego, na przykład za pomocą testu ADF albo dedykowanego testu Phillipsa-Ouliarisa.
Gdy hipoteza zerowa o pierwiastku jednostkowym w resztach zostanie odrzucona, wówczas uznamy, że \(y_t\) i \(x_t\) są skointegrowane. Kointegracja oznacza, że mimo iż poszczególne procesy stochastyczne są niestacjonarne, zintegrowane, istnieje pomiędzy nimi stabilny, długookresowy związek.
5.3 Model korekty błędem
Jednorównaniowy model korekty błędem (Error Correction Model, ECM) jest narzędziem analizy szeregów czasowych, którego używamy, gdy mamy do czynienia szeregami wykazującymi kointegrację. Model korekty błędem pozwala na modelowanie tej zależności, poprzez uwzględnienie krótkookresowych odchyleń od długookresowej równowagi. Model pokazuje, jak zmienne wracają do równowagi po krótkookresowych odchyleniach.
Model korekty błędem w najprostszej formie można zapisać w następujący sposób:
\[\Delta y_t = \alpha_1 + \alpha_2 \Delta x_t + \gamma (y_{t-1} - \beta_1 - \beta_2 x_{t-1}) + \varepsilon_t\]
W powyższym równaniu \((y_{t-1} - \beta_1 - \beta_2 x_t -1)\) to odchylenie od długookresowej równowagi w poprzedzającym okresie. Jeżeli kointegracja występuje, to mimo niestacjonarności procesu y i procesu x, odchylenia mają charakter stacjonarny i model ma rację bytu. Współczynnik γ to współczynnik korekty błędu, który powinien być ujemny, z przedziału (-1;0), żeby odchylenia od długookresowej równowagi były stopniowo korygowane w kolejnych okresach.