본문 바로가기

FinancialTimeSeries

08. Unit-Root Test & Seasonality

오늘은 시계열의 정상성을 결정하는 단위근의 존재를 검정하는 법과 계절성을 띄는 시계열을 다루는 방법에 대해 알아보려고 한다.

 


 

데이터에 명확한 추세가 없는 시계열 $x_t$가 있다고 가정해보자.

 

그러면 우리는 $x_t$가 $\delta = 0$인 단위근을 가지는 시계열이라는 귀무가설에 대한 검정을 실시한다.

 

만약 귀무가설이 기각되지 않는다면 정상적인 시계열에 적용할 수 있는 ARMA 모델을 적용할 수 없고,

 

대신 $E[\Delta x_t] = 0$인 ARIMA(p,1,q) 모델을 적용해야 한다.

 

반대로 귀무가설이 기각된다면 $x_t$는 정상적이라는 의미이고, 결과적으로 $E[x_t] = \alpha$인 ARMA 모델을 적용할 수 있다.

 

이번에는 추세 정상적 시계열 $y_t$가 있다고 가정해보자.

 

우리는 위와 마찬가지로 $y_t$가 $\delta \neq 0$인 단위근을 가지는 시계열이라는 귀무가설에 대한 검정을 실시한다.

 

귀무가설이 기각되지 않을 경우 $E[\Delta y_t] = \delta$인 ARIAM(p,1,q) 모델을 적용한다.

 

만약 귀무가설이 기각될 경우 $y_t^* = y_t - \alpha - \delta t$에 ARMA 모델을 적용할 수 있다.

 


 

이제 본격적인 검정법에 대해 소개한다.

 

다음과 같은 식의 AR(1) 모델에 대해 생각해보자.

 

$$ x_t = c(t) + \phi_1 x_{t-1} + \varepsilon_t~~\text{where}~\varepsilon_t \sim WN(0, \sigma_{\varepsilon}^2). $$

 

이때, $\phi_1 =1$이라면 $x_t$는 단위근을 갖게 된다.

 

이를 판단하는 검정 중 대표적인 것이 바로 다음의 Dickey-Fuller 검정이다.

 

Thm 8.1.(Dickey-Fuller Unit-Root Test, DF test)

$$H_0 : \phi_1 = 1~~ \text{vs}~ ~H_1 : |\phi_1 | <1.$$

이때 검정 통계량은

$$ t = \frac{\hat{\phi_1} - 1}{se(\hat{\phi_1})}$$

으로 주어지고, $\hat{\phi_1}$은 $\phi_1$의 최소제곱 추정치이고 $se(\hat{\phi_1})$은 표준오차이다.

Dicky와 Fuller(1979)는 $H_0$하에서 검정 통계량이 Dicky-Fuller 분포를 따른다는 것과

$H_1$하에서 점근적으로 표준정규분포를 따른다는 것을 보였다.

 

위에서 알아본 DF 검정에서는 AR(1) 모델에 대한 검정이었다.

 

하지만 실제 시계열 모델은 AR(1) 모델보다 더 복잡한 모델을 따른다.

 

Said와 Dickey(1984)는 기존의 DF 검정을 일반적인 AR(p+1) 모델에도 적용할 수 있도록 확장시켰다.

 

이 검정을 적용하기 전에 다음과 같은 과정을 거쳐야한다.

 

Thm 8.2.(DF transformation)

AR(p+1) 모델

$$ x_t = \phi_0 + \phi_1 x_{t-1} + \phi_2 x_{t-2} + \cdots + \phi_{p+1} x_{t-p-1} + \varepsilon_t$$

는 다음과 같은 식으로 바뀔 수 있다.

$$ x_t = \phi_0 + \rho x_{t-1} + \psi_1 \Delta x_{t-1} + \psi_2 \Delta x_{t-2} + \cdots + \psi_p \Delta x_{t-p} + \varepsilon_t$$

$\text{where}~\rho = \phi_1 + \cdots + \phi_{p-1} ,~\psi _j~\text{is a linear combination of}~\phi_i 's.$

예를 들어 AR(2) 모델에 DF transformation을 적용해보자.

 

 

다음과 같은 꼴의 AR(p+1) 모델을 생각해보자.

 

$$ x_t = c(t) + \phi_1 x_{t-1} + \phi_2 x_{t-2} + \cdots + \phi_{p+1} x_{t-p-1} + \varepsilon_t~~\text{where}~\varepsilon \sim WN(0, \sigma_{\varepsilon}^2 ). \tag{1}$$

 

DF transformation을 통해 위 식 (1)을 다음과 같이 변형시킬 수 있다.

 

$$ x_t = c(t) + \phi x_{t-1} + \sum_{j=1}^{p} \psi_j \Delta x_{t-j} + \varepsilon_t$$

 

또는

 

$$ \Delta x_t = c(t) + \pi x_{t-1} + \sum_{j=1}^{p} \psi_j \Delta x_{t-j} + \varepsilon_t~~\text{where}~\pi = \rho -1.\tag{2}$$

 

만약 단위근이 존재한다면 자연스럽게 $\pi = 0$임을 알 수 있다.

 

이를 이용한 확장된 DF 검정에 대해 알아보자.

 

Thm 8.3.(Augmented Dickey-Fuller Unit-Root Test, ADF test)

$$H_0 : \pi = 0~~ \text{vs}~ ~H_1 : \pi \neq 0.$$

이때 검정 통계량은

$$ t = \frac{\hat{\pi}}{se(\hat{\pi})}$$

으로 주어지고, $\hat{\pi}$은 $\pi$의 최소제곱 추정치이고 $se(\hat{\pi})$은 표준오차이다.

검정 통계량은 $H_0$하에서 DF 분포를 따르고, $H_1$하에서 점근적으로 표준정규분포를 따른다.

식 (2)를 보게되면 p개의 $\Delta x_{t-j}$항들이 $\Delta x_t$의 AR 모델에 근사하고 있고, 상관관계가 없는 $\varepsilon_t$가 만들어지도록 하는 p 값이 정해져야 함을 알 수 있다.

 

만약 p 값이 너무 작으면 검정에 편향을 부여하게 되고, p 값이 너무 크면 검정력이 낮아진다.

 

이를 해결하기 위해 Ng와 Perron(1995)는 데이터에 의존하는 p 값에 대한 결정을 위한 다음과 같은 단계적 방법을 제안했다.

 

첫번째 단계, p 값은 상한인 $p_{\text{max}}$의 값을 다음과 같이 설정한다.

 

$$ p_{\text{max}} = \left[ 12 \left( \frac{T}{100} \right)^{1/4} \right]. $$

 

두번째 단계, p 값을 첫번째 단계에서 구한 $p_{\text{max}}$으로 설정한 후 식 (2)의 회귀선을 구한다.

 

만약 $t$의 절댓값이 1.6보다 클 경우 p 값을 $p_{\text{max}}$로 설정하고, 그렇지 않으면 1씩 줄이며 위 과정을 반복한다.

 


 

다음은 계절성을 가지는 시계열을 다루는 방법에 대해 알아보자.

 

Def 8.4.

주기가 $s$인 계절성 시계열 $x_t$에 대해, 연산 $\Delta_s = 1-L^s$는 계절 차분이라고 불리고 계절성을 제거한다.

일반적인 차분 $\Delta = 1-L$은 선형적 추세를 제거하기 위해 사용된다.

예를 들어, $s=4$일 때 다음과 같이 표현된다.

 

$$ \Delta_4 x_t = (1- L^4 )x_t = x_t - x_{t-4}.$$

 

Def 8.5.

시계열 $x_t$의 계절성 $ARIMA(p,d,q) \times (P,1,Q)_s $은 다음과 같은 식으로 표현된다.

$$\phi(L) \Phi(L^s ) (1 - L^d )(1- L^s )x_t = \theta(L) \Theta(L^s) \varepsilon_t$$

$\text{where}~\varepsilon_t \sim WN(0, \sigma_{\varepsilon}^2),~s~:~x_t \text{의 주기},$

일반적으로 $P=0$, $Q=1$로 설정한다.

 

예를 들어, 계절성 $ARIMA(1,0,1) \times (0,1,1)_4$ 모델은

 

$$ (1- \phi_1 L )(1 - L^4)x_t = (1+\theta_1 L)(1+ \Theta_1^4)\varepsilon_t$$

 

로 표현되고, 계절성 $ARIMA(1,1,1) \times (0,1,1)_4$ 모델은

 

$$ (1- \phi_1 L )(1-L)(1 - L^4)x_t = (1+\theta_1 L)(1+ \Theta_1^4)\varepsilon_t$$

 

로 표현된다.

 


 

오늘은 단위근 검정과 계절성 시계열을 다루는 방법에 대해 알아보았다.

 

다음은 이분산성에 대한 내용을 포스팅할 예정이다.

 

쉽게 말해 시계열 데이터의 분산을 추정하는 과정이라고 생각하면 된다.

 

이는 이후에 배울 Value at Risk 측정에 매우 중요한 과정이다.

 

오늘은 여기까지.