본문 바로가기

FinancialTimeSeries

07. ARIMA Model

지난 포스팅에서 정상적이지 않은 시계열 중 추세 정상적 시계열과 단위근을 갖는 시계열에 대해 알아보았다.

 

오늘은 이러한 시계열 중 특히 추세 정장적 시계열을 다루는 시계열 모델인 ARIMA 모델에 대해 알아보려고 한다.

 


 

Def 7.1.

시계열 $x_t$가 아래와 같은 식으로 표현될 때, 시계열 $x_t$는 $ARIMA(p,d,q)$를 따른다고 하고 $x_t \sim ARIMA(p,d,q)$라고 표현한다.

$$(1- L^d )x_t = \phi_0 + \sum_{i=1}^p \phi_i (1-L^d)x_{t-i} + \varepsilon_t + \sum_{j=1}^q\theta_j \varepsilon_{t-j}~~\text{where}~\varepsilon_t \sim WN (0, \sigma_{\varepsilon}^2).$$

만약 $ x_t \sim ARIMA(p,1,q) $이라면 자연스럽게$ \Delta x_t \sim ARMA(p,q)$임을 알 수 있다.

 

이때 $\Delta x_t$가 $E[\Delta x_t] = \mu $라면 $ARIMA(p,1,q)$ 모델은 아래와 같은 식으로 표현된다.

 

$$ (\Delta x_t - \mu) = \sum_{i=1}^p \phi_i (\Delta x_{t-i} - \mu ) + \varepsilon_t + \sum_{j=1}^q\theta_j \varepsilon_{t-j}.$$

 

다음 정리를 주목해보자.

 

Thm 7.2.

시계열 $u_t$가 평균이 0인 $ARMA(p+1,q)$를 따르고 아래 식과 같이 표현된다고 하자.

$$ (1 - \phi_1L - \cdots - \phi_{p+1}L^{p+1})u_t = (1 + \theta_1 L + \cdots + \theta_q L^q) \varepsilon_t~~\text{where}~\varepsilon_t \sim WN(0, \sigma_{\varepsilon}^2).$$

만약 AR char. ft. $\phi(z)=0$의 한 해가 단위근이고 나머지 $p$개의 해의 크기가 1보다 크면

(a) $u_t$는 비정상적 시계열이고,

(b) $\Delta u_t$는 평균이 0이고 정상적인 $ARMA(p,q)$를 따른다.

 


 

위에서 배운 정의와 정리를 이용해 최종적으로 정리해보자.

 

다음과 같은 선형 모델을 생각해보자.

 

$$x_t = c(t) + u_t~~\text{where}~u_t \sim~\text{zero-mean}~ARMA(p+1,q).$$

 

[CASE1 : $c(t)= \alpha$, $u_t$ : 정상적]

 

이 경우엔 $E[x_t] = \alpha$이기 때문에 $x_t$는 추세를 갖지 않는다.

 

또한 다음과 같은 꼴의 정상적인 $ARMA(p+1,q)$를 따른다.

 

$$ (x_t - \alpha) = \sum_{i=1}^{p+1} \phi_i (x_{t-i} - \alpha ) + \varepsilon_t + \sum_{j=1}^q\theta_j \varepsilon_{t-j}.$$

 

[CASE2 : $c(t) =  \alpha + \delta t$, $u_t$ : 정상적]

 

이 경우엔 $E[x_t] = \alpha + \delta t$이기 때문에 추세가 존재하고, 추세 정상성을 갖게 된다.

 

또한 $x_t^* = x_t - \alpha - \delta t$로 정의하면 $x_t^*$는 다음과 같은 꼴의 평균이 0인 정상적 $ARMA(p+1,q)$를 따른다.

 

$$ x_t^* = \sum_{i=1}^{p+1} \phi_i x_{t-i}^* + \varepsilon_t + \sum_{j=1}^q\theta_j \varepsilon_{t-j}.$$

 

또는

 

 

[CASE3 : $u_t$의 AR char. ft. $\phi(z) = 0$의 한 해가 단위근]

 

이 경우에는 $u_t$가 비정상적 시계열이기 때문에 $x_t$도 자연스럽게 비정상적 시계열이다.

 

하지만 Thm 7.2.에 따라 $\Delta u_t \sim ARMA(p,q)~\text{where}~E[\Delta u_t]=0$이고

 

(a) $c(t) = \alpha$라면 $\Delta x_t = \Delta u_t$이고

 

(b) $c(t) = \alpha + \delta t$라면 $\Delta x_t = \delta + \Delta u_t$이므로

 

$\Delta x_t$는 정상적 $ARMA(p,q)$를 따른다.

 

다시 말해 $x_t$는 정상적 오차 $\Delta u_t$를 갖는 단위근 과정이고 다음과 같은 식의 $ARIMA(p,1,q)$ 모델을 따른다.

 

$$ (\Delta x_t - E[\Delta x_t]) = \sum_{i=1}^p \phi_i (\Delta x_{t-i} - E[\Delta x_t] ) + \varepsilon_t + \sum_{j=1}^q\theta_j \varepsilon_{t-j}.$$

 

where (a) $E[\Delta x_t] =0$ if $c(t) = \alpha$, (b) $E[\Delta x_t] = \delta $ if $c(t) = \alpha + \delta t$.

 


 

오늘은 비정상적 시계열에 대한 모델인 ARIAM 모델과 차분을 통해 정상성을 만족시키는 시계열을 찾는 과정에 대해서 알아보았다.

 

우리는 위에서 알아본 단위근이 시계열의 정상성을 결정한다는 것을 알 수 있는데,

 

다음 포스팅에서는 단위근이 존재하는지 안하는지 검정하는 과정을 통해 시계열의 정상성을 판단하는 과정에 대해 알아보려고 한다.

 

오늘은 여기까지.