본문 바로가기

FinancialTimeSeries

03. Autoregressive Model(2)

지난 포스트에서 AR 모델의 정의와 AR 모델이 정상성을 갖기 위한 충분조건에 대해 알아보았다.

 

이번 포스트에서는 AR 모델 중 AR(1) 모델에 대한 정리와 AR(p) 모델의 주요 파라미터인 p를 어떻게 설정하는지, AR 모델을 통해 예측하는 방법에 대해 알아보려고 한다.

 

다음 Thm 3.1는 AR(1) 모델에 대한 중요한 정리다.

 

Thm 3.1

AR(1) 모델 $x_t = \phi_0 + \phi_1 x_{t-1} + \varepsilon_t ~~where~~\varepsilon_t \sim WN(0, \sigma ^2)$이 정상성을 갖기 위한 필요충분조건은 $|\phi_1 | <1$이다. 

한가지 주목할 점은 바로 '필요충분조건'이라는 점이다.

 

우선 $\phi_1 ^{-1}$는 AR(1) 모델의 char. eq.의 복소수 해다.

 

그런데 $|\phi_1 | <1$라는 것은 char. eq.의 복소수 해의 크기가 1보다 크다는 것이고,

 

이는 Thm 2.4에 따르면 AR(1) 모델이 정상성을 갖기 위한 충분조건이 된다.

 

하지만 Thm 3.1에서 볼 수 있듯이 AR(1) 모델에서 복소수 해의 크기가 1보다 크다는 것은 정상성을 갖기 위한 필요충분조건이 된다.

 

.

 

AR 모델에 대한 기본적인 이론을 배우다보면 자연스럽게 한가지 의문점이 생기게 된다.

 

AR($p$)에서 $p$는 무슨 기준으로 설정하는 것일까?

 

다음과 같은 꼴의 AR($p$) 모델을 생각해보자.

 

$$ x_t = \phi_{p0} + \phi_{p1} x_{t-1} + \phi_{p2} x_{t-2} + \cdots + \phi_{pp} x_{t-p} + \varepsilon_t .$$

 

위 식에서 계수 $\phi_{jj}$를 $x_t$의 $j$번째 편자기상관함수(partial autocorrelation function, PACF)라고 정의한다.

 

만약 시계열 $x_t$가 AR($p$) 모델을 따른다면, $p$번째 표본 PACF $\hat{\phi_{pp}}$가 0이 아니고, $j >p$에 대해 $\hat{\phi_{jj}}$가 0에 가깝게 될것이다.

 

결국 PACF가 AR($p$) 모델의 파라미터인 $p$를 결정한다고 볼 수 있다.

 

.

 

이제 AR 모델을 이용해 어떻게 예측하는지 살펴보자.

 

AR($p$) 모델의 모든 계수 $\phi_0 , \phi_1 , \cdots,\phi_p $를 알고 있다고 하자.

 

$x_T$의 $s$-step 예측은 $x_T [s]$로 표시하고 다음과 같이 조건부 기댓값으로 정의된다.

 

$$x_T [s] = E [ x_{T+s} | I_T ] ,$$

 

단, $s \geq 1$이고 $I_T$는 시간 $T$에서의 모든 정보의 집합이라고 한다.

 

정보 집합 $I_T$에 대해 (1) $ E[ x_T |I_T ]  = x_T$, (2) $E[x_{T-p}|I_T] = x_{T-p}$, (3) $E[\varepsilon_{T+1} | I_T] =0$임을 쉽게 알 수 있다.

 

$ x_t \sim AR(p)$일 때 1-step과 2-step 예측을 살펴보자.

 

 

 

위에서 구한 $x_T [1]$을 이용하면 다음과 같은 식을 얻을 수 있다.

 

$$x_{T+1} - x_T [1] = \varepsilon_{T+1}.$$

 

이때 $\varepsilon_t \overset{iid}{\sim} N(0, \sigma^2)$이므로

 

$$ x_T [1] \sim N(x_{T+1}, \sigma ^2)$$

 

임을 알 수 있다.

 

정규분포의 성질을 이용하면 다음을 쉽게 유도할 수 있다.

 

$ \alpha =\int_{z_{\alpha}}^{\infty} \dfrac{1}{\sqrt{2\pi}} \exp \left( - \dfrac{x^2}{2}\right) dx$를 만족하는 $z_{\alpha}$에 대해

 

$$ 1-\alpha = P \left( -z_{\alpha/2} \leq \dfrac{x_T [1] - x_{T+1}}{\sigma} \leq z_{\alpha/2} \right).$$

 

위 식을 이용하여 $x_{T+1}$에 대한 $(1-\alpha)\%$ 신뢰구간을 구해주면

 

$$ x_T [1] \pm z_{\alpha /2} \sigma.$$

 

마찬가지로 $ x_{T+2} - x_T [2] = \varepsilon_{T+2} + \phi_1 \varepsilon_{T+1}$임을 이용하면

 

$$ x_T [2] \sim N(x_{T+2}, (1 + \phi_1 ^2)\sigma^2)$$

 

이므로, $ x_{T+2}$에 대한 $(1-\alpha)\%$ 신뢰구간은

 

$$x_T [2] \pm z_{\alpha/2} \sqrt{1 + \phi_1 ^2} \sigma.$$

 

이런식으로 계속 반복할 경우 AR 모델에서 $s$가 커질수록 $x_{T+s}$에 대한 신뢰구간도 넓어지기 때문에 불확실성이 더 커지는 한계를 가진다는 것을 알 수 있다.

 

.

 

오늘은 AR(1) 모델의 정상성을 위한 필요충분조건, AR 모델의 차수 $p$를 선택하는 법, AR 모델을 이용해 예측하는 법과 한계를 알아보았다. 

 

다음 포스트부터는 Moving Average Model에 대해 알아보려고 한다.

 

오늘은 여기까지.

'FinancialTimeSeries' 카테고리의 다른 글

06. Trend-Stationarity & Unit-Root Process  (0) 2024.03.18
05. Moving Average Model(2) & ARMA Model  (0) 2024.03.10
04. Moving Average Model(1)  (1) 2024.01.26
02. Autoregressive Model(1)  (1) 2024.01.14
01. Time Series and Stationarity  (1) 2024.01.07