지난 포스트에서 AR 모델의 정의와 AR 모델이 정상성을 갖기 위한 충분조건에 대해 알아보았다.
이번 포스트에서는 AR 모델 중 AR(1) 모델에 대한 정리와 AR(p) 모델의 주요 파라미터인 p를 어떻게 설정하는지, AR 모델을 통해 예측하는 방법에 대해 알아보려고 한다.
다음 Thm 3.1는 AR(1) 모델에 대한 중요한 정리다.
Thm 3.1 AR(1) 모델 $x_t = \phi_0 + \phi_1 x_{t-1} + \varepsilon_t ~~where~~\varepsilon_t \sim WN(0, \sigma ^2)$이 정상성을 갖기 위한 필요충분조건은 $|\phi_1 | <1$이다. |
한가지 주목할 점은 바로 '필요충분조건'이라는 점이다.
우선 $\phi_1 ^{-1}$는 AR(1) 모델의 char. eq.의 복소수 해다.
그런데 $|\phi_1 | <1$라는 것은 char. eq.의 복소수 해의 크기가 1보다 크다는 것이고,
이는 Thm 2.4에 따르면 AR(1) 모델이 정상성을 갖기 위한 충분조건이 된다.
하지만 Thm 3.1에서 볼 수 있듯이 AR(1) 모델에서 복소수 해의 크기가 1보다 크다는 것은 정상성을 갖기 위한 필요충분조건이 된다.
.
AR 모델에 대한 기본적인 이론을 배우다보면 자연스럽게 한가지 의문점이 생기게 된다.
AR($p$)에서 $p$는 무슨 기준으로 설정하는 것일까?
다음과 같은 꼴의 AR($p$) 모델을 생각해보자.
$$ x_t = \phi_{p0} + \phi_{p1} x_{t-1} + \phi_{p2} x_{t-2} + \cdots + \phi_{pp} x_{t-p} + \varepsilon_t .$$
위 식에서 계수 $\phi_{jj}$를 $x_t$의 $j$번째 편자기상관함수(partial autocorrelation function, PACF)라고 정의한다.
만약 시계열 $x_t$가 AR($p$) 모델을 따른다면, $p$번째 표본 PACF $\hat{\phi_{pp}}$가 0이 아니고, $j >p$에 대해 $\hat{\phi_{jj}}$가 0에 가깝게 될것이다.
결국 PACF가 AR($p$) 모델의 파라미터인 $p$를 결정한다고 볼 수 있다.
.
이제 AR 모델을 이용해 어떻게 예측하는지 살펴보자.
AR($p$) 모델의 모든 계수 $\phi_0 , \phi_1 , \cdots,\phi_p $를 알고 있다고 하자.
$x_T$의 $s$-step 예측은 $x_T [s]$로 표시하고 다음과 같이 조건부 기댓값으로 정의된다.
$$x_T [s] = E [ x_{T+s} | I_T ] ,$$
단, $s \geq 1$이고 $I_T$는 시간 $T$에서의 모든 정보의 집합이라고 한다.
정보 집합 $I_T$에 대해 (1) $ E[ x_T |I_T ] = x_T$, (2) $E[x_{T-p}|I_T] = x_{T-p}$, (3) $E[\varepsilon_{T+1} | I_T] =0$임을 쉽게 알 수 있다.
$ x_t \sim AR(p)$일 때 1-step과 2-step 예측을 살펴보자.
위에서 구한 $x_T [1]$을 이용하면 다음과 같은 식을 얻을 수 있다.
$$x_{T+1} - x_T [1] = \varepsilon_{T+1}.$$
이때 $\varepsilon_t \overset{iid}{\sim} N(0, \sigma^2)$이므로
$$ x_T [1] \sim N(x_{T+1}, \sigma ^2)$$
임을 알 수 있다.
정규분포의 성질을 이용하면 다음을 쉽게 유도할 수 있다.
$ \alpha =\int_{z_{\alpha}}^{\infty} \dfrac{1}{\sqrt{2\pi}} \exp \left( - \dfrac{x^2}{2}\right) dx$를 만족하는 $z_{\alpha}$에 대해
$$ 1-\alpha = P \left( -z_{\alpha/2} \leq \dfrac{x_T [1] - x_{T+1}}{\sigma} \leq z_{\alpha/2} \right).$$
위 식을 이용하여 $x_{T+1}$에 대한 $(1-\alpha)\%$ 신뢰구간을 구해주면
$$ x_T [1] \pm z_{\alpha /2} \sigma.$$
마찬가지로 $ x_{T+2} - x_T [2] = \varepsilon_{T+2} + \phi_1 \varepsilon_{T+1}$임을 이용하면
$$ x_T [2] \sim N(x_{T+2}, (1 + \phi_1 ^2)\sigma^2)$$
이므로, $ x_{T+2}$에 대한 $(1-\alpha)\%$ 신뢰구간은
$$x_T [2] \pm z_{\alpha/2} \sqrt{1 + \phi_1 ^2} \sigma.$$
이런식으로 계속 반복할 경우 AR 모델에서 $s$가 커질수록 $x_{T+s}$에 대한 신뢰구간도 넓어지기 때문에 불확실성이 더 커지는 한계를 가진다는 것을 알 수 있다.
.
오늘은 AR(1) 모델의 정상성을 위한 필요충분조건, AR 모델의 차수 $p$를 선택하는 법, AR 모델을 이용해 예측하는 법과 한계를 알아보았다.
다음 포스트부터는 Moving Average Model에 대해 알아보려고 한다.
오늘은 여기까지.
'FinancialTimeSeries' 카테고리의 다른 글
06. Trend-Stationarity & Unit-Root Process (0) | 2024.03.18 |
---|---|
05. Moving Average Model(2) & ARMA Model (0) | 2024.03.10 |
04. Moving Average Model(1) (1) | 2024.01.26 |
02. Autoregressive Model(1) (1) | 2024.01.14 |
01. Time Series and Stationarity (1) | 2024.01.07 |