AR 모델이 정상성을 만족하는지 확인하기 위한 정리를 배웠고, MA 모델은 항상 정상성을 만족한다는 사실을 알고있다.
그렇다면 정상성을 만족하지 못하는 시계열 데이터는 어떻게 다루어야 할것인가?
그 물음에 대한 해답을 함께 찾아보자.
Def 6.1 시계열 $x_t$가 아래 식과 같이 표현 되면 추세 정상성(또는 추세 안정성, trend-stationary)을 가진다고 한다. $$ x_t = \alpha + \delta t + u_t,$$ where $\delta \neq 0$, $u_t$는 $E[u_t]=0,~Var[u_t]=\sigma_u^2$인 정상적 시계열. 이때, $\alpha + \delta t$를 확정적 추세(deterministic time trend)라고 한다. |
추세 정상성을 갖는 시계열의 평균과 분산에 대해 살펴보자.
- $E[x_t] = \alpha + \delta t$이고 이는 시간 $t>0$의 영향을 받는다. 그러므로 추세 정상적인 시계열은 정상적인 시계열이 아니라고 할 수 있다.
- 반면 $Var[x_t] = \sigma_u^2$으로 시간에 대해 불변한다. 이는 추세 정상적 시계열 $x_t$가 추세 회귀적 특성이 있다는 것을 알 수 있다. 즉, 시계열 $x_t$는 확정적 추세인 $\alpha + \delta t$로부터 멀리 벗어나지 않는다는 의미다.
만약 $\delta=0$이라면, 자연스럽게 정상적 시계열이 된다는 것을 기억해두자.
다음과 같은 추세 정상적 AR(1) 시계열 모델 $x_t$를 살펴보자.
$$ x_t = \alpha + \delta t + u_t, \tag{1}$$
$$ u_t = \phi_1 u_{t-1} + \varepsilon_t, \tag{2}$$
where $\delta \neq 0$, $|\phi_1 |<1$, $\varepsilon_t \sim WN(0, \sigma_{\varepsilon}^2)$.
$|\phi_1|<1$이기 때문에 식 (2)를 lag-operator를 통해 $u_t$에 대해 정리하면
$$ u_t = \frac{\varepsilon_t}{1- \phi_1 L} = \varepsilon_t + \phi_1 \varepsilon_{t-1} + \phi_1^2 \varepsilon_{t-2} + \cdots. \tag{3}$$
위 식 (3)을 통해 $ E[u_t] = 0, Var[u_t] = \sigma_{\varepsilon}^2 + \phi_1^2 \sigma_{\varepsilon}^2 + \phi_1^4 \sigma_{\varepsilon}^2 + \cdots = \dfrac{\sigma_{\varepsilon}^2}{1-\phi_1^2}$임을 알 수 있다.
따라서 $ E[x_t] = \alpha + \delta t, Var[x_t] =\dfrac{\sigma_{\varepsilon}^2}{1-\phi_1^2}$을 만족한다.
이는 시계열 $x_t$가 정상적 시계열이 아님을 보여준다.
식 (1)과 식 (3)을 통해 다음과 같은 식을 유도할 수 있다.
$$ x_t = \alpha + \delta t + \varepsilon_t + \phi_1 \varepsilon_{t-1} + \phi_1^2 \varepsilon_{t-2} + \cdots.$$
위 식을 통해 변동성에 대한 값의 변화율, 즉 $\partial x_{t+k} / \partial\varepsilon_t = \phi_1^k~~\text{for}~~k \le 1$을 만족한다.
이는 추세 정상적 AR(1) 시계열 모델에서 과거의 충격은 일시적임을 의미한다.
Def 6.2 시계열 $x_t$가 아래 식과 같이 표현 되면 단위근(unit-root)을 가진다고 한다. $$ x_t = \delta + x_{t-1} + u_t,$$ where $u_t$는 평균이 0인 정상적 시계열. 이때, $\delta$를 드리프트(drift)라고 한다. 또한 시계열이 단위근을 가질 때 아래 식과 같이 표현하기도 한다. $$ \Delta x_t = \delta + u_t~~\text{where}~~\Delta x_t = x_t - x_{t-1}.$$ |
위와 같은 단위근을 갖는 시계열을 다음과 같이 변형시켜보자.
위 식을 통해 다음과 같은 사실을 알 수 있다.
- $\delta \neq 0$일 때, $E[x_t] = x_0 + \delta t$이다. 즉, $E[x_t]$는 시간에 따라 선형적으로 커진다.
- $Var[x_t] = Var[ \sum_{i=1}^t u_i]$는 시간 $t$에 따라 변한다.
위 두 사실을 통해 단위근을 갖는 시계열은 항상 정상적이지 않다는 사실을 쉽게 알 수 있다.
$Var[x_t] = Var[ \sum_{i=1}^t u_i]$식을 자세히 살펴보자.
$Var[u_t]$는 상수이기 때문에 시간 $t$가 지날수록 $Var[x_t]$는 커진다.
결과적으로 단위근을 갖는 시계열 $x_t$는 시간이 지날수록 확정적 추세인 $x_0 + \delta t$로부터 멀어진다.
이는 확정적 추세로 회귀하는 특성을 가진 추세 정상적 시계열과의 차이점이다.
다음과 같은 랜덤 워크를 따르는 시계열 $x_t$를 생각해보자.
$$ x_t = \delta + x_{t-1} + \varepsilon_t~~\text{where}~~\varepsilon \sim WN(0, \sigma_{\varepsilon}^2).$$
이는 단위근을 가지는 시계열의 특별한 케이스로 $u_t$를 백색소음이라고 가정한 것이다.
위 식을 변형시키면 다음과 같은 식을 얻을 수 있다.
$$ x_t = x_0 + \delta t + \sum_{i=1}^t \varepsilon_i.$$
이때 $x_t$를 과거의 변동성 $\varepsilon_{t-k}$에 대해 편미분을 해주면 $\partial x_t / \partial \varepsilon_{t-k} = 1~~\text{for}~~ k \ge 1$.
이 식은 과거의 변동성이 지속적으로 영향을 주는 것을 의미한다.
이 또한 과거의 변동성의 영향력이 일시적이라는 추세 정상적 시계열과의 큰 차이점으로 볼 수 있다.
오늘 배운 것을 간략하게 정리해보자.
시계열은 우선 추세가 있는 시계열과 추세가 없는 시계열로 나눌 수 있다.
이때 다시 추세가 있는 시계열은 $\delta \neq 0$인 추세 정상적 시계열과 단위근을 갖는 시계열로 나뉘게 된다.
추세가 없는 시계열은 정상적 시계열과 $\delta = 0$인 단위근을 갖는 시계열로 나눌 수 있다.
오늘은 추세 정상적 시계열과 단위근을 갖는 시계열에 대해 알아보았다.
다음 포스트에서는 추세를 갖는 시계열에 대한 모델인 ARIMA 모델과 해당 시계열이 단위근을 갖는지 갖지 않는지 알아보는 단위근 검정에 대해 알아볼 예정이다.
오늘은 여기까지.
'FinancialTimeSeries' 카테고리의 다른 글
08. Unit-Root Test & Seasonality (0) | 2024.04.01 |
---|---|
07. ARIMA Model (0) | 2024.03.24 |
05. Moving Average Model(2) & ARMA Model (0) | 2024.03.10 |
04. Moving Average Model(1) (1) | 2024.01.26 |
03. Autoregressive Model(2) (2) | 2024.01.22 |