참고 : https://otexts.com/fppkr/

[ 고급 예측 기법 ]

1. 복잡한 계절성

(1) 동적 조화 회귀

푸리에 항을 이용하여 다중 계절성을 다룰 수 있음

  • 각 계절성 주기에 푸리에 항을 추가할 필요


ex) 2개의 계절성 (169일, 845일)

  • \(\sin \left(\frac{2 \pi k t}{169}\right), \quad \cos \left(\frac{2 \pi k t}{169}\right), \quad \sin \left(\frac{2 \pi k t}{845}\right), \quad \text { and } \quad \cos \left(\frac{2 \pi k t}{845}\right)\).


(1) TBATS

  • 1) 지수 평활 상태 공간 모델(exponential smoothing state space model)
  • 2) 박스-칵스(Box-Cox) 변환

이 2가지를 고려하는 푸리에 항의 조합을 완벽히 자동화

조화 회귀 vs TBATS

  • 조화회귀 : 계절성 패턴이 변하지 않고 주기적으로 반복
  • TBATS : 시간에 따라 느리게 변할 수 있다는 점


TBATS 단점 :

  • 특별히 긴 시계열을 추정하는데 느릴 수 있다는 것
  • 공변량 (covariate) 사용 불가 ( 동적조화회귀는 가능 )
De Livera, A. M., Hyndman, R. J., & Snyder, R. D. (2011). Forecasting time series with complex seasonal patterns using exponential smoothing. J American Statistical Association, 106(496), 1513–1527. https://robjhyndman.com/publications/complex-seasonality/


2. 벡터자기회귀 (Vector Autoregressive Model)

목적 예상변수(forecast variable)는 예측변수(predictor variable)의 영향을 받지만, 반대의 경우는 영향을 받지 않는 상황을 가정했지만, 반드시 그러진 않을 수도!

  • ex) 개인 소비 지출의 변화 & 개인 가처분 소득의 변화 : bidirectional


이러한 되먹임 관계(feedback relationship)는 벡터 자기회귀(VAR) 체계에서 허용!

  • 다른 표현으로, 모든 변수를 “내생적(endogenous)”으로 다룬다
  • Notation :
    • 모든 변수를 다 \(y\)로 씀
      • ex) \(y_{1,t}\) : 변수 \(y_1\)의 \(t\)번째 관측값


한 시점 뒤의 예측값 :

\(\begin{aligned} &\hat{y}_{1, T+1 \mid T}=\hat{c}_{1}+\hat{\phi}_{11,1} y_{1, T}+\hat{\phi}_{12,1} y_{2, T} \\ &\hat{y}_{2, T+1 \mid T}=\hat{c}_{2}+\hat{\phi}_{21,1} y_{1, T}+\hat{\phi}_{22,1} y_{2, T} \end{aligned}\).


계속 반복 ..

\(\begin{aligned} &\hat{y}_{1, T+2 \mid T}=\hat{c}_{1}+\hat{\phi}_{11,1} \hat{y}_{1, T+1}+\hat{\phi}_{12,1} \hat{y}_{2, T+1} \\ &\hat{y}_{2, T+2 \mid T}=\hat{c}_{2}+\hat{\phi}_{21,1} \hat{y}_{1, T+1}+\hat{\phi}_{22,1} \hat{y}_{2, T+1} \end{aligned}\).


결정해야 하는 2가지 요소

  • 1) 얼마나 많은 변수를 사용할지 (\(K\))
  • 2) 얼마나 많은 시차값을 사용할지 (\(p\))

  • 따라서, VAR에서 추정해야 할 계수의 개수는 \(K+pK^2\)
    • 총 \(K\)개의 식
    • 식 당 \((1+pK)\)개의 계수


Tip

  • 실제로 사용할때는, “상관관계가 있는(쓸모 있는)” 변수만을 포함한다 ( 너무 크지 않은 \(K\) 설정 )
  • 넣을 시차 (\(p\)) 고려 시, 흔히 “정보 기준(information criteria)” 사용


3. NN

생략하기


4. Bootstrapping & Bagging

생략하기