참고 : https://otexts.com/fppkr/
[ 고급 예측 기법 ]
1. 복잡한 계절성
(1) 동적 조화 회귀
푸리에 항을 이용하여 다중 계절성을 다룰 수 있음
- 각 계절성 주기에 푸리에 항을 추가할 필요
ex) 2개의 계절성 (169일, 845일)
- \(\sin \left(\frac{2 \pi k t}{169}\right), \quad \cos \left(\frac{2 \pi k t}{169}\right), \quad \sin \left(\frac{2 \pi k t}{845}\right), \quad \text { and } \quad \cos \left(\frac{2 \pi k t}{845}\right)\).
(1) TBATS
- 1) 지수 평활 상태 공간 모델(exponential smoothing state space model)
- 2) 박스-칵스(Box-Cox) 변환
이 2가지를 고려하는 푸리에 항의 조합을 완벽히 자동화
조화 회귀 vs TBATS
- 조화회귀 : 계절성 패턴이 변하지 않고 주기적으로 반복
- TBATS : 시간에 따라 느리게 변할 수 있다는 점
TBATS 단점 :
- 특별히 긴 시계열을 추정하는데 느릴 수 있다는 것
- 공변량 (covariate) 사용 불가 ( 동적조화회귀는 가능 )
De Livera, A. M., Hyndman, R. J., & Snyder, R. D. (2011). Forecasting time series with complex seasonal patterns using exponential smoothing. J American Statistical Association, 106(496), 1513–1527. https://robjhyndman.com/publications/complex-seasonality/
2. 벡터자기회귀 (Vector Autoregressive Model)
목적 예상변수(forecast variable)는 예측변수(predictor variable)의 영향을 받지만, 반대의 경우는 영향을 받지 않는 상황을 가정했지만, 반드시 그러진 않을 수도!
- ex) 개인 소비 지출의 변화 & 개인 가처분 소득의 변화 : bidirectional
이러한 되먹임 관계(feedback relationship)는 벡터 자기회귀(VAR) 체계에서 허용!
- 다른 표현으로, 모든 변수를 “내생적(endogenous)”으로 다룬다
- Notation :
- 모든 변수를 다 \(y\)로 씀
- ex) \(y_{1,t}\) : 변수 \(y_1\)의 \(t\)번째 관측값
- 모든 변수를 다 \(y\)로 씀
한 시점 뒤의 예측값 :
\(\begin{aligned} &\hat{y}_{1, T+1 \mid T}=\hat{c}_{1}+\hat{\phi}_{11,1} y_{1, T}+\hat{\phi}_{12,1} y_{2, T} \\ &\hat{y}_{2, T+1 \mid T}=\hat{c}_{2}+\hat{\phi}_{21,1} y_{1, T}+\hat{\phi}_{22,1} y_{2, T} \end{aligned}\).
계속 반복 ..
\(\begin{aligned} &\hat{y}_{1, T+2 \mid T}=\hat{c}_{1}+\hat{\phi}_{11,1} \hat{y}_{1, T+1}+\hat{\phi}_{12,1} \hat{y}_{2, T+1} \\ &\hat{y}_{2, T+2 \mid T}=\hat{c}_{2}+\hat{\phi}_{21,1} \hat{y}_{1, T+1}+\hat{\phi}_{22,1} \hat{y}_{2, T+1} \end{aligned}\).
결정해야 하는 2가지 요소
- 1) 얼마나 많은 변수를 사용할지 (\(K\))
-
2) 얼마나 많은 시차값을 사용할지 (\(p\))
- 따라서, VAR에서 추정해야 할 계수의 개수는 \(K+pK^2\)
- 총 \(K\)개의 식
- 식 당 \((1+pK)\)개의 계수
Tip
- 실제로 사용할때는, “상관관계가 있는(쓸모 있는)” 변수만을 포함한다 ( 너무 크지 않은 \(K\) 설정 )
- 넣을 시차 (\(p\)) 고려 시, 흔히 “정보 기준(information criteria)” 사용
3. NN
생략하기
4. Bootstrapping & Bagging
생략하기