참고 : https://otexts.com/fppkr/
[ 몇 가지 실제 예측 문제 ]
1. Croston’s method
주로 “상품에 대한 수요값으로 구성되는 시계열”에 적용
원본 시계열을… 시간 범위 안에서
- TS 1) 0값을 포함하는 시계열
- TS 2) 0이 없는 시계열
총 2개의 시계열로 나눈다.
Notation
-
\(q_i\) = 0이 아닌 \(i\)번째 값
- \(a_i\) = \(q_{i-1}\) & \(q_i\) 사이의 시간
- \(j\) : 마지막 양(+)의 관측값에 대한 시간
위의 TS 1), TS 2) 두 개의 시계열에 대한 “단순 지수 평활”예측값이 들어간다.
- \(q\)는 종종 “수요(demand)”
- \(a\)는 “도착 간격 시간(inter-arrival time)”
이라고 부른다.
Modeling
- \(\hat{q}_{i+1 \mid i}\) : \((i+1)\) 번째 수요 ( with 수요 \(i\) 까지의 데이터 )
- \(\hat{a}_{i+1 \mid i}\) : \((i+1)\) 도착 간격 시간 ( with 수요 \(i\) 까지의 데이터 )
\(\begin{aligned} &\hat{q}_{i+1 \mid i}=(1-\alpha) \hat{q}_{i \mid i-1}+\alpha q_{i} \\ &\hat{a}_{i+1 \mid i}=(1-\alpha) \hat{a}_{i \mid i-1}+\alpha a_{i} \end{aligned}\).
- \(\alpha\) : 평활 매개변수 (smoothing parameter)
- \(q\), \(a\) 추정에 있어서 “동일한 \(\alpha\)“를 사용한다고 가정
최종 예측 값 : \(\hat{y}_{T+h \mid T}=q_{j+h \mid j} / a_{j+h \mid j}\).
2. 예측값이 특정 범위 안에 있도록
다양한 case들
- ex) 예측값이 양수에 국한
- ex) 예측값이 특정 범위 [a,b]에 국한
(1) 양수 예측값
Box-Cox 변환 매개변수를 \(\lambda=0\)로!
( 즉, 그냥 log 단위에서 작업 하기 )
(2) 어떤 범위 안에 제한된 예측값
Logit 변환 사용
- \(y=\log \left(\frac{x-a}{b-x}\right)\).
변환을 되돌리기 위해..
- \(x=\frac{(b-a) e^{y}}{1+e^{y}}+a\).ㄹ