참고 : https://otexts.com/fppkr/

[ 몇 가지 실제 예측 문제 ]

1. Croston’s method

주로 “상품에 대한 수요값으로 구성되는 시계열”에 적용


원본 시계열을… 시간 범위 안에서

  • TS 1) 0값을 포함하는 시계열
  • TS 2) 0이 없는 시계열

총 2개의 시계열로 나눈다.


Notation

  • \(q_i\) = 0이 아닌 \(i\)번째 값

  • \(a_i\) = \(q_{i-1}\) & \(q_i\) 사이의 시간
  • \(j\) : 마지막 양(+)의 관측값에 대한 시간


위의 TS 1), TS 2) 두 개의 시계열에 대한 “단순 지수 평활”예측값이 들어간다.

  • \(q\)는 종종 “수요(demand)”
  • \(a\)는 “도착 간격 시간(inter-arrival time)”

이라고 부른다.


Modeling

  • \(\hat{q}_{i+1 \mid i}\) : \((i+1)\) 번째 수요 ( with 수요 \(i\) 까지의 데이터 )
  • \(\hat{a}_{i+1 \mid i}\) : \((i+1)\) 도착 간격 시간 ( with 수요 \(i\) 까지의 데이터 )


\(\begin{aligned} &\hat{q}_{i+1 \mid i}=(1-\alpha) \hat{q}_{i \mid i-1}+\alpha q_{i} \\ &\hat{a}_{i+1 \mid i}=(1-\alpha) \hat{a}_{i \mid i-1}+\alpha a_{i} \end{aligned}\).

  • \(\alpha\) : 평활 매개변수 (smoothing parameter)
  • \(q\), \(a\) 추정에 있어서 “동일한 \(\alpha\)“를 사용한다고 가정


최종 예측 값 : \(\hat{y}_{T+h \mid T}=q_{j+h \mid j} / a_{j+h \mid j}\).


2. 예측값이 특정 범위 안에 있도록

다양한 case들

  • ex) 예측값이 양수에 국한
  • ex) 예측값이 특정 범위 [a,b]에 국한


(1) 양수 예측값

Box-Cox 변환 매개변수를 \(\lambda=0\)로!

( 즉, 그냥 log 단위에서 작업 하기 )


(2) 어떤 범위 안에 제한된 예측값

Logit 변환 사용

  • \(y=\log \left(\frac{x-a}{b-x}\right)\).


변환을 되돌리기 위해..

  • \(x=\frac{(b-a) e^{y}}{1+e^{y}}+a\).ㄹ