참고 : https://otexts.com/fppkr/

[ 지수 평활 ]

과거 관측값의 가중평균(weighted average)

  • [part 1] 구체적인 작동 방식
  • [part 2] 지수평활 기법의 기초를 이루는 통계적인 모델

1. 단순 지수 평활 ( simple exponential smoothing, SES )

단순 series

  • 단순 기법 : \(\hat{y}_{T+h \mid T}=y_{T}\)

  • 단순 평균 : \(\hat{y}_{T+h \mid T}=\frac{1}{T} \sum_{t=1}^{T} y_{t}\)

  • 단순 지수 평활 : \(\hat{y}_{T+1 \mid T}=\alpha y_{T}+\alpha(1-\alpha) y_{T-1}+\alpha(1-\alpha)^{2} y_{T-2}+\cdots\)

    • \(0 \leq \alpha \leq 1\) : 평활 매개 변수
      • 클수록, 최근에 더 가중치
      • 작을수록, uniform


2가지 표현 방법

  • 1) 가중 평균 형태
  • 2) 성분 형태


1) 가중 평균 형태

  • 시간 \(T+1\)에 대한..

    • 예측값 : \(\hat{y}_{T \mid T-1}\)
    • 관측값 : \(y_{T}\)
  • 예측값 : \(\hat{y}_{T+1 \mid t}=\alpha y_{T}+(1-\alpha) \hat{y}_{T \mid T-1}\)

    • \(\hat{y}_{T+1 \mid T}=\sum_{j=0}^{T-1} \alpha(1-\alpha)^{j} y_{T-j}+(1-\alpha)^{T} \ell_{0}\).

      where \(l_0\) : 첫 번째 fitted value


2) 성분 형태

  • 구성 : 각 성분에 대한 “예측식”과 ““평활식”“으로 구성
\[\begin{aligned} \text { Forecast equation } & \hat{y}_{t+h \mid t} =\ell_{t} \\ \text { Smoothing equation } & \ell_{t} =\alpha y_{t}+(1-\alpha) \ell_{t-1} \end{aligned}\]
  • \(h=1\)일 경우, fitted value
  • \(t=T\)일 경우, training data 이후의 예측값


평평한 예측값

\(\hat{y}_{T+h \mid T}=\hat{y}_{T+1 \mid T}=\ell_{T}, \quad h=2,3, \ldots\).

  • 모든 예측값이 마지막 수준 성분과 같은 값
  • 시계열에 추세나 계절 성분이 없을 때 사용


최적화

필요한 초기값 :

  • 평활 매개변수 \(\alpha\)
  • 초기 예측값 \(l_0\)

SSE로 풀기

  • \(\mathrm{SSE}=\sum_{t=1}^{T}\left(y_{t}-\hat{y}_{t \mid t-1}\right)^{2}=\sum_{t=1}^{T} e_{t}^{2}\).


2. 추세 기법

(1) 홀트의 선형 추세 기법

( 단순 지수 평활 )

  • (1개의) 예측식
  • 1개의 평활식

\(\begin{aligned} \text { Forecast equation } & \hat{y}_{t+h \mid t} =\ell_{t} \\ \text { Smoothing equation } & \ell_{t} =\alpha y_{t}+(1-\alpha) \ell_{t-1} \end{aligned}\).


( 홀트의 선형 추세 기법 )

  • (1개의) 예측식
  • 2개의 평활식 ( 수준 (Level) & 추세 (Trend) )
\[\begin{aligned} \text { Forecast equation } & \hat{y}_{t+h \mid t} =\ell_{t}+h b_{t} \\ \text { Level equation } & \ell_{t} =\alpha y_{t}+(1-\alpha)\left(\ell_{t-1}+b_{t-1}\right) \\ \text { Trend equation } & b_{t} =\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) b_{t-1} \end{aligned}\]


Summary

  • \(l_t\) : \(t\) 시점에서의 “수준 추정 값”
    • \(0 \leq \alpha \leq 1\) : 수준에 대한 매개변수
  • \(b_t\) : \(t\)시점에서의 “추세(기울기) 추정 값”
    • \(0 \leq \beta^{*} \leq 1\) : 추세(기울기)에 대한 매개변수


[ Level Equation ]

  • (단순 지수 평활) \(\ell_{t} =\alpha y_{t}+(1-\alpha) \ell_{t-1}\)
  • (홀트의 선형추세법) \(\ell_{t} =\alpha y_{t}+(1-\alpha)\left(\ell_{t-1}+b_{t-1}\right)\)
    • \(\ell_{t-1}+b_{t-1}\) = one-step-ahead training forecast ( 한 단계 앞선 예측 )


[ Trend Equation ]

\(b_{t} =\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) b_{t-1}\).

  • 1) 추세의 이전 추정 값 : \(\ell_t - \ell_{t-1}\)
  • 2) 이전의 추세식 \(b_{t-1}\)

\(\rightarrow\) 이 둘의 가중 평균


(2) 감쇠 추세 기법 ( 감쇠 홀트(damped Holt) 기법 )

  • 홀트(Holt)의 선형 기법으로 얻은 예측값은 미래에도 계속 일정한 (증가 또는 감소) 추세

\(\rightarrow\) 미래 어느 시점에 추세를 평평하게 감쇠시키는 한 가지 매개변수를 도입 ( \(0<\phi<1\) )


\(\begin{aligned} \hat{y}_{t+h \mid t} &=\ell_{t}+\left(\phi+\phi^{2}+\cdots+\phi^{h}\right) b_{t} \\ \ell_{t} &=\alpha y_{t}+(1-\alpha)\left(\ell_{t-1}+\phi b_{t-1}\right) \\ b_{t} &=\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) \phi b_{t-1} . \end{aligned}\).


매개변수 \(\phi\)

  • \(\phi=1\) : 홀트의 선형기법
  • \(h \rightarrow \infty\) 일수록, 예측치는 \(\ell_{T}+\phi b_{T} /(1-\phi)\) 로 수렴
    • 단기 예측값은 “추세”
    • 장기 예측값은 “상수”
  • \(\phi\)가 작을수록, “감쇠 효과 STRONG”
  • 보통 \(\phi\)는 0.8~0.98


3. 홀트-윈터스의 계절성 기법

홀트-윈터스의 계절성 기법

  • (1개의) 예측식
  • 3개의 평활식
    • \(\ell_t, b_t, s_t\) : 수준/추세/계절성분
    • \(\alpha, \beta^{*}, \gamma\) : 평활 매개 변수
    • \(m\) : 계절성의 주기
      • ex) 분기별 데이터 : \(m=4\), 월별 데이터 : \(m=12\)


2가지 변형

  • 1) 덧셈 기법 : 계절성 변동이 시계열에 걸쳐 일정할 때
  • 2) 곱셈 기법 : 계절성 변동이 시계열에 걸쳐 비례할 때


(1) 덧셈 기법

\(\begin{aligned} \hat{y}_{t+h \mid t} &=\ell_{t}+h b_{t}+s_{t+h-m(k+1)} \\ \ell_{t} &=\alpha\left(y_{t}-s_{t-m}\right)+(1-\alpha)\left(\ell_{t-1}+b_{t-1}\right) \\ b_{t} &=\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) b_{t-1} \\ s_{t} &=\gamma\left(y_{t}-\ell_{t-1}-b_{t-1}\right)+(1-\gamma) s_{t-m} \end{aligned}\).


[ Level Equation ]

\(\ell_{t} =\alpha\left(y_{t}-s_{t-m}\right)+(1-\alpha)\left(\ell_{t-1}+b_{t-1}\right)\).

  • 1) 계절성으로 조정된 관측값 : \(y_t - s_{t-m}\)
  • 2) 시간 \(t\)에 대한 “비계절성 예측” : \(\ell_{t-1}+b_{t-1}\)


[ Trend Equation ]

  • 홀트의 선형기법과 동일


[ Seasonality Equation ]

\(s_{t} =\gamma\left(y_{t}-\ell_{t-1}-b_{t-1}\right)+(1-\gamma) s_{t-m}\).

  • 1) 현재 계절성 지수 : \(y_{t}-\ell_{t-1}-b_{t-1}\)
  • 2) 이전 년도 같은 계절 (=\(m\)시전 이전)의 계절성 지표 : \(s_{t-m}\)


(2) 곱셈 기법

  • 곱셈이라 해서, “모든게 곱셈”이 아니라, “계절성이 곱셈”인 것

\(\begin{aligned} \hat{y}_{t+h \mid t} &=\left(\ell_{t}+h b_{t}\right) s_{t+h-m(k+1)} \\ \ell_{t} &=\alpha \frac{y_{t}}{s_{t-m}}+(1-\alpha)\left(\ell_{t-1}+b_{t-1}\right) \\ b_{t} &=\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) b_{t-1} \\ s_{t} &=\gamma \frac{y_{t}}{\left(\ell_{t-1}+b_{t-1}\right)}+(1-\gamma) s_{t-m} \end{aligned}\).


(3) 홀트 윈터스의 감쇠 기법

( 곱셈 계절성 고려 시 )

\[\begin{aligned} \hat{y}_{t+h \mid t} &=\left[\ell_{t}+\left(\phi+\phi^{2}+\cdots+\phi^{h}\right) b_{t}\right] s_{t+h-m(k+1)} \\ \ell_{t} &=\alpha\left(y_{t} / s_{t-m}\right)+(1-\alpha)\left(\ell_{t-1}+\phi b_{t-1}\right) \\ b_{t} &=\beta^{*}\left(\ell_{t}-\ell_{t-1}\right)+\left(1-\beta^{*}\right) \phi b_{t-1} \\ s_{t} &=\gamma \frac{y_{t}}{\left(\ell_{t-1}+\phi b_{t-1}\right)}+(1-\gamma) s_{t-m} . \end{aligned}\]


4. 지수 평활 기법의 분류 쳬계

figure2

figure2


5. 상태 공간 모델 (State Space Models, SSM)

지수 평활 기법에 깔린 통계적인 모델


각 모델은 2가지로 구성

  • 1) 측정식 ( measurement equation ) : 관측 O
  • 2) 상태식 ( state equation ) : 관측 X


각 기법마다, 2가지 모델 존재

  • 1) 덧셈 오차
  • 2) 곱셈 오차

이를 구분하기 위해, 세 번째 문자 하나 추가


SSM의 표기법

  • ETS = Exponential Smoothing
  • ETS(\(\cdot, \cdot, \cdot\)) : 각각 Error/Trend/Seasonal


(1) ETS(A,N,N)

ETS(A,N,N) = “덧셈 오차”를 이용하는 “단순 지수 평활”

  • Error : Additive
  • Trend : X
  • Seasonal : X


단순 지수 평활

  • Forecast equation : \(\hat{y}_{t+1 \mid t}=\ell_{t}\)

  • Level (Smoothing) equation : \(\ell_{t}=\alpha y_{t}+(1-\alpha) \ell_{t-1}\)


Level Equation 재정리

  • before ) \(\ell_{t}=\alpha y_{t}+(1-\alpha) \ell_{t-1}\)
  • after ) \(\ell_{t}=\alpha y_{t}+(1-\alpha)e_t\)
    • since \(e_{t}=y_{t}-\ell_{t-1}=y_{t}-\hat{y}_{t \mid t-1}\)


각 관측값이 이전 수준에 오차를 더한 것과 같게 두기 위해…

  • \(y_t = \ell_{t-1} + e_t\)…. where \(e_{t}=\varepsilon_{t} \sim \operatorname{NID}\left(0, \sigma^{2}\right)\)
  • 다시 쓰면,
    • \(y_{t}=\ell_{t-1}+\varepsilon_{t}\).
    • \(\ell_{t}=\ell_{t-1}+\alpha \varepsilon_{t}\).


(2) ETS(M,N,N)

ETS(M,N,N) = “곱셈 오차”를 이용한 “단순 지수 평활”


곱셈 오차 : \(\varepsilon_{t}=\frac{y_{t}-\hat{y}_{t \mid t-1}}{\hat{y}_{t \mid t-1}}\)….. where \(\varepsilon_{t} \sim \operatorname{NID}\left(0, \sigma^{2}\right)\)

\(\begin{aligned} y_{t} &=\ell_{t-1}\left(1+\varepsilon_{t}\right) \\ \ell_{t} &=\ell_{t-1}\left(1+\alpha \varepsilon_{t}\right) . \end{aligned}\).


(3) ETS(A,A,N)

ETS(A,A,N) = “덧셈 오차”를 이용한 “홀트의 선형 기법”


덧셈 오차 : \(\varepsilon_{t}=y_{t}-\ell_{t-1}-b_{t-1} \sim \mathrm{NID}\left(0, \sigma^{2}\right)\)

\(\begin{aligned} &y_{t}=\ell_{t-1}+b_{t-1}+\varepsilon_{t} \\ &\ell_{t}=\ell_{t-1}+b_{t-1}+\alpha \varepsilon_{t} \\ &b_{t}=b_{t-1}+\beta \varepsilon_{t} \end{aligned}\).


(4) ETS(M,A,N)

ETS(M,A,N) = “곱셈 오차”를 이용한 “홀트의 선형 기법”


곱셈 오차 : \(\varepsilon_{t}=\frac{y_{t}-\left(\ell_{t-1}+b_{t-1}\right)}{\left(\ell_{t-1}+b_{t-1}\right)}\)…… where \(\varepsilon_{t} \sim \operatorname{NID}\left(0, \sigma^{2}\right)\)

\(\begin{aligned} y_{t} &=\left(\ell_{t-1}+b_{t-1}\right)\left(1+\varepsilon_{t}\right) \\ \ell_{t} &=\left(\ell_{t-1}+b_{t-1}\right)\left(1+\alpha \varepsilon_{t}\right) \\ b_{t} &=b_{t-1}+\beta\left(\ell_{t-1}+b_{t-1}\right) \varepsilon_{t} \end{aligned}\).

  • 간결성을 위해, \(\beta=\alpha \beta^{*}\)