(1) p(x)=∫p(x,z)dz
(2) logp(x)=log∫p(x,z)dz.
(3) logp(x)=log∫q(z∣x)p(x,z)q(z∣x)dz.
Jensen: logE[X]≥E[logX]
(4) logp(x)=log∫q(z∣x)p(x,z)q(z∣x)dz≥∫q(z∣x)logp(x,z)q(z∣x)dz.
ELBO: L(x)=Eq(z∣x)[logp(x,z)−logq(z∣x)]
(5) L(x)=Eq(z∣x)[logp(x,z)]−Eq(z∣x)[logq(z∣x)].
(6) L(x)=Eq(z∣x)[logp(x∣z)]+Eq(z∣x)[logp(z)]−Eq(z∣x)[logq(z∣x)].
- DKL(q(z∣x)‖p(z))=Eq(z∣x)[logq(z∣x)−logp(z)].
(7) L(x)=Eq(z∣x)[logp(x∣z)]−DKL(q(z∣x)‖p(z)).
결론: LVAE=DKL(q(z∣x)‖p(z))−Eq(z∣x)[logp(x∣z)].