( 참고 : Fastcampus 강의 )

[ Deconvolutional Network (2010) ]

1. FCN의 문제점

사전에 정해놓은 receptive field를 사용하기 때문에, 너무 작은 물체는 인식되지 않을 수 있고, 너무 큰 물체는 여러 개의 작은 물체로 인식될 수도 있다.

즉, 여러 번의 “convolutional layer + pooling” 과정을 통해 해상도가 줄어들고, 이를 다시 upsampling하는 방식을 사용함으로 인해, detail이 사라질 수 있다.

Max pooling시,

여기서 (2)를 저장하는 variable이 switch variable이다.

FCN보다 더 세부적으로 segmentation이 잘 이루어진 것을 확인할 수 있다.

VGG 두개를 붙이면…too heavy한 모델! overfitting 염려

이를 해결하기 위한 테크닉으로…

(1) Batch Normalization
(2) Data Augmentation
- Pascal VOC 데이터를 300만장으로!
(3) 2-stage training
- ( Pre-train ) 쉬운 image : centered, small object size variance (20만 장)
- ( Fine-tuning ) 어려운 image : various position, size variance (270만 장)

( EDeconvNet : FCN과 DeconvNet을 앙상블한 모델 )