[Competition] Yonsei Data Science Competition - (주)PACKUS


https://image.news1.kr/system/photos/2019/9/4/3806955/medium.jpg


1. Introduction

  • 기간 : 2019년 9월~11월
  • Goal : 배달용기 제조회사 PACKUS의 고객 세분화 전략 & 배달용기 수요 예측

Data Science Lab 학회원들 끼리 팀을 꾸려서(4인 1조) 연세 데이터 사이언스 경진대회에 참가하였다. 이번 대회는 총 3개의 기업이 참가해서 각자 데이터를 제공해주었다. (1. 신한카드, 2. NICE 신용평가, 3. PACKUS) 이 세 기업 중 아마 PACKUS는 많이 들어보지 못했을텐데, PACKUS는 포장용기를 제조하는 삼륭물산의 계열회사이다. 세 회사의 데이터 중 최소 하나이상의 데이터를 사용해야 했고, 우리는 초반에 세 회사의 데이터를 모두 이용하여 다양한 분석을 시도해보았고, 그 결과 최종적으로 PACKUS사의 데이터를 활용하여 대회를 준비하였다.

우리는 다음과 같이 2가지 주제로 발표를 하였다.

  • 1 ) 고객 군을 세분화하여 각각의 군집에 맞는 맞춤형 전략 수립 & 고객 관리 대쉬보드
  • 2 ) 각각의 배달 용기 종류 별로 수요 예측


2. Data

1 ) 고객 정보 Data

2 ) 주문 내역 Data (2017.01~2019.07 사이의 거래 내역)

3 ) 상품 정보 Data

4 ) 기타 외부 Data ( 삼륭물산 주가 데이터, SKT 서울시 배달 업종별 이용 통화량 )


3. 발표 내용

[1] PACKUS의 현 상황

  • 내부 상황 : “성장 단계에 있는 PACKUS의 세부적 고객관리의 필요성”
    • 1) 성장 단계에 있는 PACKUS ( Active User의 증가 추세 )
    • 2 ) 성장세를 받쳐주지 못하고 있는 ‘섬세하지 못한 고객관리 체계’ ( + 불균형적인 고객 등급 제도 )
  • 외부 상황 : “배달 용기 ‘종류’ 별로 각각의 수요 예측의 필요성”

    • 1 ) 거의 모든 종류의 음식이 배달 가능 & 1인분 배달의 등장
    • 2 ) 다양해지고 있는 배달 용기의 종류

[2] SOLUTION 1. 세분화된 고객 관리

Key : ** 위에서 언급한 PACKUS의 내부 상황에 따라, **세부적으로 고객 군을 나눠서 각각에 맞는 최적의 방식으로 고객 관리

세부적인 고객관리 방안?

  • 1 ) 고객군 별 전략 4가지 측면( 1. 고객 개인 정보, 2. 주문 관련 정보, 3. 혜택 관련 정보, 4. 그 외 정보 / 총 12개의 변수 )에서 고객 들을 클러스터링 한 뒤, 각각에 맞는 전략 수립

  • 2 ) 장바구니 분석 위에서 나눈 고객군을, 이들의 장바구니를 분석하여 ( 1) 가장 많이 구매한 물품 & 2) 함께 구매할 확률이 더 높은 물품 ) 구매 물품 추천 시스템 수립

  • 3 ) 고객등급 재개편 작년에 도입한 PACKUS의 고객 등급체계가 매우 불균형적 (등급 별로 속한 인원 수의 불균형)임을 확인하고, 등급을 나누는 기준의 수정을 통해 불균형 완화 및 새로운 등급에 맞는 혜택 방안 제안

[3] SOLUTION 2. 제품 별 수요 예측

Key : ** 위에서 언급한 PACKUS의 외부 상황에 따라, **제품 별로 수요량을 예측하여 효과적으로 제고 관리

Modeling

흔히 알려진 지수평활법,ARIMA 등의 전통적인 시계열 모형은 자료의 수가 많고 정상성을 보이는 안정적인 시계열에 적합하지만, 우리의 데이터에는 맞지 않다고 생각. ( 각각의 상품에 대한 기존의 전통적인 시계열 모형으로 예측하는 것은 어렵다고 판단 )

다양한 변수를 더 추가하여, 하나의 모델로도 여러 개의 상품에 대한 분석이 가능한 ML 모델을 사용하기로 함.

  • 사용한 모델 : Extra Tree Model, Random Forest, XGBoost, Light GBM
  • CV : 시계열 Cross Validation
  • Hyperparameter tuning : Bayesian Optimization

SHAP 지수를 통해 수요량 예측에 중요한 역할을 끼치는 변수들을 파악함.

활용 방안

1 ) 데이터 수집 ( 지속적인 거래 데이터 수집 )

2 ) 모델링 ( 수요 예측 : 상품 별로 ‘다음 달’의 수요를 예측. 추후 안정적인 데이터를 가지게 되면, 상품벼롤 디테일한 모델 설정 가능 + 중장기 수요예측도 가능 )

3 ) 재고 관리 ( 다음 달 수요 예측을 통해 기존 재고와 새로 제작할 물량 간의 적정 재고량을 찾아 효과적으로 재고를 관리 )

4 ) 경영활동에 반영( 신제품 출시 할 때 참고 가능 )

[4] PACKER board (패커스의 고객관리를 위한 대시보드) 구현

위의 분석들을 진행하면서 9~10월을 보낸 것 같다. 팀원들끼리도 많이 친해졌고, 단지 분석 및 모델링만을 잘해야 하는 것이 아니라, 정말 기업에게 가치있는 (돈이 되는) 것이 무엇일까를 고민하는데에도 시간을 많이 보냈던 것 같다. 그래도 다행히 좋은 성적(최우수상)으로 대회를 마무리할 수 있어서 너무 좋았다 :)


https://www.yonsei.ac.kr/_attach/editor_image/2019-12/ckqismjwldzc.png