Causal Inference - Part 6
Contents
- ML vs. CI
- ML에서 CI의 필요성
- ML in CI
- CI 기반의 ML
- ML을 활용한 CI 보조
- DL 기반 CI 모델
1. ML vs. CI
항목 | 머신 러닝 (ML) | 인과 추론 (CI) |
---|---|---|
목표 | 예측 (예: $P(Y \mid X)$) | 인과 효과 추정 (예: $P(Y \mid \text{do}(X))$) |
학습 방식 | 주어진 데이터로 패턴 학습 | 개입 또는 반사실 시나리오 고려 |
전제 | i.i.d. (독립 동일 분포), 상관관계 중심 | 인과 구조, 개입 및 반사실 기반 |
한계 | 개입 상황에서 잘 작동 안 함 | 개입/정책/설명에 강함 |
2. ML에서 CI의 필요성
- 일반화 (Generalization):
- 데이터 분포가 바뀌면 기존 ML모델은 성능 저하 (e.g., covariate shift, concept drift)
- 인과 모델은 도메인 간 전이 학습(domain adaptation)에 강함
- 정책 결정 / 개입 추천:
- 다양한 분야에서 “무엇을 하면 결과가 바뀔까?”라는 질문에 답하려면 인과 추론이 필요!
- 설명가능성 (Explainability):
- 상관관계가 아닌 “원인-결과” 관계를 알려줌
3. ML in CI
(1) CI 기반의 ML
(SCM 또는 RCM 기반) CI 구조 + ML 모델
- e.g., 인과 그래프 (CI)를 학습 (ML)
- e.g., 인과 관계 (CI) 를 반영한 예측모델 (ML) 설계
Example
$Y = f(X, \text{do}(T))$.
- $T$: 개입 변수, $X$: 공변량, $Y$: 결과
$\rightarrow$ 인과 그래프를 이용해 backdoor adjustment로 보정
(2) ML을 활용한 CI 보조
머신러닝 기법을 이용해 인과 추론의 각 단계를 자동화하거나 강화함:
단계 | 인과 추론 작업 | 머신러닝 활용 예 |
---|---|---|
인과 구조 학습 | DAG 구조 학습 | GNN, NOTEARS 등 |
반사실 추정 | $Y(0), Y(1)$ 추정 | TARNet, CFRNet, GANITE 등 |
효과 추정 | ATE, ITE 등 | X-Learner, T-Learner, S-Learner 등 |
변수 선택 | Confounder 탐지 | Representation learning, Invariant learning |
(3) DL 기반 CI 모델
a) TARNet / CFRNet
- 목적: 조건부 인과 효과 (CATE: Conditional Average Treatment Effect) 추정
- 핵심: 처치군과 대조군을 shared representaiton space로 매핑
b) GANITE
- 목적: 개별 인과 효과 (ITE: Individual Treatment Effect) 추정
- 핵심: GAN 기반으로 잠재 결과 Y(0), Y(1) 생성
c) CausalBERT
- Text-based 인과 추론
- BERT를 fine-tune하여 treatment, outcome 관계 파악
자세한건 다음 포스트에!