코로나19의 사회과학: Part 3. 인과관계를 이해하는 분석틀
박지용 교수님의 [코로나19의 사회과학]을 보고 정리한 것 (Part3)
Causal Inference(인과추론)은 수많은 요소들이 알게 모르게 상호작용하고 있는 사회과학에서 굉장히 어려운 일이다.
근본적으로 어떤 일이 일어나지 않았다면에 대한 결과를 눈으로 볼 수 없고, 1) 선택편향: 실험 그룹과 통제 그룹이 비교 가능한
집단인가 2) 역 인과관계: 무엇이 원인(선행변수)이고 무엇이 결과(후행변수)인가 라는 난적을 가지고 있다.
잠재젹 결과 프레임워크란 인과관계를 이해하는 강력한 틀 중 하나로, 우리가 일상에서 흔히 마주치는 '그 때 그랬으며 어땠을까?'
라는 생각으로 쉽게 이해해볼 수 있다. 여기서 인과효과는 이미 일어난 결과에서 원인이 없었다면 있었을 잠재적 결과를 제외한
값이 된다.
잠재적 결과 프레임워크에서 가장 중요한 것은 핵심 처치를 제외한 대부분의 요인들이 비교 가능한 대상을 찾는 것이다.
이는 Ceteris Paribus, 즉 그것만 빼고 다 같은 이라고 이야기하기도 한다. 이러한 조건을 만족시키기 위해서 가장 많이 활용하는
것이 무작위 통제실험이다. 큰 수의 법칙에 의해 무작위로 처치 여부를 결정하면, 실험 대상이 많아질수록 처치 여부를
제외한 나머지 요인들은 평균적으로 유사할 것이기 때문이다. 기업들에서 실시하는 A/B test도 무작위 통제실험에 해당한다.
인과추론 방법론의 가장 큰 약점은 일반화가 보장되지 않는다는 점인데, 어떤 샘플을 뽑아서 어떤 실험을 했는지 그 환경에 의해
결과가 상당부분 달라질 수 있기 때문이다. 그렇기에 우리는 어떤 연구결과를 해석하거나 적용할 때에
늘 실험 세팅을 주의깊게 살펴보는 연습을 해야 한다.
인과관계를 이해하는 프레임워크에는 잠재적 결과 프레임워크 외에도 내생성, 그래프 모델 등이 있다.
아래는 강의자료에 내가 직접 필기한 내용이다.
Leave a comment