본문 바로가기
카테고리 없음

인과와 법칙을 연결하는 확률적 인과모형 완전 입문과 개입 설계의 실무형 해설

by benefitpd 2025. 11. 3.

인과와 법칙을 연결하는 확률적 인과모형 완전 입문과 개입 설계의 실무형 해설

이 글은 예측 정확도를 넘어 실제로 무엇을 바꾸면 결과가 달라지는지를 밝혀야 하는 실무 환경을 전제로 인과와 법칙을 한데 묶어 설명한다. 상관과 인과의 구분. 혼란변수와 충돌변수. 심슨의 역설 같은 함정을 먼저 짚고. 흄적 법칙관이 말하는 규칙성의 최적 요약과 비흄적 견해가 주장하는 필연성의 차이를 간결하게 대비한다. 이어서 방향성 비순환 그래프인 DAG로 인과 가설을 시각화하고 백도어·프런트도어 기준과 do 연산을 통해 개입효과를 식별하는 원리를 단계별로 전개한다. 관찰연구에서의 층화와 성향점수 매칭. 가중치와 이중강건 추정. 무작위배정 실험의 장점과 외삽 한계. 측정오차와 누락 교란에 대처하는 도구변수 접근과 민감도 분석 절차를 실제 의사결정 문서 형식으로 제시한다. 마지막으로 전이성과 불변성 개념을 사용해 한 환경에서 얻은 효과가 다른 맥락에서도 유지되는지를 점검하는 방법을 설명하여. 독자가 데이터의 상관을 책임 있는 개입 설계로 번역하는 일관된 루틴을 갖추도록 돕는다.

 

예측을 넘어 개입을 설계하기 위한 인과와 법칙의 좌표

실무자는 모델의 점수가 아니라 변화를 만드는 지렛대를 원한다. 고객 이탈을 정확히 예측해도 그 예측이 통제 불가능한 특성에 기대면 정책으로 연결되지 않는다. 반대로 효과 크기가 다소 작더라도 우리가 현실적으로 조정할 수 있는 변수가 인과 경로의 관문에 놓여 있다면 그 변수가 진짜 레버가 된다. 여기서 법칙 논의가 들어온다. 흄적 법칙관은 세계를 시간과 공간에 흩어진 사실들의 모자이크로 보고. 법칙을 그 모자이크를 가장 단순하고 강력하게 요약하는 규칙들의 집합으로 이해한다. 이 관점은 반복되는 규칙성이 법칙이라는 사실 기술의 지위에 머물며 사태를 ‘지배’하는 초월적 힘까지 가정하지 않는다. 그러므로 확률 법칙도 빈도와 경향의 안정적 패턴을 간결하게 기술하는 규칙으로 해석된다. 반대로 비흄적 관점은 법칙에 일정한 필연성이나 지배력을 부여한다. 어떤 속성들의 본질적 결속이나 세계의 구조적 관계가 법칙을 성립시킨다고 본다. 실무 관점에서 중요한 점은. 어느 쪽 해석을 택하든 우리가 신뢰하는 효과는 반사실적 안정성. 즉 배경조건과 작은 교란에도 유지되는 불변성에 기대야 한다는 사실이다. 인과 추론은 바로 이 불변 경로를 찾아내는 기술이다. 왜 상관이 인과가 아닌가. 둘이 함께 움직일 때 제삼의 원인에 의해 동시에 움직였을 가능성이 있고. 표본이 특정 조건에서만 뽑혔을 때는 충돌변수로 인해 가짜 상관이 생긴다. 층을 나누면 방향이 뒤집히는 심슨의 역설도 흔하다. 따라서 데이터에 앞서 인과 가설을 명시해야 하며. 그 언어가 DAG다. DAG의 화살표는 메커니즘의 방향 가정이며. 어떤 변인이 다른 변인의 분포를 생성하는 경로를 가리킨다. 이 그림이 있으면 ‘무엇을 조정해야 백도어를 닫을지’. ‘어떤 경로는 건드리면 안 되는지’. ‘실험이 불가능할 때 어떤 우회로가 있는지’를 체계적으로 따질 수 있다. 서론의 목표는 독자가 인과와 법칙의 사유틀을 예측 모형 위에 얹어. 질문 자체를 바꾸도록 돕는 것이다. 우리는 정확히 맞히는 사람이 아니라. 바꿀 수 있는 것을 찾아 바꾸는 사람이어야 한다. 그 전환이 일어나면. 같은 데이터로도 더 나은 결론과 실행이 가능해진다. 이제 본론에서 DAG와 do 연산. 식별과 추정의 분리. 설계와 진단을 아우르는 루틴을 상세히 제시한다.

 

DAG·do 연산·식별과 추정의 분리. 그리고 흄적 법칙관을 토대로 한 실무 루틴

첫 단계는 문제의 결과 변수 Y와 후보 원인 X를 정하고 도메인 지식으로 DAG 초안을 그리는 일이다. 변수는 역할별로 라벨링 한다. 공통원인인 혼란 Z. 선택 기준 S. 매개 M. 측정오차 U 같은 표기를 미리 정해 두면 논의가 빨라진다. 이 DAG를 바탕으로 식별과 추정을 분리한다. 식별은 개입확률 P(Y|do(X=x))을 관찰자료로 표현할 수 있는가의 문제이며. do는 외부에서 X를 강제로 설정한다는 기호이므로 단순 조건부와 다르다. 백도어 기준은 X와 Y의 공통원인을 조건집합으로 차단하면 개입효과를 복구할 수 있다고 말해 준다. 매개를 성급히 통제하면 총효과가 깨지고. 충돌변수에 조건을 걸면 가짜 경로가 열려 편향이 커진다. 프런트도어 기준은 X→M→Y 경로가 분리되어 있을 때 M을 이용해 직접 백도어를 우회하는 전략이다. 이 모든 규칙은 do-연산의 세 가지 변환 규칙으로 형식화된다. 식별이 끝나면 비로소 추정이다. 회귀는 하나의 수단일 뿐이며 계수를 인과효과로 자동 해석해서는 안 된다. 관찰연구에서는 층화와 성향점수 매칭. 역확률가중치. 이중강건 추정으로 교란을 줄인다. 측정오차는 약화 편향을 낳으므로 반복 측정과 캘리브레이션. 보조 데이터 결합으로 신뢰도를 올린다. 누락 교란에 대해서는 도구변수를 고려하되. 관련성과 배제제약을 문서로 명시하고 민감도 분석으로 가정의 취약성을 드러낸다. 무작위배정 실험은 기본적으로 백도어를 닫아주지만 비순응과 이탈. 샘플 편향과 외삽 실패 가능성이 크다. 의도한 치료효과와 국소 평균 치료효과를 분리 보고하고. 순응도 분석과 사전 등록을 지키는 것이 안전하다. 전이성은 또 하나의 관문이다. 한 조직에서 추정된 효과가 다른 도메인에서도 유지될지 확인하려면 불변성 테스트가 필요하다. 핵심 경로의 계수와 잔차 패턴이 환경 바뀜에도 안정적인지 점검하고. 변화하는 변수를 공변량 이동으로 보정하거나. 구조 방정식 일부를 고정해 반사실적 예측을 실행한다. 여기서 흄적 법칙관의 실무적 장점이 드러난다. 법칙을 ‘모자이크의 최적 요약’으로 이해하면 우리에게 중요한 것은 초월적 필연성을 주장하는 일이 아니라. 다양한 배경조건에서 반복적으로 유지되는 요약 규칙을 찾고 문서화하는 일이다. 그러려면 가정표와 DAG. 조정집합. 실패한 모델을 포함한 로그를 남겨야 한다. 정책 집행에서는 윤리와 공정성도 DAG 위에서 다룬다. 집단 특성을 단순 제거하면 필요한 경로까지 절단해 오히려 불공정해질 수 있으므로. 개입 효과의 경로별 분해와 카운터페이셜 공정성 지표를 함께 보고한다. 실무 루틴을 정리하면 다음과 같다. 문제 정의와 지표 설정. 인과맵 작성과 가정 근거 기록. 식별 전략 선택. 데이터 설계와 수집 편향 점검. 추정과 진단 그리고 민감도 분석. 반사실적 검증과 홀드아웃 환경 점검. 전이성 조건 문서화와 모니터링 계획 수립. 각 단계는 체크리스트 형태로 반복 가능하게 만들어야 조직에 학습 루프가 생긴다.

 

법칙과 개입을 잇는 다리. 불변 경로를 찾고 유지하는 실행의 철학

좋은 인과 분석은 화려한 스토리를 짓는 일이 아니라 취약한 가정을 끝까지 드러내는 일이다. 우리는 무엇을 안다고 가정했고 그 가정이 어디에서 깨질 수 있는지. 그때 어떤 대체 경로를 시험할 것인지를 미리 적어 둬야 한다. 흄적 관점이 주는 교훈은 분명하다. 법칙은 모자이크를 가장 잘 요약하는 규칙이다. 그러므로 우리가 추정한 효과가 법칙에 가깝다는 뜻은 그것이 다양한 맥락에서 간결하면서도 예측력이 높고. 무엇보다 개입이 일어나도 안정적으로 유지되는 불변식에 기대고 있다는 뜻이다. 실무에서 이 기준을 구현하려면 세 가지 원칙이 필요하다. 첫째. 설명 가능한 변화만을 약속한다. DAG로 경로를 설명문으로 옮기고 조정집합을 명시하며. 총 효과와 직접·간접효과를 구분해 보고한다. 둘째. 투명한 실패를 장려한다. 실패한 모델과 깨진 가정. 외삽의 한계를 로그로 남겨 다음 실험의 비용을 줄인다. 셋째. 실행의 피드백 루프를 설계한다. 롤아웃 단계에서 순응도와 부작용 지표를 모니터링하고. 사전에 정한 중단 규칙과 업데이트 규칙으로 모델을 개정한다. 이 세 가지가 지켜지면 인과는 학술용 장식이 아니라 조직의 의사결정 언어가 된다. 오늘 당장 할 일은 단순하다. 해결하려는 결과 하나를 고르고. 현실적으로 조정 가능한 후보 변수를 세 개만 적은 뒤. 그 사이의 인과 방향을 가설로 그려라. 그 그림에서 백도어를 닫기 위한 최소 조정집합을 찾고. 식별 가능 여부를 검토한 후. 추정과 진단 계획을 별도로 문서화하라. 마지막으로 전이성 검증을 위해 어떤 환경과 기간에서 재현성을 확인할지 미리 합의하라. 이렇게 하면 데이터가 말하는 상관을. 법칙에 가까운 불변 경로로 다듬어. 실제로 변화를 일으키는 개입으로 연결할 수 있다. 책임 있는 인과 추론은 곧 실행의 철학이며. 그 철학은 투명한 가정과 반복 가능한 절차라는 아주 단순한 습관에서 시작된다.