Data scientist/Data analysis

[Data analysis] 계단식 변화가 있는 곳엔 집군분석 (데이터 분석의 힘 chapter.4)

반응형

 

 

 

계단식 변화가 있는 곳엔 집군 분석

 

많은 경제적 유인이 계단식으로 설계 된다.(상품의 가격이나 할인, 소득세 등의 세금, 정부 보조금)

 

계단식 변화는 일정 정도의 집합군을 만들어 낸다. 

 

이 집합군 사이의 관계를 통해 인과관계를 밝혀내는 것이 바로 집군분석이다.

 

 

 

 

 

일본의 연비 정책

 

 

  1. 자동차 무게에 따라 규제치가 정해졌다. 즉 가벼운 차일수록 엄격한 규제치를 만족시켜야 하고 무거운 차일수록 규제치가 완화된다.
  2. 일본의 정책에서는 규제치가 계단식으로 변한다. 

 

이 계단식 정책은 일본 회사의 행동에 큰 영향을 끼쳤다. 

 

예를 들어 어느 자동차가 계단의 끝부분에 걸쳤다고 가정하자. 이럴때 무게를 조금 늘린다면 규제를 완화 받을 수 있다. 

 

이런 가설을 세웠을 경우 자동차의 히스토그램을 그렸을 경우 계단의 왼쪽에 차가 모여 있는 것을 예상 할 수 있다.

 

그 결과가 위와 같다.

 

 

 

집군분석과 RD 디자인의 차이

 

집군분석으로 밝힐 수 있는 인과관계는 RD 디자인과는 크게 다르다.

 

RD 디자인 -  대상이 가로축 변수를 조작할수 없다

집군 분석 - 대상이 가로축의 변수를 조작할 수 있는 상황에 적용 된다.

 

여기서 우리는 가로축 변수의 움직임에 관심이 있다. 이것이 RD 디자인과 집군분석의 차이점이다.

 

 

집군분석에 필요한 가정

 

집군분석의 가정 - 만약 연비 규제치가 계단식으로 바뀌지 않는다면 자동차 무게의 분포는 점선처럼 매끈하고 집적하지 않는다.

 

집군분석의 가정도 완전하게 입증되지는 않는다.  그래서 가정이 성립할 것이라는 증거를 최대한 열거해야 한다. 

 

증거 

  1. 연비 규제치가 변화하는 경계점 이외의 지점에서는 자동차의 분포가 전체적으로 매끈하다.
  2. 자동차 무게를 기준으로 삼는 정책은 연비 규제 정책 뿐이다.
  3. 연비 규제치에 따라 집적의 위치가 변화하는 것을 알 수 있다.

 

이러한 정보들을 통해 집군분석에 필요한 가정이 성립할 가능성이 높음을 알 수 있다.

 

 

집군분석의 강점과 약점

 

강점

  1. RCT를 실시하지 않고도 RCT와 가까운 상황을 만들어낼 수 있다

 

약점

  1. 경계점 부근에서 계단식 인센티브의 영향을 받는 대상에 대한 인과관계만 밝혀준다.

 

 

 

요약

 

집군분석은 계단식 변화를 이용하여 인과관계를 밝혀낸다.

 

집군분석의 원칙

  1. 계단식 인센티브를 분석에 이용할 수 있는지 확인한다
  2. 분석하고 싶은 변수(X)만 게딴식으로 변한다. 다른 변수는 계단의 경계점 부근에서 비연속적으로 변화하지 않는다.
  3. 인센티브가 크게 바뀌는 경계선에서의 데이터 집적을 분석함으로써 개인이나 기업이 인센티브의 변화에 어떻게 반응했는지 인과관계를 검증한다.

집군분석의 강점

  1. RCT가 실시 된 듯한 상황을 이용 할 수 있다.
  2. 결과를 그래프로 보여줌으로써 투명한 분석이 가능하다
  3. 계단식으로 인센티브가 변화하는 상황은 다양하다

집군분석의 약점

  1. 분석에 필요한 가정이 성립할 것이라는 근거를 제시할 수 는 있지만 입증할 수는 없다.
  2. 계단신 인센티브에 반응한 대상에 대해서만 인과관계를 분석할 수 있다.

 

 


이 내용들은  데이터 분석의 힘 이라는 책의 내용을 정리 및 요약한 내용입니다.

반응형