계단식 변화가 있는 곳엔 집군 분석
많은 경제적 유인이 계단식으로 설계 된다.(상품의 가격이나 할인, 소득세 등의 세금, 정부 보조금)
계단식 변화는 일정 정도의 집합군을 만들어 낸다.
이 집합군 사이의 관계를 통해 인과관계를 밝혀내는 것이 바로 집군분석이다.
일본의 연비 정책
- 자동차 무게에 따라 규제치가 정해졌다. 즉 가벼운 차일수록 엄격한 규제치를 만족시켜야 하고 무거운 차일수록 규제치가 완화된다.
- 일본의 정책에서는 규제치가 계단식으로 변한다.
이 계단식 정책은 일본 회사의 행동에 큰 영향을 끼쳤다.
예를 들어 어느 자동차가 계단의 끝부분에 걸쳤다고 가정하자. 이럴때 무게를 조금 늘린다면 규제를 완화 받을 수 있다.
이런 가설을 세웠을 경우 자동차의 히스토그램을 그렸을 경우 계단의 왼쪽에 차가 모여 있는 것을 예상 할 수 있다.
그 결과가 위와 같다.
집군분석과 RD 디자인의 차이
집군분석으로 밝힐 수 있는 인과관계는 RD 디자인과는 크게 다르다.
RD 디자인 - 대상이 가로축 변수를 조작할수 없다
집군 분석 - 대상이 가로축의 변수를 조작할 수 있는 상황에 적용 된다.
여기서 우리는 가로축 변수의 움직임에 관심이 있다. 이것이 RD 디자인과 집군분석의 차이점이다.
집군분석에 필요한 가정
집군분석의 가정 - 만약 연비 규제치가 계단식으로 바뀌지 않는다면 자동차 무게의 분포는 점선처럼 매끈하고 집적하지 않는다.
집군분석의 가정도 완전하게 입증되지는 않는다. 그래서 가정이 성립할 것이라는 증거를 최대한 열거해야 한다.
증거
- 연비 규제치가 변화하는 경계점 이외의 지점에서는 자동차의 분포가 전체적으로 매끈하다.
- 자동차 무게를 기준으로 삼는 정책은 연비 규제 정책 뿐이다.
- 연비 규제치에 따라 집적의 위치가 변화하는 것을 알 수 있다.
이러한 정보들을 통해 집군분석에 필요한 가정이 성립할 가능성이 높음을 알 수 있다.
집군분석의 강점과 약점
강점
- RCT를 실시하지 않고도 RCT와 가까운 상황을 만들어낼 수 있다
약점
- 경계점 부근에서 계단식 인센티브의 영향을 받는 대상에 대한 인과관계만 밝혀준다.
요약
집군분석은 계단식 변화를 이용하여 인과관계를 밝혀낸다.
집군분석의 원칙
- 계단식 인센티브를 분석에 이용할 수 있는지 확인한다
- 분석하고 싶은 변수(X)만 게딴식으로 변한다. 다른 변수는 계단의 경계점 부근에서 비연속적으로 변화하지 않는다.
- 인센티브가 크게 바뀌는 경계선에서의 데이터 집적을 분석함으로써 개인이나 기업이 인센티브의 변화에 어떻게 반응했는지 인과관계를 검증한다.
집군분석의 강점
- RCT가 실시 된 듯한 상황을 이용 할 수 있다.
- 결과를 그래프로 보여줌으로써 투명한 분석이 가능하다
- 계단식으로 인센티브가 변화하는 상황은 다양하다
집군분석의 약점
- 분석에 필요한 가정이 성립할 것이라는 근거를 제시할 수 는 있지만 입증할 수는 없다.
- 계단신 인센티브에 반응한 대상에 대해서만 인과관계를 분석할 수 있다.
이 내용들은 데이터 분석의 힘 이라는 책의 내용을 정리 및 요약한 내용입니다.
'Data scientist > Data analysis' 카테고리의 다른 글
[Data analysis] 기본적인 시계열 분석(Time Series Analysis)의 종류와 개념 설명 (0) | 2021.04.25 |
---|---|
[Data analysis] 시간의 흐름에 따라 패널 데이터 분석 (데이터 분석의 힘 chapter.5) (1) | 2021.03.27 |
[Data analysis] 급격한 변화의 경계선을 찾는 RD 디자인 (데이터 분석의 힘 chapter.3) (0) | 2021.03.15 |
[Data analysis] 최선의 데이터 분석법, RCT (데이터 분석의 힘 chapter.2) (0) | 2021.03.11 |
[Data analysis] 인과 관계와 상관 관계 (데이터 분석의 힘 chapter.1) (0) | 2021.03.11 |