[Dacon] 신용카드 사용자 연체 예측 AI 경진대회 1위 코드 분석

신용카드 사용자 연체 예측 AI 경진대회 주제 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발하는 대회였다. 배경 신용카드사는 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정한다. 신용카드사는 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측한다, 평가 - Logloss 소스 [Private 1위 0.6581] | 소회의실 | Catboost 이 소스에서는 여러가지 모델을 사용했지만 catboost가 성능이 가장 잘나왔다고 했다. catboost 같은 경우에는 범주형 변수 처리에 더 효과적인 모델링이라고 한다. 이 사람이 생각한 핵심 포인트는 아래와 같다. family_size > 7 제거 (이상치 제거) 중복데이터..