[Data Science] 데이터 사이언스 개념 - 5.앙상블 학습

앙상블 학습 1.앙상블 학습이란 앙상블 학습 - 성능이 나오지 않는 모델을 잘 조합함으로써 강력한 성능을 끌어내는 기법 앙상블 학습을 할 때 약한 학습기로서 자주 선택되는 것이 트리라고 불리는 기법이다. 트리는 회귀 문제를 대상으로 할 경우 회귀 트리라고 부르고, 두 값을 다룰 경우는 결정트리라고 부른다. 트리의 경우 과적합하는 경향이 있는데 앙상블을 통해 정밀도를 높일 수 있다. 2.회귀 트리 회귀 트리 - 특징량을 이용해 데이터를 몇개의 그룹으로 나누고 그룹의 편균 값을 예측값으로 하는 방법 회귀트리는 해석성이 높아 선형회귀로는 파악할 수 없는 관계를 추출 할 수도 있다. 회귀트르니는 과적합 되기 쉬우므로 교차검증법 등으로 트리를 가지치기하는 방법을 사용한다. 3.부트스트랩과 배깅 부트스트랩 - 가설..