[Data Science] 데이터 사이언스 개념 - 6.분류문제
분류문제 1.로지스틱 회귀 로지스틱 회귀 - 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘 출력 변수가 두가지인 데이터를 자연스럽게 모델링하고자, 0과 1이 나타나는 확률값이 출력되도록 선형회귀 모델을 확장한 것 값이 0~1사이로 들어온다. 추정은 제곱오차를 최소화하지 않고, 우도를 최대화해서 구한다. 2.선형 서포트 벡터 머신 선을 그은다음에 위면 빨간색 아닐경우 파란색 이런식으로 분류하는게 선형 서포트 벡터 머신의 요점이다. 이 선을 긋는 함수를 최대 마진 초평면이라고 한다. 이 선을 긋는걸로 분리가 잘안될떄는 슬랙변수라는 것을 정의함으로써 추정한다. 분리 초평면을 정의할 때 사..