[Data Science] 데이터 사이언스 개념 - 7.비지도 학습
비지도 학습 1.K-평균법 k평균법 - 같은 클러스터 내의 데이터 점끼리 거리가 짧아지도록 데이터를 주어진 수의 클러스터로 분류하는 것 비지도 학습의 일종으로 클러스터링이다. 위와 같이 데이터가 어느 그룹에 속할지 결정하는 것이 목표이다. k 평균법 구현하는 방법 데이터를 몇 개의 클러스터로 나눌지 결정한다. 라벨을 랜덤으로 붙인다. 다음으로 각 라벨의 점의 중심을 계산해준다. 큰 라벨처럼 중심점이 정해진다. 다음으로 각 점에 가장 가까운 중심점과 같은 라벨을 다시 칠해준다. 이것을 반복하고 각 라벨의 갱신을 반복해간다. 2.계층적 클러스터링 계층적 클러스터링 - 하나하나의 데이터를 근접한 데이터와 결합함으로써 바텀업 방식으로 클러스터링하는 방법 계층적 클러스터링을 구현 하는 방법 클러스터수를 데이터 수..