비지도 학습

1.K-평균법

k평균법 - 같은 클러스터 내의 데이터 점끼리 거리가 짧아지도록 데이터를 주어진 수의 클러스터로 분류하는 것

비지도 학습의 일종으로 클러스터링이다.

위와 같이 데이터가 어느 그룹에 속할지 결정하는 것이 목표이다.

k 평균법 구현하는 방법

계층적 클러스터링 - 하나하나의 데이터를 근접한 데이터와 결합함으로써 바텀업 방식으로 클러스터링하는 방법

계층적 클러스터링을 구현 하는 방법

주성분 분석 - 다수의 변수를 소수로 줄여 데이터를 다시 표현

이것을 차원감소라고 부른다.

변수에 상관관계가 없으면 유효한 방법은 아니지만, 주가의 시계열 등 변수 개수와 비교해 분산을 낳는 주요인이 적을 때 매우 효과적인 방법이다.

주성분 분석의 경우 분산을 많이 설명하는 것이 좋은 표현이다.

이 e1과 e2 두개의 벡터로 데이터 분포를 설명하는 것

데이터들의 분산이 가장 큰 방향벡터를 의미한다.

특잇값 분해 - 행렬 X에 대해서 행렬 분해를 해서 행렬을 대각화하는 방법이다.

주성분 분석과 특잇값 분해는 수학적으로 비슷한 문제를 해결한다.

본 내용은 그림으로 배우는 DataScience 데이터 과학을 참고한 내용입니다

[Data Science] 데이터 사이언스 개념 - 9.신경망이 기초(0)	2021.01.15
[Data Science] 데이터 사이언스 개념 - 8.토픽 모델 / 네트워크 분석(0)	2021.01.14
[Data Science] 데이터 사이언스 개념 - 6.분류문제(0)	2021.01.14
[Data Science] 데이터 사이언스 개념 - 5.앙상블 학습(0)	2021.01.14
[Data Science] 데이터 사이언스 개념 - 4.회귀 모델(0)	2021.01.11

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`