[Data Science] 데이터 사이언스 개념 - 4.회귀 모델

회귀 문제 1.일차분석과 시각화 일차 분석 -데이터의 기초통계량을 파악하고 기본적은 그래프로 그려 데이터의 개요를 이해하는 것을 일차분석이라고 한다. 데이터를 처음 받으면 확인해야 할 것 결손값 특잇값의 유무 변수 종류 스케일 파악 특징량이 많은 데이터의 경우 pandas의 describe 함수를 이용하여 평균, 표준, 편차, 최솟값, 25,50,74 분위수점등의 기본적인 통계량을 확인한다. 또한, 데이터 내의 수치변수를 히스토그램과 산포도를 통해 확인한다. 2.선형 회귀 선형회귀 -목표 변수와 특징량을 선형함수로 연결한 것 여기서 y는 목표변수, B는 계수, X1는 각 특징량을 나타낸다. 여기서는 미국 주택가격 데이터로 주택가격을 예측하는 선형회귀 분석을 한다. 여기서는 각각의 변수에 대해 주택가격이 ..

[R] R 에서 사용되는 기본적인 시각화 그래프-2

#산점도 x축과 y축으로 이루어진 그래프에 두 변수의 값을 점으로 나타낸 그래프이다. 산점도를 이용하면 두 변수의 관계를 파악하는데 용이하다. 구문 plot( x , y) - 기본구문 plot( x , y, xlab="naem1", ylab="name2") # 이런식으로 그래프의 축에 lab을 할 수 있다. # xlab, ylab 보통 구문은 plot( x, y ) 로 시작 되고 여기서는 xlab ,ylab으로 x 축 lab을 쓰고 y축 lab을 썼다, #main - title 그래프의 이름을 적는다. #pch - 점의종류 pch 를 통해 정의 모양을 바꿀수 있다. # CEX - 점의 크기 찍히는 점의 크기를 조절한다 #점크기 (cex) .8은 0.8이라는 뜻이다. # xlim , ylim -좌표측의 범..