[R] R 을 활용한 데이터 탐색(Exploratory Data Analysis)
# EDA(Exploratory Data Analysis) 수집한 데이터가 들어왔을 때, 이를 다양한 각도에서 관찰하고 이해하는 과정입니다. 한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다. 여기서는 7가지 단계로 EDA로 하겠습니다. # 1.데이터 탐색 # 2.결측치(NA) 처리 # 3.이상치(outlier) 발견 처리 # 4.리코딩(코딩 변경) # 5.파생변수, 가변수 # 6.시각화 # 7.의사결정 ※여기서 의사결정 부분은 데이터를 통해 결정하는 과정으로 생략하겠습니다. # 1.데이터 탐색 데이터를 확인하는 작업 # 2.결측치(NA) 처리 데이터 분석을 하는데 방해가 되는 NA 값을 처리한다. 결측치는 보통 중위수나 평균값 또는 0 / 삭제 이런 방식을..