[ML/DL] python 을 통한 결측값 확인 및 결측치 처리 방법

결측치란? 보통은 na값을 말한다. 0이나 이런 값은 결측치가 아니고 NaN 이런 값들을 말한다. 머신을 돌리는데 있어서 결측치가 존재하면 머신러닝을 돌릴 수 없다. 그래서 이 결측치를 다양한 방법으로 처리한다. 결측치에 대한 추가적인 내용은 여기를 간단하게 참고를 바란다. 대체법의 종류와 다중 대체법 : continuous-development.tistory.com/160?category=736685 [ML/DL] 대체법의 종류와 다중 대체법 사용법 대체법의 종류 우선, 전통적인 대체방법으로는 완전 제거법, 한쌍 제거법(pairwise deletion), 평균 대체법(mean substitution), 회귀 대체법(regression imputation), 확률적 회귀대체(stochastic imput..

[ML/DL]결측치의 종류와 결측치 처리 가이드라인

# 결측치의 종류 - 완전 무작위 결측(MCAR : Missing completely at random) 변수 상에서 발생한 결측치가 다른 변수들과 아무런 상관이 없는 경우 우리는 완전 무작위 결측(MCAR)이라고 부릅니다. 대부분의 결측치 처리 패키지가 MCAR을 가정으로 하고 있고 보통 우리가 생각하는 결측치라고 생각하시면 됩니다. 예를 들어, 데이터를 입력하는 사람이 깜빡하고 입력을 안 했다든지 전산오류로 누락된 경우 등입니다. 이러한 결측치는 보통 제거하거나 대규모 데이터 셋에서 단순 무작위 표본추출을 통해서 완벽한 데이터셋으로 만들 수 있습니다. - 무작위 결측(MAR : Missing at random) 누락된 자료가 특정 변수와 관련되어 일어나지만, 그 변수의 결과는 관계가 없는 경우를 의미..

[R] R 사용자 정의 함수(FUNCTION)와 데이터 전처리를 위한 기본적인 함수

#함수 - FUNCTION? function이란, 영어 뜻 그대로 사용자 정의 함수를 정의하는 함수를 말한다. 사용자가 원하는 형식의 함수를 만들어 반복적으로 사용 할 수 있다. 기본 형태는 다음과 같다. Func(함수 이름)