Base/R

[R] R 사용자 정의 함수(FUNCTION)와 데이터 전처리를 위한 기본적인 함수

반응형

#함수

 

- FUNCTION?

 function이란, 영어 뜻 그대로 사용자 정의 함수를 정의하는 함수를 말한다. 사용자가 원하는 형식의 함수를 만들어 반복적으로 사용 할 수 있다.

기본 형태는 다음과 같다.

 

Func(함수 이름) <- function(매개변수){
}

 

#함수정의 

newSumFunc 라는 함수를 사용자가 정의해준다. 매개변수를 x와 y를 받고 이 매개변수를 더해서 result에 저장을 한 후 반환해주는 함수 형태이다.

 

#가변함수

아래와 같은경우 function(...) 으로 할경우 변수를 원하는 만큼  넣을 수 있다. 

 


 

#파생변수 - 기존의 변수들에서 새로운 변수를 추가해 만들어준다.

만들고 싶은 컬럼명에 값을 넣어준다.

stock$diff <- 라는 컬럼명을 만들고 값을 넣어준다.

 

예제

 

 

 

#while(논리값) {} - 논리값이 True가 될때 까지 계속 반복한다.

while(){

}

while(조건식){
원하는 로직
}

 

 

 

 

 

#next 해당 명령을 만나면 이 위치에서 더 진행되지 않고 반복문으로 보낸다.

#break 문을 만나면 해당 루프를 빠져나온다.

 

 

 

#NA 처리(na.rm=T , na.omit , na,pass, na.fail)

 

 

 


 

#merge(value1,value2) -데이터의 순서가 다르더라도 키를 기준으로 bind 해준다.

 

 

##doBy pacakage

#summary(value) - 요약해서 나타내는 함수

 

 

 

#summaryBy() - 평균값을 볼수 있다.

 

 

#orderby() -  원하는 기준에 따라 정렬할 수 있다.

 

 

#order() - 주어진 값을 정렬했을때의 색인 순서대로 반환

 

 

#sample(value,개수,[replace =T]) - 샘플에 따라서 추출하는 함수 (replace 옵션에 따라 복원 비복원이 나뉜다.)

 

 

 

#sampleBy(기준, 추출할 샘플의 비율, 데이터) - 데이터를 그룹으로 묶은 후 각 그룹에서 샘플을 추출하는 함수

 

 

 

 

#split(data,분류기준) - 데이터를 특정조건에 맞춰서 나눈다.

 

 

 

 

#filter(data , 조건) : 조건에 따라 행을 추출

 

 

 

#arrange(data,정렬할 변수명) -정렬함수 (기본 오름차순)

 

 

 

#select(data,조건) - 열에 대한 추출

 

 

 

 

#mutate() - 열 추가

 

 

 

# transform() - 열 추가

 

 

 

# summarise() - 기초 통계량(mean, sd(표준편차) , var, median(중위값))을 구할 수 있다.

 

 

#예제

 

 

#chain()- 다른 구문을 연결해준다 ( %>% )

 

 

 

 

# adply() -  a(배열)을 받아 d(데이터 프레임)으로 반환하는 함수

 

 

 

반응형