Base/R

[R] R 데이터 가공을 위한 기본적인 함수

반응형

#ddply 

- 데이터 프레임(d)을 입력으로 받아 데이터 프레임(d)을 내보내는 함수 

-구문

ddply(데이터, .() - 그룹지을 변수명, 처리조건 , function() -처리함수)

 

 

 

 

#rehape 패키지

 

#melt

- melt 는 식별자id, 측정 변수variable, 측정치value 형태로 데이터를 재구성하는 함수이다

 즉 가로로 된 데이터를 세로로 만든다.

-구문

melt(데이터를 구분하는 식별자, 측정대상 변수 , 측정치)

 

 

 

#cast 

- 동일한 결과를 리턴하는데 data.frame으로 만드는 함수

dcast( )는 결과로 데이터 프레임을 반환하며, acast( )는 벡터, 행렬, 배열을 반환

-구문

dcast(데이터 , 컬럼+컬럼+컬럼+~... <-나머지 컬럼포함)

 

 

 

 

#data.table 패키지 - 데이터 테이블을 원하는 식으로 출력하는 함수

#data.table(행의 정보 , 가져올 속성 값) 패키지

 

 

 

 


 

#readxl - 외부 파일 읽어 들이는 패키지

 

 

# 같은 출력 다른 구문

 

 

 

#bind_rows

- 셀을 기준으로 결합한다. 세로 결합

-구문

#bind_rows(value1,value2)

 

 

 


 

join 종류

데이터를 가로로 결합한다.

# left_join : 지정한 변수와 데이터세트1을 기준으로 데이터 세트 2에 있는 나머지 변수 결합 (차집합)
# inner_join: 데이터 세트 1과 데이터 세트 2에서 기준으로 지정한 변수값이 동일할 때만 결합된다. (교집합)
# full_join : 전체를 결합 (합집합)

 

 

 

 


 

#descr::freq()

- 빈도수를 체크하는 함수

-구문

freq(데이터,plot =T (그래프를 보이게끔한다) , main ="제목")

 

반응형