Base/R

[R] R에서 사용되는 Data.frame 과 Factor 에 사용되는 다양한 함수

반응형

#데이터 프레임(data.frame)

배열(array) 3차원 벡터로서 동일 타입의 데이터만 저장 가능하다.   

2차원 구조로서 열 단위로 서로 다른 타입의 데이터들로 구성 가능하다.   

또한 모든 열의 데이터 개수(행의 개수)는 동일해야 한다.

 

데이터 프레임 변환 :rbind(df, 백터), cbind(df, 벡터)   

데이터 프레임의 구조 확인 :str(df) 

인덱싱 : [행의인덱싱, 열의 인덱싱], [열의 인덱싱], df$칼럼 이름, [[열 인덱싱]]          

subset (df, select=컬럼명들, subset=(조건)) 
 


data.frame(value1,value2) - 데이터 프레임 생성

 

#colnames()/rownames() - 행 / 열 이름 변경

예제

 

 

 

#nrow(value) - 행의 갯수 출력

 

 

#cbind(value1, value2) - 열 추가 함수

#rbind(value1, value2) - 행 추가 함수

 

 

#with(data, expression) - 데이터 프레임 또는 리스트 내 필드를 필드 이름만으로 접근할 수 있게 해주는 함수

#within(data, expression) -  with함수의 기능에 더해서 데이터를 수정하는 기능까지 제공

 

#within을 통해 결측치값을 평균으로 바꿔주는 구문

 

 

 

#split(feature,분류기준,[중위값],[결측값을 중앙값으로 변환]) - 분류기준에 따라 데이터를 나누어 반환하는 함수

 

 

 

 

#subset( value, 조건, [select] ) - 설정하는 조건에 맞는 벡터, 매트릭스 혹은 데이터 프레임을 반환하는 함수

 

#select 조건 - 원하는 컬럼만 가져온다.

 


 

#Factor - 범주형 변수를 나타낸다.

as.factor / factor 로 생성할 수 있다.

 

 

factor로 형변환

 

 

 

#산술평균 구하기

 

 

 

# aggregate(x, by, fun) - by를 기준으로 fun 함수를 사용해 x를 구한다.

 

 

 

 

#tapply - 데이터를 색인에 따라 그룹을 한 후 함수에 따른 결괏값을 내는 함수

 

 

반응형