반응형
#데이터 프레임(data.frame)
배열(array) 3차원 벡터로서 동일 타입의 데이터만 저장 가능하다.
2차원 구조로서 열 단위로 서로 다른 타입의 데이터들로 구성 가능하다.
또한 모든 열의 데이터 개수(행의 개수)는 동일해야 한다.
데이터 프레임 변환 :rbind(df, 백터), cbind(df, 벡터)
데이터 프레임의 구조 확인 :str(df)
인덱싱 : [행의인덱싱, 열의 인덱싱], [열의 인덱싱], df$칼럼 이름, [[열 인덱싱]]
subset (df, select=컬럼명들, subset=(조건))
data.frame(value1,value2) - 데이터 프레임 생성
#colnames()/rownames() - 행 / 열 이름 변경
예제
#nrow(value) - 행의 갯수 출력
#cbind(value1, value2) - 열 추가 함수
#rbind(value1, value2) - 행 추가 함수
#with(data, expression) - 데이터 프레임 또는 리스트 내 필드를 필드 이름만으로 접근할 수 있게 해주는 함수
#within(data, expression) - with함수의 기능에 더해서 데이터를 수정하는 기능까지 제공
#within을 통해 결측치값을 평균으로 바꿔주는 구문
#split(feature,분류기준,[중위값],[결측값을 중앙값으로 변환]) - 분류기준에 따라 데이터를 나누어 반환하는 함수
#subset( value, 조건, [select] ) - 설정하는 조건에 맞는 벡터, 매트릭스 혹은 데이터 프레임을 반환하는 함수
#select 조건 - 원하는 컬럼만 가져온다.
#Factor - 범주형 변수를 나타낸다.
as.factor / factor 로 생성할 수 있다.
factor로 형변환
#산술평균 구하기
# aggregate(x, by, fun) - by를 기준으로 fun 함수를 사용해 x를 구한다.
#tapply - 데이터를 색인에 따라 그룹을 한 후 함수에 따른 결괏값을 내는 함수
반응형
'Base > R' 카테고리의 다른 글
[R] R 사용자 정의 함수(FUNCTION)와 데이터 전처리를 위한 기본적인 함수 (0) | 2020.07.25 |
---|---|
[R] R로 만드는 제어문 (if, else if, for)과 예제 (0) | 2020.07.24 |
[R] R에 사용되는 배열(array)과 리스트(list)의 개념 및 사용되는 함수 (0) | 2020.07.23 |
[R] R에 사용되는 행렬(matrix)의 개념 및 사용되는 함수 (0) | 2020.07.23 |
[R] R에서 사용되는 정규표현식(Regex) 표현 방법과 함수를 통한 사용 예제 (0) | 2020.07.22 |