Base/Python

[Python] Pandas 사용법 - 피벗 테이블 생성(pivot,pivot_table)

반응형

-pivot : 피벗 테이블

 

- 데이터 프레임에서 두 개의 열을 이용하여 행/열 인덱스 reshape 된 테이블을 의미한다.

- 새로운 테이블에서 새로운 기준으로 집계

 

두 가지 방법으로 피벗테이블을 만든다.

- pivot(index, columns, values) - groupby가 필요

- pd.pivot_table(data, values, index, columns, aggfunc='mean(함수)') - groupby 없이 가능

   or

   dataFrame.pivot_table(values(칼럼), index, columns, aggfunc='mean(함수)')

 

 


# pivot

 

pivot(index, columns, values)

 

pivot을 하기 전에는 그전에 groupby로 필요한 값들을 묶어줘야 한다.

 

 

이렇게 pivot을 구성하면 index = sex , columns = pclass , value = cnt 인 테이블이 생성된다. 

 

 

 


# pivot_table

pd.pivot_table(data, values, index, columns, aggfunc='mean(함수)')

   or

dataFrame.pivot_table(values(컬럼), index, columns, aggfunc='mean(함수)')

 

 

해당 데이터프레임에 cnt, sex, survived  

 

# pivot_table option

- data : 데이터 프레임

- values : 분석할 열

- index

- columns

- aggfunc : 집계 함수

- fill_value : Nan 대체 값

- margins : 분석 결과를 오른쪽과 아래에 붙일지 여부

- margins_name : 마진 열(행)의 이름

 

 

margin을 하면 분석 결과가 나오고 True 값일 때 밑에다가 붙여서 넣는다.

 

 

 

margins_name 은 칼럼과 열의 이름을 넣는다.

 

반응형