반응형
-pivot : 피벗 테이블
- 데이터 프레임에서 두 개의 열을 이용하여 행/열 인덱스 reshape 된 테이블을 의미한다.
- 새로운 테이블에서 새로운 기준으로 집계
두 가지 방법으로 피벗테이블을 만든다.
- pivot(index, columns, values) - groupby가 필요
- pd.pivot_table(data, values, index, columns, aggfunc='mean(함수)') - groupby 없이 가능
or
dataFrame.pivot_table(values(칼럼), index, columns, aggfunc='mean(함수)')
# pivot
pivot(index, columns, values)
pivot을 하기 전에는 그전에 groupby로 필요한 값들을 묶어줘야 한다.
이렇게 pivot을 구성하면 index = sex , columns = pclass , value = cnt 인 테이블이 생성된다.
# pivot_table
pd.pivot_table(data, values, index, columns, aggfunc='mean(함수)')
or
dataFrame.pivot_table(values(컬럼), index, columns, aggfunc='mean(함수)')
해당 데이터프레임에 cnt, sex, survived
# pivot_table option
- data : 데이터 프레임
- values : 분석할 열
- index
- columns
- aggfunc : 집계 함수
- fill_value : Nan 대체 값
- margins : 분석 결과를 오른쪽과 아래에 붙일지 여부
- margins_name : 마진 열(행)의 이름
margin을 하면 분석 결과가 나오고 True 값일 때 밑에다가 붙여서 넣는다.
margins_name 은 칼럼과 열의 이름을 넣는다.
반응형
'Base > Python' 카테고리의 다른 글
[Python] matplotlib 한글 폰트 깨짐 현상 , 마이너스 기호(폰트)가 깨지는 현상 해결방법 (0) | 2020.10.19 |
---|---|
[Python] 시각화 사용법 - matplotlib을 통한 line plot 그리기(lim,ticks 등등) (0) | 2020.10.19 |
[Python] Pandas 사용법 - 그룹화 및 그룹 함수 (groupby, qcut, cut, transfrom ) (0) | 2020.10.18 |
[Python] Pandas 사용법 - 두가지의 DataFrame 합치기 (merge, join) (0) | 2020.10.16 |
[Python] Pandas 사용법 - 다양한 인덱스 함수(reset_index,set_index,sort_index) (0) | 2020.10.16 |