Python/Pandas

[Pandas] Crosstab (교차표)

권멋져 2022. 8. 8. 19:34

crosstab

pd.crosstab(col1,col2)

두 범주형 변수로 빈도수를 파악하는데 사용된다.

 

 

1.1 타이타닉 데이터

pd.crosstab(titanic['Survived'], titanic['Sex'])

1.2 성별에 따른 생존 빈도수

normalize

normalize 옵션은 빈도 수의 합을 1로 만들어준다.

 

columns

열의 합이 1이 되도록 normalize 시킨다.

pd.crosstab(titanic['Survived'], titanic['Embarked'], normalize = 'columns')

2.1.1 행선지 별 생존 빈도

각 열의 합은 모두 1이다.

 

index

행의 합이 1이 되도록 normalize 시킨다.

pd.crosstab(titanic['Survived'], titanic['Embarked'], normalize = 'index')

2.2.1 생존별 행선지 빈도

각 행의 합은 1이다.

 

all

모든 요소의 합이 1이 되도록 normalize 시킨다.

pd.crosstab(titanic['Survived'], titanic['Embarked'], normalize = 'all')

2.3.1 생존별 행선지 빈도

모든 요소를 더하면 1이다.