오답노트

[matplotlib] 범주형 데이터 시각화 본문

Python/Matplotlib

[matplotlib] 범주형 데이터 시각화

권멋져 2022. 8. 11. 19:19

[데이터 분석] 범주형 데이터 분석

 

[데이터 분석] 범주형 데이터 분석

범주형 데이터 수치형 데이터와 반대로 수학적 계산이 되지 않는 데이터들을 의미한다. 계절이나 등급, 월 같은 경우가 범주형 데이터에 해당한다. 범주형 데이터 기초통계량 pandas 함수로 쉽게

dhjkl123.tistory.com

bar

plt.bar(Serise.value_counts().index,Serise.value_counts().values)
plt.barh(Serise.value_counts().index,Serise.value_counts().values)

pandas 의 value_counts()를 통해 범주형 데이터의 집계 작업 후, 

index와 values를 차례대로 bar함수에 인자로 넣으면 표가 나타난다.

 

bar 함수는 세로 방향의 bar chart를 그리는 함수고,barh함수는 가로 방향의 bar chart를 그리는 함수이다.

 

plt.subplot(1,2,1)
plt.bar(temp.index, temp.values)

plt.subplot(1,2,2)
plt.barh(temp.index, temp.values)

plt.tight_layout()
plt.show()

 

1.1 bar 함수(좌)와 barh(우) 함수 출력 결과

countplot

seaborn 라이브러리의 함수로 위에서와 같이 집계할 필요 없이 시리즈를 인자로 넣으면 내부에서 집계하고 차트도 그려준다.

 

sns.countplot(Serise)

 

sns.countplot(titanic['Pclass'])
plt.show()

1.1.1. countplot 함수 결과

pie

plt.pie(temp.values, labels = temp.index, autopct = '%.2f%%', 
        startangle=90, counterclock=False, 
        explode = [0.05, 0.05, 0.05], shadow=True)
        
plt.show()

 

인자로는 pandas 의 value_counts()를 통해 범주형 데이터의 집계 작업한 values가 입력된다.

labels로 각 범주에 대한 레이블을 입력할 수 있다.autopct는 pie 차트에 표현할 퍼센트의 format를 지정할 수 있다.startangle은 파이 차트를 입력한 각도 만큼 회전 시킨 다음 출력한다.counterclock은 기본값은 True로 반시계 방향, False는 시계방향 출력한다.explode는 차크간의 간격을 정할 수 있다. index의 개수 만큼 리스트를 만들어 입력해야한다.shadow는 음영효과를 설정할 수 있다.

 

2.1 pie 출력