오답노트

[Pandas] 데이터 프레임 통계 메소드 본문

Python/Pandas

[Pandas] 데이터 프레임 통계 메소드

권멋져 2022. 8. 2. 22:01

열 조회하기

데이터프레임 변수에 ['컬럼명'] 을 통해 열을 조화할 수 있다.

다른 방법으로는 데이터프레임 변수에 .컬럼영 을 통해서도 조회할 수 있다.

 

print(data_frame['Serise1'])
print(data_frame.Serise1)

'''''''

0     12
1     56
2     89
3     57
4     25
5     56
6     85
7     69
8     34
9     69
10    47
11    60
Name: Serise1, dtype: int64

'''''''

 

통계 메소드

sum

열의 합계 조회

data_frame['Serise1'].sum()	# 659

 

max

열의 최대값 조회

data_frame['Serise1'].max()	# 89

 

min

열의 최소값 조회

data_frame['Serise1'].min()	# 12

 

mean

열의 평균값 조회

data_frame['Serise1'].mean()	# 54.916666666666664

 

median

열의 중간값 조회

data_frame['Serise1'].median()	# 56.5

 

groupby

위의 통계 메소드들을 여러 열에 사용할 수 있도록 해주는 함수이다.

as_index 옵션이 존재하는데 기본값은 True다.

옵션에 False 입력하면 숫자로된 Index 열을 출력한다.

 

tmp = data_frame.groupby('Label')[['Serise1','Serise2']].sum()
tmp

3.1 groupby를 사용해 Serise1과 Serise2를 동시에 sum을 계산

 

 

tmp = data_frame.groupby('Label', as_index = False)[['Serise1','Serise2']].sum()
tmp

3.2 as_index에 False 값을 입력했을 때 출력 결과

agg

agg 함수는 여러 열에 여러 통계 연산을 수행하고 싶을 떄 사용한다.

통계 메소드명을 리스트로 인자에 입력하면 해당하는 통계 연산결과를 출력한다.

 

tmp.groupby('Label')[['Serise1','Serise2']].agg(['max','min','mean','median'])

 

3.1.1 agg를 사용해 Serise1과 Serise2의 최대,최소,평균,중간값을 연산한 결과

'Python > Pandas' 카테고리의 다른 글

[Pandas] 데이터 프레임 변경  (0) 2022.08.03
[Pandas] 조건 조회  (0) 2022.08.03
[Pandas] 데이터 프레임의 고유 값  (0) 2022.08.02
[Pandas] 데이터 프레임 정렬  (0) 2022.08.02
[Pandas] 데이터 프레임에 대한 정보  (0) 2022.08.02