오답노트
[Pandas] 데이터 프레임 통계 메소드 본문
열 조회하기
데이터프레임 변수에 ['컬럼명'] 을 통해 열을 조화할 수 있다.
다른 방법으로는 데이터프레임 변수에 .컬럼영 을 통해서도 조회할 수 있다.
print(data_frame['Serise1'])
print(data_frame.Serise1)
'''''''
0 12
1 56
2 89
3 57
4 25
5 56
6 85
7 69
8 34
9 69
10 47
11 60
Name: Serise1, dtype: int64
'''''''
통계 메소드
sum
열의 합계 조회
data_frame['Serise1'].sum() # 659
max
열의 최대값 조회
data_frame['Serise1'].max() # 89
min
열의 최소값 조회
data_frame['Serise1'].min() # 12
mean
열의 평균값 조회
data_frame['Serise1'].mean() # 54.916666666666664
median
열의 중간값 조회
data_frame['Serise1'].median() # 56.5
groupby
위의 통계 메소드들을 여러 열에 사용할 수 있도록 해주는 함수이다.
as_index 옵션이 존재하는데 기본값은 True다.
옵션에 False 입력하면 숫자로된 Index 열을 출력한다.
tmp = data_frame.groupby('Label')[['Serise1','Serise2']].sum()
tmp
tmp = data_frame.groupby('Label', as_index = False)[['Serise1','Serise2']].sum()
tmp
agg
agg 함수는 여러 열에 여러 통계 연산을 수행하고 싶을 떄 사용한다.
통계 메소드명을 리스트로 인자에 입력하면 해당하는 통계 연산결과를 출력한다.
tmp.groupby('Label')[['Serise1','Serise2']].agg(['max','min','mean','median'])
'Python > Pandas' 카테고리의 다른 글
[Pandas] 데이터 프레임 변경 (0) | 2022.08.03 |
---|---|
[Pandas] 조건 조회 (0) | 2022.08.03 |
[Pandas] 데이터 프레임의 고유 값 (0) | 2022.08.02 |
[Pandas] 데이터 프레임 정렬 (0) | 2022.08.02 |
[Pandas] 데이터 프레임에 대한 정보 (0) | 2022.08.02 |