오답노트
[Pandas] 데이터 프레임에 대한 정보 본문
데이터 프레임의 크기 (shape)
튜플의 형태로 데이터 프레임의 크기를 반환한다. 순서는 행, 열이다.
data_frame.shape # (12, 4)
데이터 프레임의 열 확인 (columns)
data_frame의 columns 변수를 통해 열의 이름들을 확인할 수 있다.
이 때 반환은 Pandas의 Index 자료형으로 반환되고
columns.values 변수를 통해 열의 이름을 확인하면 array로 반환된다.
print(data_frame.columns) # Index(['Label', 'Serise1', 'Serise2', 'Serise3'], dtype='object')
print(data_frame.columns.values) # array(['Label', 'Serise1', 'Serise2', 'Serise3'], dtype=object)
데이터 프레임의 자료형 (dtypes)
데이터 프레임의 열에 대한 자료형을 알 수 있다.
print(data_frame.dtypes)
'''''''
Label object
Serise1 int64
Serise2 int64
Serise3 int64
dtype: object
'''''''
데이터프레임 모든 정보 확인 (info())
info 함수를 통해 위에서 살펴본 데이터 프레임의 모든 정보를 볼 수 있다.
data_frame.info()
'''''''
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Label 12 non-null object
1 Serise1 12 non-null int64
2 Serise2 12 non-null int64
3 Serise3 12 non-null int64
dtypes: int64(3), object(1)
memory usage: 512.0+ bytes
'''''''
데이터프레임의 기초통계정보 확인(describe)
데이터 프레임의 시리즈에 대한 개수, 평균, 중간값,최소값,사분위값,최대값을 나타낸다.
(사분위값 : 데이터 테이블 또는 데이터 테이블의 일부를 거의 균등한 관찰값 수를 포함하는 4개의 그룹으로 나눈 값)
data_frame.describe()
'Python > Pandas' 카테고리의 다른 글
[Pandas] 데이터 프레임 통계 메소드 (0) | 2022.08.02 |
---|---|
[Pandas] 데이터 프레임의 고유 값 (0) | 2022.08.02 |
[Pandas] 데이터 프레임 정렬 (0) | 2022.08.02 |
[Pandas] csv 파일 읽기/쓰기, 데이터 프레임 조회 (0) | 2022.08.02 |
[Pandas] Pandas 소개와 데이터프레임, 시리즈 (0) | 2022.08.02 |