오답노트

[Pandas] 데이터 프레임에 대한 정보 본문

Python/Pandas

[Pandas] 데이터 프레임에 대한 정보

권멋져 2022. 8. 2. 20:02

데이터 프레임의 크기 (shape)

튜플의 형태로 데이터 프레임의 크기를 반환한다. 순서는 행, 열이다.

data_frame.shape	# (12, 4)

 

데이터 프레임의 열 확인 (columns)

data_frame의 columns 변수를 통해 열의 이름들을 확인할 수 있다.

이 때 반환은 Pandas의 Index 자료형으로 반환되고

columns.values 변수를 통해 열의 이름을 확인하면 array로 반환된다.

print(data_frame.columns) # Index(['Label', 'Serise1', 'Serise2', 'Serise3'], dtype='object')

print(data_frame.columns.values) # array(['Label', 'Serise1', 'Serise2', 'Serise3'], dtype=object)

 

데이터 프레임의 자료형 (dtypes)

데이터 프레임의 열에 대한 자료형을 알 수 있다.

print(data_frame.dtypes)

'''''''

Label      object
Serise1     int64
Serise2     int64
Serise3     int64
dtype: object

'''''''

 

데이터프레임 모든 정보 확인 (info())

info 함수를 통해 위에서 살펴본 데이터 프레임의 모든 정보를 볼 수 있다.

data_frame.info()

'''''''

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 4 columns):
 #   Column   Non-Null Count  Dtype 
---  ------   --------------  ----- 
 0   Label    12 non-null     object
 1   Serise1  12 non-null     int64 
 2   Serise2  12 non-null     int64 
 3   Serise3  12 non-null     int64 
dtypes: int64(3), object(1)
memory usage: 512.0+ bytes

'''''''

 

데이터프레임의 기초통계정보 확인(describe)

데이터 프레임의 시리즈에 대한 개수, 평균, 중간값,최소값,사분위값,최대값을 나타낸다.

 

(사분위값 : 데이터 테이블 또는 데이터 테이블의 일부를 거의 균등한 관찰값 수를 포함하는 4개의 그룹으로 나눈 값)

data_frame.describe()

5.1 데이터 프레임의 기초통계정보