목록Python/Pandas (16)
오답노트
열 조회하기 데이터프레임 변수에 ['컬럼명'] 을 통해 열을 조화할 수 있다. 다른 방법으로는 데이터프레임 변수에 .컬럼영 을 통해서도 조회할 수 있다. print(data_frame['Serise1']) print(data_frame.Serise1) ''''''' 0 12 1 56 2 89 3 57 4 25 5 56 6 85 7 69 8 34 9 69 10 47 11 60 Name: Serise1, dtype: int64 ''''''' 통계 메소드 sum 열의 합계 조회 data_frame['Serise1'].sum()# 659 max 열의 최대값 조회 data_frame['Serise1'].max()# 89 min 열의 최소값 조회 data_frame['Serise1'].min()# 12 mean 열..
unique 데이터 프레임에서 시리즈에 대해 고유값을 출력하는 함수다 data_frame['Status'].unique() # array([1, 2, 3], dtype=int64) value_counts 고유 값과 그 개수를 확인할 수 있다. data_frame['Status'].value_counts() ''' 1 5 2 4 3 3 Name: Status, dtype: int64 '''
sort_values 사용자가 선택한 열을 기준으로 정렬한다. 옵션으로 by,ascending 이 있다. by는 열을 선택하는 옵션이다. by에 열의 이름을 넣는다. ascending 옵션은 기본값이 True로 오름차순 정렬이 기본이다. ascending 옵션에 False 값을 입력하면 내림차순 정렬이 된다. data_frame.sort_values(by = 'Serise1') data_frame.sort_values(by = 'Serise1',ascending = False)
데이터 프레임의 크기 (shape) 튜플의 형태로 데이터 프레임의 크기를 반환한다. 순서는 행, 열이다. data_frame.shape# (12, 4) 데이터 프레임의 열 확인 (columns) data_frame의 columns 변수를 통해 열의 이름들을 확인할 수 있다. 이 때 반환은 Pandas의 Index 자료형으로 반환되고 columns.values 변수를 통해 열의 이름을 확인하면 array로 반환된다. print(data_frame.columns) # Index(['Label', 'Serise1', 'Serise2', 'Serise3'], dtype='object') print(data_frame.columns.values) # array(['Label', 'Serise1', 'Serise2..
read_csv csv 파일은 쉼표로 구분된 파일 형식이다. Pandas에서는 csv파일을 읽어올 수 있는 함수를 제공한다. 함수의 인자로는 csv의 경로만 넣으면 된다. import pandas as pd data_frame = pd.read_csv('C:\\Users\\User\\Desktop\\개인공부\\Pandas\\my_data.csv') to_csv 데이터 프레임을 csv로 만드는 함수이다. 인자로 경로를 받아서 csv파일을 생성한다. data_frame.to_csv('my_csv.csv') head head는 데이터 프레임을 상위에서 부터 조회한다. 인자로는 상위에서부터 몇개까지 조회 할지 정수로 받고, 인자를 넣지 않을 경우 5개가 기본값이다. data_frame.head() data_fr..