오답노트
[sklearn] MinMaxScaler 본문
MinMaxScaler
MinMaxScaler는 열에서 최소값을 0, 최대값을 1로 봤을 때, 그 비율로 Scale을 조정할 수 있도록 하는 객체다.
from sklearn.preprocessing import MinMaxScaler
col = list(df.iloc[:,-2:])
scale = MinMaxScaler()
df_scale = scale.fit_transform(df.iloc[:,-2:])
df_scale = pd.DataFrame(df_scale,columns=col)
result = pd.concat([df.iloc[:,:1],df_scale],axis=1)
그림 1.1 에서 Serise1을 보면 3번 인덱스의 값이 가장 크고, 0번 인덱스 값이 가장 작다.
그림 2.2 에서 Serise1을 보면 3번 인덱스의 값이 1이고, 0번 인덱스 값이 0이다.
마찬가지로
그림 1.1 에서 Serise2을 보면 4번 인덱스의 값이 가장 크고, 0번 인덱스 값이 가장 작다.
그림 2.2 에서 Serise2을 보면 4번 인덱스의 값이 1이고, 0번 인덱스 값이 0이다.
Scaling 전에는 각 시리즈에서 자릿수로 인해 비교가 번거롭다.
하지만 Scaling 후에는 각 시리즈가 0과 1 사이의 수로 바뀌면서 비교가 상대적으로 수월해진다.
또 머신러닝 학습에 있어서 이러한 전처리 과정을 거치면 나쁘지 않은 결과를 얻을 수 있다.
'Python > 데이터 분석' 카테고리의 다른 글
[데이터 분석] 이변량 분석 - 범주 데이터와 수치 데이터 (0) | 2022.08.12 |
---|---|
[데이터 분석] 이변량 분석 - 수치 데이터와 수치 데이터 2 (0) | 2022.08.11 |
[데이터 분석] 이변량 분석 - 수치 데이터와 수치 데이터 1 (0) | 2022.08.11 |
[데이터 분석] 범주형 데이터 분석 (0) | 2022.08.11 |
[데이터 분석] 수치형 데이터 분석 (0) | 2022.08.10 |