오답노트

[sklearn] MinMaxScaler 본문

Python/데이터 분석

[sklearn] MinMaxScaler

권멋져 2022. 8. 9. 19:35

MinMaxScaler

MinMaxScaler는 열에서 최소값을 0, 최대값을 1로 봤을 때, 그 비율로 Scale을 조정할 수 있도록 하는 객체다.

 

1.1 예제 데이터프레임

from sklearn.preprocessing import MinMaxScaler

col = list(df.iloc[:,-2:])
scale = MinMaxScaler()
df_scale = scale.fit_transform(df.iloc[:,-2:])

df_scale = pd.DataFrame(df_scale,columns=col)

result = pd.concat([df.iloc[:,:1],df_scale],axis=1)

 

1.2 MinMaxScale 결과

그림 1.1 에서 Serise1을 보면 3번 인덱스의 값이 가장 크고, 0번 인덱스 값이 가장 작다.

그림 2.2 에서 Serise1을 보면 3번 인덱스의 값이 1이고, 0번 인덱스 값이 0이다.

 

마찬가지로

그림 1.1 에서 Serise2을 보면 4번 인덱스의 값이 가장 크고, 0번 인덱스 값이 가장 작다.

그림 2.2 에서 Serise2을 보면 4번 인덱스의 값이 1이고, 0번 인덱스 값이 0이다.

 

Scaling 전에는 각 시리즈에서 자릿수로 인해 비교가 번거롭다.

하지만 Scaling 후에는 각 시리즈가 0과 1 사이의 수로 바뀌면서 비교가 상대적으로 수월해진다.

 

또 머신러닝 학습에 있어서 이러한 전처리 과정을 거치면 나쁘지 않은 결과를 얻을 수 있다.