[ML] 모델에 대한 설명 - Partial Dependence Plots

Notice

내 티스토리 정리법

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

오답노트

[ML] 모델에 대한 설명 - Partial Dependence Plots 본문

Python/ML

[ML] 모델에 대한 설명 - Partial Dependence Plots

권멋져 2022. 9. 5. 19:12

Partial Dependence Plots

관심 Feature의 값이 변할때, 모델에 미치는 영향을 시각화한다.

데이터 셋의 모든 row에 관심 Feature 모든 값을 돌면서 하나로 통일하고 예측한다.

그 값들의 평균을 계산한다.

from sklearn.inspection import plot_partial_dependence

var = 'rm'
plt.rcParams['figure.figsize'] = 12, 8
plot_partial_dependence(model, 
                        features = [var], 
                        X = x_train, 
                        kind = 'both')
plt.grid()
plt.show()

예측할 모델과 관심 Feature 그리고 데이터 셋을 입력해 Partial Dependence Plots를 출력한다.

kind 옵션은 both일 경우 average와 개별 instance와 함께 값을 그린다.

위 그래프를 분석해보면, rm이 6.7일 때와 7.4 정도 일 때 급격하게 y에 대한 예측값이 높아지는 것을 알 수 있다.

plot_partial_dependence(model, features = ['rm','lstat'], X = x_train)
plt.show()

feature에 리스트로 복수개의 변수를 넣으면 해당 변수마다 Partial Dependence Plots을 그린다.

위 그래프를 보면 rm이 증가할 수록 예측값은 상승하고, lstat가 증가할 수록 예측값은 감소한다.

plot_partial_dependence(model, features = [('rm','lstat')], X = x_train)
plt.show()

feature에 튜플로 변수를 입력하게 되면 한 그래프에서 예측값에 대한 변화를 확인 할 수 있다.

위 그래프를 보면 rm이 6.7일 때와 7.4 정도 일 때 lstat 값의 거의 상관없이 예측값이 증가한다. 또, rm이 7.5 부근을 넘어가면 lstat 값의 상관없이 예측값이 증가한다.

'Python > ML' 카테고리의 다른 글

[ML] Boosting - CatBoost 이론 (0)	2022.09.09
[ML] 모델에 대한 설명 - Shapley Additive Explanations(SHAP) (0)	2022.09.06
[ML] 모델에 대한 설명 - Permutation Feature Importance (0)	2022.09.05
[ML] 모델에 대한 설명 (0)	2022.09.05
[ML] 전통적 시계열 모델링 - ARIMA (0)	2022.08.29

'Python/ML' Related Articles

오답노트

[ML] 모델에 대한 설명 - Partial Dependence Plots 본문

[ML] 모델에 대한 설명 - Partial Dependence Plots

Partial Dependence Plots

'Python > ML' 카테고리의 다른 글

티스토리툴바