오답노트
[ML] 시계열 데이터 - 전통적 시계열 모델링 본문
전통적 시계열 모델링
y데이터의 이전 시점 데이터들로 부터 흐름의 패턴을 추출하여 예측한다. (feature는 사용하지 않음)
AR (Auto Regressive)
target을 자기자신으로 하고 이전 시점의 데이터를 feature로 갖는 모델이다.
AR의 hyper parameter는 p로 얼마나 과거의 데이터를 볼 것인지 나타낸다. (차수)
y가 정상(Stationary)데이터야 한다.
MA (Moving Average)
target을 자기자신으로 하고 해당 시점과 그 과거의 예측 오차들을 feature로 갖는 모델이다.
MA의 hyper parameter는 q로 얼마나 과거의 데이터를 볼 것인지 나타낸다. (차수)
y가 정상(Stationary)데이터야 한다.
ARIMA
AR 과 MA 모델을 결합하고, 데이터 차분을 포함시킨 모델이다.
차분을하면 모델이 Stationary하게 된다.
I 의 hyper parameter는 d로 0은 차분을 사용하지 않고, 1이상은 차분의 횟수이다. 보통은 1만 사용하며 1차 차분 이후에도 Stationary하지 않으면 2차 차분을 한다.
ARIMA 는 추세를 잘 파악할 수 있지만 계절성 데이터는 제대로 모델링 하지 못한다.
SARIMA
ARIMA 모델에 계절성 모델을 결합한것이 SARIMA다.
SARIMA의 hyper parameter는 ARIMA 의 p,d,q 와 S의 (P,D,Q)m 이 있다 P,D,Q 는 계절성에서 쓰이는 p,d,q,와 의미가 같고, m은 규칙성이 나타나는 주기이다.
SARIMAX
SARIMA 모델에 선형회귀 모델을 결합한 모델이다.
SARIMAX는 y뿐만 아니라 x까지 사용한다.
'Python > ML' 카테고리의 다른 글
[ML] 모델에 대한 설명 (0) | 2022.09.05 |
---|---|
[ML] 전통적 시계열 모델링 - ARIMA (0) | 2022.08.29 |
[ML] 시계열 데이터 (0) | 2022.08.29 |
[ML] 비지도 학습 - DBSCAN (0) | 2022.08.29 |
[ML] 비지도 학습 - k-means (0) | 2022.08.26 |