Recent Posts
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 달인막창
- JanusGateway
- mp4fpsmod
- addhooks
- 코루틴 빌더
- 오블완
- 개성국밥
- terminal
- 자원부족
- pytest
- preemption #
- 겨울 부산
- 티스토리챌린지
- JanusWebRTCGateway
- JanusWebRTCServer
- JanusWebRTC
- table not found
- 헥사고날아키텍처 #육각형아키텍처 #유스케이스
- Spring Batch
- 코루틴 컨텍스트
- kotlin
- PersistenceContext
- PytestPluginManager
- vfr video
- python
- VARCHAR (1)
- Value too long for column
- taint
- tolerated
- 깡돼후
Archives
너와 나의 스토리
ARIMA(autoregressive integrated moving average)란? 본문
Data Analysis/Machine learning
ARIMA(autoregressive integrated moving average)란?
노는게제일좋아! 2019. 7. 11. 14:39반응형
Time series
- 시계열(time series): 일정 시간 간격으로 배치된 데이터들의 수열을 말한다.
- 시계열 분석(time series analysis): 이런 시계열을 해석하고 이해하는데 쓰이는 여러 가지 방법을 연구하는 분야
- 시계열 예측(time series prediction): 주어진 시계열을 보고 수학적인 모델을 만들어서 미래에 일어날 것들을 예측하는 것을 뜻하는 말.
ARIMA
- 시계열 데이터 기반 분석 기법
- 과거 지식이나 경험을 바탕으로 한 행동에 따라 경제가 움직이고 있음을 기초로 한다.
- 시계열 정보 -> 규칙성을 가지는 패턴과 불규칙한 패턴의 결합
- 규칙성을 만드는 패턴
- 자기 상관성(Autocorrelativeness): 이전의 결과와 이후의 결과 사이에서 발생
- 오차항끼리 서로 상관되지 않는다는 가정(회귀모형의 기본 가정)
- 이동 평균(Moving Average): 이전에 생긴 불규칙한 사건이 이후의 결과에 편향성을 초래하는 현상
- 자기 상관성(Autocorrelativeness): 이전의 결과와 이후의 결과 사이에서 발생
- 불규칙한 패턴
- White Noise
- 규칙성을 만드는 패턴
- * Arimaa와 다름
AR model - Autocorrelation
- 자기 상관(Autocorrelation): 이전의 값이 이후의 값에 영향을 미치고 있는 상황
- 예: 최근 3일 값이 작으면, 다음은 높은 값이 나온다.
- AR model: 자기상관성을 시계열 모형으로 구성한 것
- 과거의 패턴이 지속된다면 시계열 데이터 관측치 $Y_{t}$는 과거 관측치 $Y_{t-1}$,$Y_{t-2}$,...,$Y_{t-p}$에 의해 예측할 수 있을 것이다.
- 하지만 너무 과거의 데이터일 경우 영향력이 줄어들 것이다. -> 이를 고려할 수 있는 가중치를 사용해야 한다.
MA model
- 이동평균(Moving Average): 시간이 지날수록 어떤 랜덤 변수의 평균값이 지속적으로 증가하거나 감소하는 경향
- ex) 계절에 따른 전기요금의 변화
- 회귀 오류(Regression Error)가 실제로 과거 여러 시간에 동시에 값이 발생항 오차 항들의 선형 조합임을 나타낸다.
- 시계열 데이터 $Y_{t}$에서 시점 t의 관측치 $Y_{t}$가 과 거 오차 $e_{t-1}$,$e_{t-2}$,...,$e_{t-q}$들에 의해 설명될 때, MA(q) (차수가 q인 Moving-Average) 모델을 따른다고 한다.
ARMA model
- ARMA(Autoregression Moving Average)
- 안정적인 시계열(Stationary Series)에만 적용 가능
ARIMA model
- ARIMA(Autoregression Integrated Moving Average)
- 다소 비안정적인 시계열(Non Stationay Series)에도 적용 가능
- 통계학이나 특히 시계열 분석에서 ARIMA model은 ARMA model 일반화한 것
- I(Integrated) 부분: 데이터 값이 해당 값과 이전 값 사이의 차이로 대체되었음을 나타낸다.
- 차이점 조정 과정은 두 번 이상 수행될 수 있으며, 이런 차이점 조정 과정을 통해 비 안전성을 없앨 수 있다.
* 안정적인 시계열
-> 시간의 추이와 관계없이 평균 및 분산이 불변하거나 시점 간의 공분산이 기준 시점과 무관한 형태의 시계열
출처: https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average
출처: https://icim.nims.re.kr/post/easyMath/68
출처: http://wolfpack.hnu.ac.kr/Fall_2011/SKKU/skku_TS2.pdf
출처: https://m.blog.naver.com/bluefish850/220749045909
반응형
'Data Analysis > Machine learning' 카테고리의 다른 글
QRF(Quantile regression forest) (0) | 2019.07.15 |
---|---|
RNN(Recurrent Neural Network) (0) | 2019.07.11 |
Forecasting at Uber (0) | 2019.07.11 |
jupyter notebook [anaconda, tensorflow] (0) | 2019.07.05 |
Andrew Ng - machine learning 정리 [Lecture 4] (0) | 2019.07.03 |
Comments