😎 κ³΅λΆ€ν•˜λŠ” μ§•μ§•μ•ŒνŒŒμΉ΄λŠ” μ²˜μŒμ΄μ§€?

μ‹œκ³„μ—΄ 데이터 뢄석 μˆœμ„œ (Time Series Analysis Order) λ³Έλ¬Έ

πŸ‘©‍πŸ’» 인곡지λŠ₯ (ML & DL)/Serial Data

μ‹œκ³„μ—΄ 데이터 뢄석 μˆœμ„œ (Time Series Analysis Order)

μ§•μ§•μ•ŒνŒŒμΉ΄ 2022. 9. 28. 10:48
728x90
λ°˜μ‘ν˜•

220928 μž‘μ„±

<λ³Έ λΈ”λ‘œκ·ΈλŠ” today-1λ‹˜μ˜ λΈ”λ‘œκ·Έλ₯Ό μ°Έκ³ ν•΄μ„œ κ³΅λΆ€ν•˜λ©° μž‘μ„±ν•˜μ˜€μŠ΅λ‹ˆλ‹€ :-) >

https://today-1.tistory.com/37?category=886697 

 

μ‹œκ³„μ—΄ 데이터 뢄석 싸이클

μ‹œκ³„μ—΄ 데이터 뢄석 싸이클(Time Series Analysis Cycle) : μ§€κΈˆκΉŒμ§€ κ³΅λΆ€ν•΄μ˜¨ μ„ ν˜•ν™•λ₯ κ³Όμ •μ˜ 뢄석 싸이클을 λ‹€μ‹œ μ‚΄νŽ΄λ³΄κ³ μž 함 1. 비정상 κ³Όμ •μ—μ„œ 정상 κ³Όμ • μΆ”μΆœ : A R I M A ( p , d , q ) ">결정둠적 μΆ”μ„Έ

today-1.tistory.com

 

 

 

μ‹œκ³„μ—΄ 데이터 뢄석 μˆœμ„œ

 

1️⃣ 비정상성 -> 정상성 λ³€ν™˜

  • 결정둠적 μΆ”μ„Έ : νšŒκ·€λΆ„μ„, 닀항식 λ“±μœΌλ‘œ λͺ¨ν˜•ν™” ν›„ 이λ₯Ό 뢄리
  • ν™•λ₯ μ  μΆ”μ„Έ : ARIMA λͺ¨ν˜•μΈ κ²½μš°μ—λŠ” ADF(Augmented Dickey Fuller) 검정을 μ‚¬μš©ν•˜μ—¬ μ λΆ„μ°¨μˆ˜(Order of Integration)을 μ•Œμ•„λ‚΄μ„œ μ°¨λΆ„

 

2️⃣ μ •κ·œμ„± 확인

  • μ •κ·œμ„± 검정을 톡해 자료의 뢄포가 μ •κ·œ 뢄포인지 확인
    • 일반 μ„ ν˜• ν™•λ₯  κ³Όμ • : 전체 μ‹œκ³„μ—΄μ΄ κ°€μš°μ‹œμ•ˆ 백색 작음의 μ„ ν˜• μ‘°ν•©μœΌλ‘œ 이루어지기 λ•Œλ¬Έμ— μ‹œκ³„μ—΄ μžμ²΄λ„ κ°€μš°μ‹œμ•ˆ μ •κ·œ 뢄포
    • ARIMA λͺ¨ν˜• λ“±μ˜ 일반 μ„ ν˜• ν™•λ₯  κ³Όμ •μœΌλ‘œ λͺ¨ν˜•ν™” : μ •κ·œμ„± κ²€μ •(Normality Test)을 μ‚¬μš©ν•˜μ—¬ 뢄포가 μ •κ·œ 뢄포인지 확인
  • 둜그, Box-Cox λ³€ν™˜μ„ μ‚¬μš©ν•˜μ—¬ μ •κ·œμ„±μ΄ κ°œμ„ λœλ‹€λ©΄ λ³€ν™˜ μ‚¬μš© κ°€λŠ₯

 

3️⃣ AR, MA 차수 κ²°μ •

  • ACF/PACF λΆ„μ„μœΌλ‘œ AR(p) λͺ¨ν˜• λ˜λŠ” MA(q) λͺ¨ν˜• κ²°μ •
    • ACFκ°€ νŠΉμ • 차수 μ΄μƒμ—μ„œ μ—†μ–΄μ§€λŠ” 경우(Cut-off)μ—λŠ” MA λͺ¨ν˜•μ„ μ‚¬μš© κ°€λŠ₯
    • PACFκ°€ νŠΉμ • 차수 μ΄μƒμ—μ„œ 없어지면 AR λͺ¨ν˜•μ„ μ‚¬μš© κ°€λŠ₯
    • ACF와 PACF λͺ¨λ‘ νŠΉμ • 차수 μ΄μƒμ—μ„œ μ—†μ–΄μ§€λŠ” ν˜„μƒμ΄ λ‚˜νƒ€λ‚˜μ§€ μ•ŠλŠ”λ‹€λ©΄ ARMA λͺ¨ν˜•μ„ μ‚¬μš©
1. MA(Moving Average)
: MA(q) μ•Œκ³ λ¦¬μ¦˜ 차수(q)κ°€ μœ ν•œν•œ κ°€μš°μ‹œμ•ˆ λ°±μƒ‰μž‘μŒ κ³Όμ •μ˜ μ„ ν˜•μ‘°ν•©
: Exponential Smoothing λ‚΄ Moving Average Smoothing은 과거의 Trend-Cycle을 μΆ”μ •ν•˜κΈ° μœ„ν•¨μ΄κ³ , MAλŠ” 미래 값을 μ˜ˆμΈ‘ν•˜κΈ° μœ„ν•¨

2. AR(Auto-Regressive)
: AR(p) μ•Œκ³ λ¦¬μ¦˜μ˜ 차수(p)κ°€ μœ ν•œν•œ μžκΈ°μžμ‹ μ˜ κ³Όκ±°κ°’λ“€μ˜ μ„ ν˜•μ‘°ν•©
: ACFκ°€ μ‹œμ°¨(Lag)κ°€ 증가해도 0이 λ˜μ§€ μ•Šκ³  μ˜€λžœμ‹œκ°„ λ‚¨μ•„μžˆλŠ” κ²½μš°μ— MAλͺ¨ν˜•μ„ μ‚¬μš©ν•˜λ©΄ μ°¨μˆ˜κ°€ ∞

πœ™1 = 0 : π‘Œπ‘‘ λ°±μƒ‰μž‘μŒ
πœ™1 < 0 : λΆ€ν˜Έλ₯Ό λ°”κΏ”κ°€λ©΄μ„œ(μ§„λ™ν•˜λ©΄μ„œ) μ§€μˆ˜μ μœΌλ‘œ κ°μ†Œ
πœ™1 > 0 : μ‹œμ°¨κ°€ μ¦κ°€ν•˜λ©΄μ„œ μžκΈ°μƒκ΄€κ³„μˆ˜λŠ” μ§€μˆ˜μ μœΌλ‘œ κ°μ†Œ
πœ™ 1 = 1 : π‘Œπ‘‘λŠ” 비정상성인 λžœλ€μ›Œν¬(Random Walk)

 

4️⃣ ARMA λͺ¨ν˜• λͺ¨μˆ˜ μΆ”μ •

  • MM(Method of Modent)
  • LS(Least Square)
  • MLE(Maximum Likelihood Estimation)
  • ADF(Augmented Dickey Fuller) 검정을 μ‚¬μš©ν•˜μ—¬ ν•΄λ‹Ή μˆ˜μ‹μ— λŒ€ν•œ κ³„μˆ˜ 즉 λͺ¨μˆ˜ 값을 μΆ”μ •
  • λΆ€νŠΈμŠ€νŠΈλž˜ν•‘μ„ μ‚¬μš©ν•˜μ—¬ λͺ¨μˆ˜μ˜ ν‘œμ€€ 였차 μΆ”μ •
3. ARMA(Auto-Regressive Moving Average)
: ARMA(p, q) μ•Œκ³ λ¦¬μ¦˜ 차수(p and q)κ°€ μœ ν•œν•œ AR(p)와 MA(q)의 μ„ ν˜•μ‘°ν•©
: ARκ³Ό MA의 정상성 쑰건과 κ°€μ—­μ„± 쑰건이 λ™μΌν•˜κ²Œ ARMA μ•Œκ³ λ¦¬μ¦˜λ“€μ— 적용
: μ’…μ†λ³€μˆ˜ π‘Œπ‘‘λŠ” μ’…μ†λ³€μˆ˜ π‘Œπ‘‘μ™€ λ°±μƒ‰μž‘μŒ(πœ–π‘‘) μ°¨λΆ„λ“€(Lagged Variables)의 ν•©μœΌλ‘œ μ˜ˆμΈ‘κ°€λŠ₯

 

5️⃣ μž”μ°¨ 진단

  • λͺ¨ν˜•μ΄ μΆ”μ •λœ ν›„ μž”μ°¨ 검정을 톡해 과정이 μ˜¬λ°”λ₯΄κ²Œ μ§„ν–‰λλŠ”μ§€ κ²€μ¦ν•˜λŠ” κ³Όμ •
  • μž”μ°¨κ°€ 백색 작음이 λ λ•ŒκΉŒμ§€ 계속 λͺ¨ν˜•μ„ μˆ˜μ •ν•΄κ°€λ©΄ 이λ₯Ό 반볡
    • μž”μ°¨μ˜ 정상성 - > μž”μ°¨λŠ” 정상성이어야 함
    • μž”μ°¨μ˜ μ •κ·œμ„± - > μž”μ°¨λŠ” μ •κ·œλΆ„ν¬λ₯Ό 띄고 μžˆμ–΄μ•Ό 함
    • μž”μ°¨μ˜ λ“±λΆ„μ‚°μ„± -> μž”μ°¨λŠ” 등뢄산성이어야 함
    • μž”μ°¨μ˜ μžκΈ°μƒκ΄€μ„± - > μž”μ°¨λŠ” μžκΈ°μƒκ΄€μ„±μ΄ μ—†μ–΄μ•Ό 함

 

 

 

 

728x90
λ°˜μ‘ν˜•
Comments