😎 κ³΅λΆ€ν•˜λŠ” μ§•μ§•μ•ŒνŒŒμΉ΄λŠ” μ²˜μŒμ΄μ§€?

μ‹œκ³„μ—΄ 데이터 λΆ„ν•΄ (정적, 비정적 데이터) λ³Έλ¬Έ

πŸ‘©‍πŸ’» 인곡지λŠ₯ (ML & DL)/Serial Data

μ‹œκ³„μ—΄ 데이터 λΆ„ν•΄ (정적, 비정적 데이터)

μ§•μ§•μ•ŒνŒŒμΉ΄ 2022. 10. 6. 14:29
728x90
λ°˜μ‘ν˜•

221006 μž‘μ„±

<λ³Έ λΈ”λ‘œκ·ΈλŠ” TIMEGATE λ‹˜μ˜ slideshareλ₯Ό μ°Έκ³ ν•΄μ„œ κ³΅λΆ€ν•˜λ©° μž‘μ„±ν•˜μ˜€μŠ΅λ‹ˆλ‹€>

https://www.slideshare.net/TIMEGATE07/ss-107535554?qid=8c8308a7-93db-4a99-ba96-2dfa84bfaf2c&v=&b=&from_search=10 

 

μ‹œκ³„μ—΄λΆ„μ„μ˜ 이해

μ£Όκ°€, νŒλ§€λŸ‰, μ‚¬μš©λŸ‰ λ“± μ‹œκ°„μ— λ”°λ₯Έ λ³€ν™”κ°€ μžˆλŠ” λ°μ΄ν„°μ˜ μΆ”μ„Έ, μ •κ·œμ„±, λ‚˜λ¨Έμ§€μ˜ κ°œλ…μ„ μ •λ¦¬ν–ˆμŠ΅λ‹ˆλ‹€. 그리고, 이λ₯Ό ν™œμš©ν•œ 예츑과 μ΄μƒμΉ˜ 감지 방법을 μ†Œκ°œν•©λ‹ˆλ‹€.

www.slideshare.net

 

 

 

πŸ‡ μ‹œκ³„μ—΄ 데이터 λΆ„ν•΄

🟣 μΆ”μ„Έ (trend) λΆ„ν•΄

- Lowess/Loess νšŒκ·€

: νŠΉμ • λ²”μœ„μ— μ λ‹Ήν•œ λ‹€ν•­ νšŒκ·€μ„ λ“€μ„ κ΅¬ν•˜μ—¬ 병합

: λ‹€μ†Œ νˆ¬λ°•ν•œ μΆ”μ„Έμ„  : νšŒκ·€λ²”μœ„μ— 따라 달라짐

 

- 이동 평균

: νŠΉμ • κΈ°κ°„ λ™μ•ˆμ˜ κ°’μ˜ 평균 λ³€ν™”

: λΆ€λ“œλŸ¬μš΄ 좔세에 적용 κ°€λŠ₯

: μ‘°λ°€ν•œ μΆ”μ„Έμ„ 

 

- Loess λ°©λ²•μœΌλ‘œ 1μ°¨ μΆ”μ„Έ 뢄석 ν›„, 이동평균 μˆ˜ν–‰

 

🟣 주기적 변동뢄 (seasonal)

: λ”ν•˜κΈ° 방식

 

🟣 λ‚˜λ¨Έμ§€ (remainder)

: λ”ν•˜κΈ° 방식

: κ³±ν•˜κΈ° 방식

 

 

🟣 주기적 변동뢄 (seasonal)

: κ³±ν•˜κΈ° 방식

 

 

πŸ‡ 정적 (Stationary) 데이터

: 평균, λΆ„μ‚° λ“± 톡계적 νŠΉμ„±μ΄ λ³€ν•˜μ§€ μ•ŠλŠ” 데이터

 

1) λšœλ ·ν•œ μΆ”μ„Έκ°€ μ—†λ‹€

2) μ‹œκ°„μ΄ μ§€λ‚˜λ„ 뢄포도(λΆ„μ‚°)의 λ³€ν™”κ°€ μ—†λ‹€

 

βœ” 이동 평균 λͺ¨λΈ(Moving Average Mode) - ACF 검사

: μžκΈ°μƒκ΄€μ„± 검사

βœ” μžκ°€ νšŒκ·€ λͺ¨λΈ (Auto Regression Model)

: ν˜„μž¬κ°’μ΄ 이전값과 μ•½κ°„ 차이가 λ‚œλ‹€λŠ” κ°€μ •

βœ” μžκ°€ νšŒκ·€ λͺ¨λΈ (Auto Regression Model) - PACF 검사

: μžκ°€ νšŒκ·€μ„± 검사 - pacf()

βœ” μžκ°€ νšŒκ·€ 이동평균 λͺ¨λΈ (Auto Regression Moving Average Mode)

: 이동평균 λͺ¨λΈ(MA)와 μžκ°€νšŒκ·€(AR) λͺ¨λΈ μ—°κ²°

 

 

πŸ‡ λΉ„정적 (Non - Stationary) 데이터

: λ°μ΄ν„°μ˜ 톡계적 νŠΉμ„±μ΄ μ‹œκ°„μ— 따라 λ³€ν™”ν•˜λŠ” 경우

: 비정적 데이터λ₯Ό 정적 λ°μ΄ν„°λ‘œ λ³€ν™˜ 방법

 

1) 차이값 (diff)

: 이전 λ°μ΄ν„°μ™€μ˜ 차이값

: (1μ°¨ λ―ΈλΆ„) = X(t) - X(t-1)

: 차이값은 λ°μ΄ν„°μ˜ 차수λ₯Ό 쀄여 정적에 κ°€κΉκ²Œ ν•œλ‹€

 

2) 둜그 (log)

: 데이터에 log 취함

: λ°μ΄ν„°μ˜ 진폭이 μ‹œκ°„μ— 따라 데이터 λŒ€μƒ

: λ‘œκ·ΈλŠ” 곱을 ν•©μœΌλ‘œ λ³€ν™˜ -> λΆ„μ‚°μ˜ 증가 μ–΅μ œ

: 둜그 λ³€ν™˜μ€ 뢄산을 쀄여 정적에 κ°€κΉκ²Œ 함

 

=> ARIMA λͺ¨λΈ : AR + MA λͺ¨λΈμ— 차이값을 μΆ”κ°€ν•œ λͺ¨λΈ

βž• ARIMA 

: λ°μ΄ν„°μ˜ 차이값이 λ§Œλ“œλŠ” μ‹œκ³„μ—΄μ΄ MA(Moving Average) or AR(Auto-Regression) λͺ¨λΈμ— 적합

: MA의 μ°¨μˆ˜λŠ” ACF(Auto-Coreelation Function)

: AR의 μ°¨μˆ˜λŠ” PACF(Partial ACF)

 

 

728x90
λ°˜μ‘ν˜•
Comments