😎 κ³΅λΆ€ν•˜λŠ” μ§•μ§•μ•ŒνŒŒμΉ΄λŠ” μ²˜μŒμ΄μ§€?

μ‹œκ³„μ—΄ 데이터(Serial data) μ „μ²˜λ¦¬ ν•˜κΈ° (1) λ³Έλ¬Έ

πŸ‘©‍πŸ’» 인곡지λŠ₯ (ML & DL)/Serial Data

μ‹œκ³„μ—΄ 데이터(Serial data) μ „μ²˜λ¦¬ ν•˜κΈ° (1)

μ§•μ§•μ•ŒνŒŒμΉ΄ 2022. 9. 27. 13:21
728x90
λ°˜μ‘ν˜•

220927 μž‘μ„±

<λ³Έ λΈ”λ‘œκ·ΈλŠ” today-1λ‹˜μ˜ λΈ”λ‘œκ·Έλ₯Ό μ°Έκ³ ν•΄μ„œ κ³΅λΆ€ν•˜λ©° μž‘μ„±ν•˜μ˜€μŠ΅λ‹ˆλ‹€ :-) >

https://today-1.tistory.com/29?category=886697 

 

μ‹œκ³„μ—΄ 데이터 μ „μ²˜λ¦¬1

μ‹œκ³„μ—΄ λ°μ΄ν„°νŒ¨ν„΄ : μ‹œκ³„μ—΄ 데이터 뢄석에 μžˆμ–΄ νŒŒμƒλ³€μˆ˜λ₯Ό λ§Œλ“œλŠ” 것은 κ°€μž₯ μ€‘μš”ν•˜κ³  μ‹œκ°„μ΄ 많이 κ±Έλ¦¬λŠ” μž‘μ—… : λ³€μˆ˜ μƒμ„±μ‹œ μ£Όμ˜ν•΄μ•Ό ν•  2가지 미래의 μ‹€μ œ 쒅속 λ³€μˆ˜ μ˜ˆμΈ‘κ°’μ΄ μ–΄λ–€ 독립/

today-1.tistory.com

 

 

1️⃣ μ‹œκ³„μ—΄ λ°μ΄ν„°νŒ¨ν„΄ μΆ”μΆœ

λΉˆλ„(Frequncy) : κ³„μ ˆμ„± νŒ¨ν„΄(Seasonality)이 λ‚˜νƒ€λ‚˜κΈ° μ „κΉŒμ§€ μ‚¬λžŒμ΄ μ •μ˜

μΆ”μ„Έ(Trend) : μ‹œκ³„열이 μ‹œκ°„에 λ”°λΌ μ¦κ°€, κ°μ†Œ λ˜λŠ” μΌμ • μˆ˜μ€€μ„ μœ μ§€ν•˜λŠ” κ²½μš°

κ³„μ ˆμ„±(Seasonaliy) : μΌμ •ν•œ λΉˆλ„λ‘œ μ£ΌκΈ°μ μœΌλ‘œ λ°˜λ³΅λ˜λŠ” νŒ¨ν„΄

μ£ΌκΈ°(Cycle) : μΌμ •ν•˜μ§€ μ•Šμ€ λΉˆλ„λ‘œ λ°œμƒν•˜λŠ” νŒ¨ν„΄

 

 

 

2️⃣ μ‹œκ³„μ—΄ 데이터 뢄리

https://modern-manual.tistory.com/19

Training set : Validation set : Test sets = 60 : 20 : 20

Training set (ν›ˆλ ¨ 데이터)

: λͺ¨λΈμ„ ν•™μŠ΅ν•˜λŠ”λ° μ‚¬μš©

 

Validation set(κ²€μ • 데이터)

: training set으둜 λ§Œλ“€μ–΄μ§„ λͺ¨λΈμ˜ μ„±λŠ₯을 μΈ‘μ •ν•˜κΈ° μœ„ν•΄ μ‚¬μš©

: 일반적으둜 μ–΄λ–€ λͺ¨λΈμ΄ κ°€μž₯ 데이터에 μ ν•©ν•œμ§€ μ°Ύμ•„λ‚΄κΈ° μœ„ν•΄μ„œ λ‹€μ–‘ν•œ νŒŒλΌλ―Έν„°μ™€ λͺ¨λΈμ„ μ‚¬μš©ν•΄λ³΄κ²Œ 되며, κ·Έ 쀑 validation set으둜 κ°€μž₯ μ„±λŠ₯이 μ’‹μ•˜λ˜ λͺ¨λΈμ„ 선택

 

Test set(ν…ŒμŠ€νŠΈ 데이터)

: validation set으둜 μ‚¬μš©ν•  λͺ¨λΈμ΄ κ²°μ • 된 ν›„, λ§ˆμ§€λ§‰μœΌλ‘œ λ”± ν•œλ²ˆ ν•΄λ‹Ή λͺ¨λΈμ˜ μ˜ˆμƒλ˜λŠ” μ„±λŠ₯을 μΈ‘μ •ν•˜κΈ° μœ„ν•΄ μ‚¬μš©

: 이미 validation set은 μ—¬λŸ¬ λͺ¨λΈμ— 반볡적으둜 μ‚¬μš©λ˜μ—ˆκ³  그쀑 운 μ’‹κ²Œ μ„±λŠ₯이 보닀 더 λ›°μ–΄λ‚œ κ²ƒμœΌλ‘œ μΈ‘μ •λ˜μ–΄ λͺ¨λΈμ΄ μ„ νƒλ˜μ—ˆμ„ κ°€λŠ₯성이 있음

: λ•Œλ¬Έμ— μ΄λŸ¬ν•œ 였차λ₯Ό 쀄이기 μœ„ν•΄ ν•œ λ²ˆλ„ μ‚¬μš©ν•΄λ³Έ 적 μ—†λŠ” test set을 μ‚¬μš©ν•˜μ—¬ μ΅œμ’… λͺ¨λΈμ˜ μ„±λŠ₯을 μΈ‘μ •

https://modern-manual.tistory.com/19

 

μ‹œκ³„μ—΄ 데이터 μ€€λΉ„(μ‹œκ°„ 차원을 보쑴, λ‚ μ§œλ₯Ό μ •ν•˜λŠ”κ²Œ κ°€μž₯ 핡심)

  • ν›ˆλ ¨ 데이터(Train set) : κ°€μž₯ 였래된 데이터
  • 검증 데이터(Validation set) : κ·Έ λ‹€μŒ 졜근 데이터
  • ν…ŒμŠ€νŠΈ 데이터(Test set) : κ°€μž₯ μ΅œμ‹ μ˜ 데이터

 

 

728x90
λ°˜μ‘ν˜•
Comments